목록Python활용 빅데이터전문가과정 (7)
Super Coding Addict
- 딕셔너리는 키-값으로 구성되어 있기 때문에, 값을 가져올 때 인덱스가 아닌 키가 필요함을 주의! - 딕셔너리에서 키-값 쌍을 반복문으로 가져오기 --> 딕셔너리 자료구조를 반복문으로 돌리면 키를 가져오므로, 이를 사용하여 값을 다시 가져와야 한다. data = { "빠삐코" : 300, "죠스바" : 450, "아맛나" : 430, "스크류바" : 520, "더위사냥" : 700 } #반복문을 사용해서 data 딕셔너리에 있는 key와 value를 리스트에 각각 저장하라. 아이스크림명 = [] 가격 = [] for key in data: 아이스크림명.append(key) 가격.append(data[key]) print(아이스크림명) #결과 : ['빠삐코', '죠스바', '아맛..
*** 앞전에는 정리를 차곡차곡 해왔는데, 생각보다 복습시간이 너무 길어져서 기본개념과 헷갈렸거나 꼭 짚고가고싶은 예제 위주로 코드를 정리해본다. * 데이터 타입 - 숫자 / 문자 * 변수 - 값보다는 의미있는 단어를 기억하기 쉽기 때문에 * 자료구조 - 여러 개의 데이터를 관리하기 쉽게하기 위해서 - 메서드 / 함수 * Boolean 데이터 타입 - 참과 거짓을 표현하는 자료형 - True / False * 조건문 [1] - if 조건 : print("실행") --> 들여쓰기 : IF문에 영향받는 코드의 범위를 정의함 print(1) #일반코드 -> 출력 if True: print(2) #True이므로 출력 if False: p..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/YqKYw/btqS1VTN75O/wLHtQnpkvsk9LlAQpZxf10/img.png)
* 아나콘다 설치 - 64bit : 데이터 분석이 목적 - 32bit : 유가증권시장에서 자동트레이딩이 목적일 때 등 * 1GB = 1024MB = 1024*1024KB = 1024*1024*1024B = 8*1024*1024*1024bits * 하드디스크와 메모리 - 하드디스크 : 저장장치 [비휘발성] - 메모리 : 임시저장소 [휘발성] * 데이터 타입 - 문자, 숫자(정수/실수) - 숫자연산 : +, -, *(곱하기), /(나누기), //(몫), %(나머지), **(제곱) - 문자열은 "" 또는 '' 안에 넣어준다. 두 종류의 따옴표를 사용하는 이유는, 문장 중간에 " 또는 '가 들어갔을 때 이를 문자열이 끝나는 지점이 아닌, 문자열에 포함되는 문자임을 표현하기 위해서이다. ex) "I'm a boy..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/cmBGCn/btqS6XJloZJ/3RtgTv3jqWGRRlHZf07tyk/img.png)
* JOIN - 같은 데이터베이스 내에서만 가능, 여러 개의 테이블에서 데이터를 모아 보여줄 때 사용 - INNER JOIN : 공통되는 부분 출력-> 1,2 출력 - LEFT JOIN : 1,2,3 출력 - RIGHT JOIN : 1,2,4,5출력 - OUTER JOIN : UNION을 이용해서 할 수 있음 (LEFT JOIN 결과 UNION RIGHT JOIN 결과) : 모든 데이터를 결과로 출력 ->1,2,3,4,5 출력 * Sub-Query - 대부분의 쿼리문 안에 들어갈 수 있음 - 쿼리문의 효율성 예제 Case 1. select city.countrycode, country.name as country_name , city.name as city_name, city.population from..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/cQdpPw/btqSTIObyrQ/7VKlbDpDtk9OSTymE9ACK1/img.png)
* 새로운 언어 공부방법 - 내가 끝까지 읽을 수 있는 입문서를 한 권 뗀다 - 레퍼런스 참조 (API) - 그 언어로 게시판 정도 하나 만들어보기 * 데이터타입 - 컴퓨터 자원을 효율적으로 사용하기 위함(하드디스크 자원 절약), 검색시 검색속도도 물리적으로 빨라진다 - 숫자형 : 정수 타입(integer types) //TINYINT : 1byte(8bit) , -128~127(signed) or 0~255(unsigned) ex)몸무게 :실수 형(float types) //FLOAT(4byte) : 정수부+실수부 6자리 //DOUBLE(8byte) : 정수부+실수부 17자리 - 문자형 : CHAR(~255자까지) //고정적인 저장공간 사용 : VARCHAR (variable character) //가..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/OxkYQ/btqSGjfi13q/YGbX4k7wtDtSaKVMjGk8DK/img.png)
* CRUD (Create, Read, Update, Delete) [ Database ] * About Database - DB vs. DBMS : DB는 데이터를 통합하여 관리하는 데이터의 집합 자체 : DBMS는 가공되지 않은 굉장히 많은 정보들을 효율적으로 원하는 정보만 가지고 올 수 있게 해주는 미들웨어 시스템 : 액셀의 행과 열인 시트는 DB의 테이블 * RDBMS - Relational ~ : 데이터 테이블 사이에 키값으로 관계 O --> 따라서 시스템이 복잡 ===> 미리 데이터의 모양을 지정, 따라서 데이터를 가져올 때 빠르다! - Oracle, Mysql, .... * NoSQL - 데이터 테이블 사이에 관계 X --> 복잡성은 줄고, 많은 데이터 저장 가능 ===> 모양이 없어 데이터..