Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Euler
- Ipython
- 우분투
- Hash function
- django framework
- Python
- KTNF
- FNCP
- 국산 네트워크
- 피보나치 수
- 파이썬
- 문자열
- Python3
- data structure
- Hash Table
- ubuntu
- 주피터
- virtualenv
- 다이나믹 프로그래밍
- linked list
- Django
- 프로젝트 오일러
- virtualenvwrapper
- 아나콘다
- project euler
- 백준 알고리즘
- Anaconda
- jupyter
- 파이썬3
- IO Visor
Archives
- Today
- Total
목록DataSet (1)
태코놀로지
IPython Notebook에서 데이터 집합 다루기
3.1 Exploring a dataset in the Notebook실습을 위해서 사용할 데이터는 약 18GB에 달하는 데이터의 일부를 추출해서 작게 만든 약 200MB의 csv 타입의 파일이다. 해당 파일을 마이크로소프트 엑셀을 이용해서 확인해보면 아래와 같이 뉴욕시 택시 운영에 대한 다양한 정보를 확인할 수 있다. nyc_data와 nyc_fare 두 가지 파일이 있으며, 그 중 nyc_data는 약 150MB의 크기로 850,000의 행을 지닌 데이터로 아래의 그림과 같이 데이터 집합이 구성되어 있다. 이 정도 양의 데이터를 사용하면 연산 결과를 가시적으로 확인하기에 충분하다. 이 밖에도 국내 정부에서 제공하는 공공데이터도 다양하다. 공공데이터 포탈에서 확인해보면, 약 20,000개의 공공 데이터..
Python3/EECS-WinterSchool
2017. 1. 29. 15:08