0. 정의
데이터를 다루는데 사용되는 패키지. 매우 높은 속도로 데이터를 분석할 수 있으며, 이를 이용하여 csv파일 또는 데이터베이스로부터 데이터를 쉽게 읽고 쓸 수 있음
데이터를 조작하고 새로운 칼럼 생성
주요 자료구조로는 DataFrame, Series 가 있다.
먼저 pandas와 numpy를 import
1. Series
value와 index의 형태를 지니는 1차원 구조. Value의 값을 나타내는것을 Series라 표현
2. DataFrame
인덱스(행)와 라벵(열, 칼럼)으로 구분
1) 출력
● df.index - DataFrame의 Index를 표시
● df.colums - DataFrame의 column을 표시
● df.ix[a] - DataFrame의 Index 값에서 'a'에 해당하는 값을 출력
numbers 111
Name: a, dtype: int64
2) 추가
● df['칼럼명'] = (값1, 값2, 값3, 값4)
- 추가할 때 인덱스의 수를 맞춰야 한다.
● df[칼럼명] = pd.DataFrame([넣을값1, 넣을값2, 넣을값3, 넣을값4], index = [값1, 값2, 값3, 값4]
● join
'언어 배우기 > Python' 카테고리의 다른 글
Python - print문에서 의도치 않은 공백 제거 (0) | 2021.07.23 |
---|---|
Python - MySQL연결 (0) | 2021.07.19 |
Python - 가상환경 설정 (0) | 2021.07.15 |
Anaconda 보안해제 (0) | 2021.07.15 |
Python - Class (0) | 2021.07.15 |