본문 바로가기

언어 배우기/Python

Python - Pandas(판다스)

0. 정의

데이터를 다루는데 사용되는 패키지. 매우 높은 속도로 데이터를 분석할 수 있으며, 이를 이용하여 csv파일 또는 데이터베이스로부터 데이터를 쉽게 읽고 쓸 수 있음

데이터를 조작하고 새로운 칼럼 생성

주요 자료구조로는 DataFrame, Series 가 있다.

 

먼저 pandas와 numpy를 import

pandas는 pd에, numpy는 np에

1. Series

value와 index의 형태를 지니는 1차원 구조. Value의 값을 나타내는것을 Series라 표현

2. DataFrame

인덱스(행)와 라벵(열, 칼럼)으로 구분

1) 출력

● df.index - DataFrame의 Index를 표시

● df.colums - DataFrame의 column을 표시

● df.ix[a] - DataFrame의 Index 값에서 'a'에 해당하는 값을 출력 

numbers 111

Name: a, dtype: int64

 

2) 추가

● df['칼럼명'] = (값1, 값2, 값3, 값4) 

- 추가할 때 인덱스의 수를 맞춰야 한다.

● df[칼럼명] = pd.DataFrame([넣을값1, 넣을값2, 넣을값3, 넣을값4], index = [값1, 값2, 값3, 값4]

pandas에서 값이 없는 자료는 NaN(Not a Number)이라 표시

● join

 

 

'언어 배우기 > Python' 카테고리의 다른 글

Python - print문에서 의도치 않은 공백 제거  (0) 2021.07.23
Python - MySQL연결  (0) 2021.07.19
Python - 가상환경 설정  (0) 2021.07.15
Anaconda 보안해제  (0) 2021.07.15
Python - Class  (0) 2021.07.15