Pandas(판다스) 란?
파이썬의 라이브러리이다.
사용 목적은 방대한 행렬, 엑셀자료, CSV자료를 가지고 데이터베이스(DB)작업을 하기 위함이다.
딕셔너리와 유사한 시리즈(Series), 거대한 표인 데이터프레임(DataFrame) 을 가지고 강력한 연산작업을 할 수 있게 해주는 라이브러리이다.
pandas를 사용하려면 아래의 코드를 가장 먼저 입력해 주어야 한다.
import pandas as pd
1. Series (시리즈) : 특수한 딕셔너리, key 값을 인덱스로 사용할 수 있다.
#Dictionary(딕셔너리) = {'key': 'value', 'key2':'value2' ....}
key 값과 value 값이 있다.
이 딕셔너리를 그대로 가져와서 key값을 index로 사용한다고 생각하면 Series(시리즈) 가 된다.
1-2) Series(시리즈) 정의하기
- 인덱스를 따로 명시하지 않으면 일반적인 인덱스로 0부터 카운트 된다.
- 인덱스를 따로 명시하면 그대로 입력된다, 문자열로도 인덱스를 지정 가능하다.
import pandas as pd
#인덱스 미지정
data = pd.Series(['a','b','c','d'])
# 결과
0 a
1 b
2 c
3 d
dtype: object
print(data[1]) # 결과 : b
#인덱스 지정
data2 = pd.Series(['a','b','c','d'], index = [1,2,3,4])
#결과
1 a
2 b
3 c
4 d
dtype: object
print(data2[1]) # 결과 : a
1-3) 딕셔너리를 Series(시리즈)로 가져오기
- 딕셔너리의 Key 값이 Index로 들어간다.
- index로 명시된 문자열로 불러올 수 도 있고, 일반적인 카운팅 index도 사용 할 수있다
import pandas as pd
my_dict = {'RED':'#FF0000', 'GRN':'#40FF00', 'BLU':'#0404B4', 'PPL': '#8904B1'}
my_Series = pd.Series(my_dict)
# 결과
RED #FF0000
GRN #40FF00
BLU #0404B4
PPL #8904B1
dtype: object
print(my_Series[0]) # 결과: #FF0000
print(my_Series['RED']) # 결과 : #FF0000
'programming' 카테고리의 다른 글
[Python] 파이썬 파일 다루기 / 파일 저장하기 / 파일 읽기 (0) | 2021.12.13 |
---|---|
[Python] 파이썬 pandas(판다스)를 활용하여 DataFrame(데이터프레임) 만들기 (0) | 2021.12.13 |
[Python] 파이썬 Numpy(넘파이) 배열 마스킹 (0) | 2021.12.11 |
[Python] 파이썬 Numpy(넘파이)로 생성한 배열의 특징과 관련 함수/메서드 (0) | 2021.12.11 |
[Python] 파이썬 넘파이(Numpy)를 활용하여 난수 배열 만들기 (0) | 2021.12.10 |