본문 바로가기

programming

[Python] 파이썬 Pandas(판다스) 활용하여 시리즈(Series) 만들기

Pandas(판다스) 란?

 

파이썬의 라이브러리이다.

사용 목적은 방대한 행렬, 엑셀자료, CSV자료를 가지고 데이터베이스(DB)작업을 하기 위함이다.

딕셔너리와 유사한 시리즈(Series), 거대한 표인 데이터프레임(DataFrame) 을 가지고 강력한 연산작업을 할 수 있게 해주는 라이브러리이다.

 

 

pandas를 사용하려면 아래의 코드를 가장 먼저 입력해 주어야 한다.

import pandas as pd
 

 

 

1. Series (시리즈) : 특수한 딕셔너리, key 값을 인덱스로 사용할 수 있다.

#Dictionary(딕셔너리) = {'key': 'value', 'key2':'value2' ....}

key 값과 value 값이 있다.

 

이 딕셔너리를 그대로 가져와서 key값을 index로 사용한다고 생각하면 Series(시리즈) 가 된다.

 

 

1-2) Series(시리즈) 정의하기

 - 인덱스를 따로 명시하지 않으면 일반적인 인덱스로 0부터 카운트 된다.

 - 인덱스를 따로 명시하면 그대로 입력된다, 문자열로도 인덱스를 지정 가능하다.

import pandas as pd

#인덱스 미지정
data = pd.Series(['a','b','c','d'])
# 결과
0    a
1    b
2    c
3    d
dtype: object

print(data[1]) # 결과 : b


#인덱스 지정    
data2 = pd.Series(['a','b','c','d'], index = [1,2,3,4])

#결과
1    a
2    b
3    c
4    d
dtype: object

print(data2[1]) # 결과 : a
 

 

1-3) 딕셔너리를 Series(시리즈)로 가져오기

 - 딕셔너리의 Key 값이 Index로 들어간다.

 - index로 명시된 문자열로 불러올 수 도 있고, 일반적인 카운팅 index도 사용 할 수있다

 

import pandas as pd 

my_dict = {'RED':'#FF0000', 'GRN':'#40FF00', 'BLU':'#0404B4', 'PPL': '#8904B1'}

my_Series = pd.Series(my_dict) 
# 결과
RED    #FF0000
GRN    #40FF00
BLU    #0404B4
PPL    #8904B1
dtype: object

print(my_Series[0]) # 결과: #FF0000
print(my_Series['RED']) # 결과 : #FF0000