본문 바로가기

programming

[Python] Numpy 라이브러리로 대용량 배열 데이터 만들기

배열(Array)이란?

같은 타입의 변수들로 이루어진 유한 집합

배열을 구성하는 각각의 값을 배열요소(element)라고 하며, 배열에서 위치를 가리키는 숫자는 인덱스(index)라고 한다.

 

파이썬에서 리스트의 확장판이라고 생각하면 쉽다.

1차원의 리스트를 N차원까지 확대한 것이 배열이다.

하지만 현실세계에서는 대용량의 리스트가 존재하며, 이를 다룰 때에는 Numpy 라이브러리를 사용하는 것이 아주 강력하다.

 

Numpy : 고성능의 수치 계산을 위해 만들어진 라이브러리

 

numpy 라이브러리를 사용할 때는 다음과 같이 라이브러리를 사용하겠다고 명시&입력을 해주어야 관련된 클래스나 함수를 가져다 쓸 수 있다.

 

import numpy as np

 

1) 배열만들기

1차원 배열 = 리스트와 비교를 해보았다.

한가지 차이점은 리스트는 원소들의 데이터타입이 서로 달라도 가능하지만, 배열은 모두 같아야만 한다.

list(range(5))
# 결과 : [0, 1, 2, 3, 4]

np.array([0,1,2,3,4,5])
# 결과 : [0 1 2 3 4 5]

np.arange(5)
# 결과 : [0 1 2 3 4 5]

2) 여러가지 배열 만들기 함수

ㅇ 이차원 배열 만들기 : 원하는 모양대로 하나의 원소를 리스트로 만들어서 np.array()안에 입력하면 된다.

import numpy as np
my_array = np.array([[1,2],
                      [3,4]])
# 결과 :
[[1 2]
 [3 4]]
 

ㅇ 배열의 데이터 타입 결정하기, 데이터타입 확인하기, 데이터 타입 바꾸기

my_array = np.array([1,2,3,4,5], dtype = float)
# 결과 : my_array = [1., 2., 3., 4., 5.]
my_array.dtype 
# 결과 : dtype('float64')
my_array.astype('int')
# 결과 : my_array = [1,2,3,4,5]

 

 

ㅇ 여러가지 배열 만들기 :

 배열요소가 비어있는 배열 만들기, 초기화가 없는 값으로 배열을 반환 np.empty

 0으로 채워진 배열 만들기 np.zeros()

 1로 채워진 배열 만들기 np.ones()

 np.arange(시작값, 끝값, 간격)

 np.linspace(시작값, 끝값, 등분)

 

arr_empty = np.empty
# 결과 : <built-in function empty>
arr_0 = np.zeros(5)
# 결과 : [0. 0. 0. 0. 0.]
arr_1 = np.ones((3,5), dtype = int)
# 결과 : 
[[1 1 1 1 1]
 [1 1 1 1 1]
 [1 1 1 1 1]]
arr_2 = np.arange(0,10,2)
# 결과 : [0 2 4 6 8]
arr_3 = np.linspace(0,1,5)
# 결과 : [0.   0.25 0.5  0.75 1.  ]

 

3. 리스트를 받아서 배열로 만들기

np.array(리스트명) 으로 바로 배열로 만들 수 있다.

리스트를 바로 사용하지 않고 배열로 바꾸는 이유는 numpy의 강력한 연산과 데이터 처리 기능을 사용하기 위해서 이다.

받는 리스트의 크기가 클 수록 반드시 선행되어야 하는 작업이다.

 

my_list = [1,2,3,4,5]
my_array = np.array(my_list)
# 결과 : my_array = [1 2 3 4 5]