데이터 다루기/Python
[Python] Array 정렬 (Sorting)
분석벌레
2023. 3. 16. 13:34
728x90
반응형
이번 포스팅에서는 Python에서 Numpy Array (배열)에 대해서 정렬을 배워보도록 하겠습니다.
import numpy as np
가장 먼저 numpy 패키지는 import 하였습니다.
def selection_sort(x):
for i in range(len(x)):
swap = i + np.argmin(x[i:])
(x[i], x[swap]) = (x[swap], x[i])
return x
우리는 기본적으로 선택 정렬 알고리즘을 Hard Coding하여 구현할 수 있습니다.
x = np.array([3,9,7,2,6])
selection_sort(x)
array([2, 3, 6, 7, 9])
실제로 실행 결과를 보시면, Input으로 들어간 배열이 정렬되어 나타나는 것을 확인할 수 있습니다.
하지만 선택 정렬을 배워본 사람은 알테지만, 해당 알고리즘은 O(N)의 계산 과정을 가지기 때문에, 배열의 길이가 매우 클 경우에는 적합한 방법은 아니다.
Numpy 패키지에서는 자체적으로 Sorting 함수를 제공한다. 이 때, 기본적인 알고리즘은 퀵 정렬을 사용한다.
np.sort(x)
array([2, 3, 6, 7, 9])
이 처럼 np.sort 함수 안에 정렬하고자 하는 배열을 넣어주면, 원하는 결과가 출력되는 것을 확인할 수 있다.
x.sort()
x
array([2, 3, 6, 7, 9])
x 자체에 sort 함수를 사용해주면, 정렬된 결과가 x에 저장된다.
지금까지는 1차원 배열에 대해서 정렬을 배워보았습니다.
그렇다면 2차원 이상의 배열에 대해서는 어떻게 정렬을 할까요??
rand = np.random.RandomState(42)
X = rand.randint(0, 10, (4,6))
print(X)
[[6 3 7 4 6 9]
[2 6 7 4 3 7]
[7 2 5 4 1 7]
[5 1 4 0 9 5]]
(4,6)의 사이즈를 가지는 랜덤한 배열을 생성하였습니다.
np.sort(X, axis = 0)
array([[2, 1, 4, 0, 1, 5],
[5, 2, 5, 4, 3, 7],
[6, 3, 7, 4, 6, 7],
[7, 6, 7, 4, 9, 9]])
np.sort에 axis 파라미터를 활용하면, 특정 축을 기준으로 정렬을 할 수 있습니다.
axis = 0 인 경우 세로축을 기준으로 정렬이 됩니다.
np.sort(X, axis = 1)
array([[3, 4, 6, 6, 7, 9],
[2, 3, 4, 6, 7, 7],
[1, 2, 4, 5, 7, 7],
[0, 1, 4, 5, 5, 9]])
반면에 axis = 1 의 파라미터를 주면 가로축을 기준으로 정렬이 됩니다.
반응형