포스트

데이터프레임 열 순서 변경하기 Python Pandas 활용법

소개

Python의 Pandas 라이브러리를 사용하다보면, 때로는 데이터프레임의 열(column) 순서를 변경해야 할 상황이 발생합니다. 이럴 때 적용할 수 있는 여러 방법들이 있습니다. 이 글에서는 그 중 가장 널리 사용되는 몇 가지 방법에 대해 자세히 설명하겠습니다.

reindex 사용하기

reindex 메서드를 사용하면 열 순서를 원하는 대로 변경할 수 있습니다. 이 메서드는 새로운 인덱스를 할당할 때 사용되며, 여기서는 열 이름을 새로운 순서로 나열해주면 됩니다.

1
2
3
4
5
import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
new_order = ['C', 'B', 'A']
df = df.reindex(columns=new_order)

열 위치 직접 지정하기

iloc을 사용하면 열의 순서를 수치적으로 바로 지정할 수 있습니다. 이 방법은 숫자로 열 위치를 지정하기 때문에, 열 이름을 알 필요가 없습니다.

1
df = df.iloc[:, [2, 1, 0]]

여러 방법의 차이점

  • reindex는 열 이름을 명시적으로 지정해야 하므로, 이름이 변경되면 코드도 수정해야 합니다.
  • iloc은 숫자로 위치를 지정하므로, 데이터프레임 구조가 변경되면 원하지 않는 결과를 얻을 수 있습니다.

주의할 점

이 방법들은 모두 원래 데이터프레임을 변경하지 않고 새로운 데이터프레임을 반환합니다. 따라서, 변경된 데이터프레임을 따로 저장해야 합니다.

정리

Pandas 라이브러리에서는 reindexiloc 메서드를 사용하여 데이터프레임의 열 순서를 쉽게 변경할 수 있습니다. 어떤 방법이 더 적합한지는 작업의 세부 사항과 개인의 취향에 따라 다릅니다. 이 글을 통해 여러분도 이제 Python Pandas로 열 순서를 자유자재로 바꿀 수 있게 되셨을 것입니다.

이 기사는 저작권자의 CC BY 4.0 라이센스를 따릅니다.