Pandas에서 여러 컬럼 선택하기Title
DataFrame이란?
Pandas 라이브러리는 데이터 분석과 처리를 쉽게 해주는 파이썬 라이브러리입니다. 여기서 중요한 개념 중 하나는 DataFrame입니다. DataFrame이란, 엑셀 스프레드시트와 같은 2차원 테이블을 의미합니다. 각 컬럼은 다른 타입의 데이터(문자열, 숫자 등)를 가질 수 있습니다.
여러 컬럼 선택 방법
DataFrame에서 여러 컬럼을 선택하려면 여러 방법이 있습니다. 각 방법은 상황과 필요에 따라 적합할 수 있습니다.
loc와 iloc 사용하기
loc
와 iloc
메소드를 사용하면 특정 행과 열을 선택할 수 있습니다. loc
은 레이블을 기반으로, iloc
은 숫자 인덱스를 기반으로 작동합니다.
1
2
3
4
5
# loc 사용 예
selected_columns = df.loc[:, ['column1', 'column2']]
# iloc 사용 예
selected_columns = df.iloc[:, [0, 1]]
직접 컬럼 이름 사용하기
DataFrame의 컬럼 이름을 직접 사용해 선택할 수도 있습니다. 이 방법은 가장 직관적입니다.
1
selected_columns = df[['column1', 'column2']]
filter 메소드 사용하기
filter
메소드를 사용하면 컬럼 이름에 특정 문자열이 포함된 컬럼을 선택할 수 있습니다.
1
selected_columns = df.filter(like='col')
선택한 컬럼으로 새 DataFrame 생성하기
위의 어떤 방법으로든 여러 컬럼을 선택한 후, 그 결과를 새로운 DataFrame으로 저장할 수 있습니다.
1
new_df = df[['column1', 'column2']]
주의사항
여러 컬럼을 선택할 때, 컬럼 이름을 잘못 입력하면 KeyError
가 발생합니다. 따라서 컬럼 이름을 정확하게 확인해야 합니다.
마무리
Pandas DataFrame에서 여러 컬럼을 선택하는 방법은 다양하고, 상황에 따라 적절한 방법을 선택할 수 있습니다. 코드의 가독성과 유지 관리를 고려하여 적절한 방법을 선택하는 것이 중요합니다.
이 기사는 저작권자의 CC BY 4.0 라이센스를 따릅니다.