포스트

Pandas에서 여러 컬럼 선택하기Title

DataFrame이란?

Pandas 라이브러리는 데이터 분석과 처리를 쉽게 해주는 파이썬 라이브러리입니다. 여기서 중요한 개념 중 하나는 DataFrame입니다. DataFrame이란, 엑셀 스프레드시트와 같은 2차원 테이블을 의미합니다. 각 컬럼은 다른 타입의 데이터(문자열, 숫자 등)를 가질 수 있습니다.

여러 컬럼 선택 방법

DataFrame에서 여러 컬럼을 선택하려면 여러 방법이 있습니다. 각 방법은 상황과 필요에 따라 적합할 수 있습니다.

loc와 iloc 사용하기

lociloc 메소드를 사용하면 특정 행과 열을 선택할 수 있습니다. loc은 레이블을 기반으로, iloc은 숫자 인덱스를 기반으로 작동합니다.

1
2
3
4
5
# loc 사용 예
selected_columns = df.loc[:, ['column1', 'column2']]

# iloc 사용 예
selected_columns = df.iloc[:, [0, 1]]

직접 컬럼 이름 사용하기

DataFrame의 컬럼 이름을 직접 사용해 선택할 수도 있습니다. 이 방법은 가장 직관적입니다.

1
selected_columns = df[['column1', 'column2']]

filter 메소드 사용하기

filter 메소드를 사용하면 컬럼 이름에 특정 문자열이 포함된 컬럼을 선택할 수 있습니다.

1
selected_columns = df.filter(like='col')

선택한 컬럼으로 새 DataFrame 생성하기

위의 어떤 방법으로든 여러 컬럼을 선택한 후, 그 결과를 새로운 DataFrame으로 저장할 수 있습니다.

1
new_df = df[['column1', 'column2']]

주의사항

여러 컬럼을 선택할 때, 컬럼 이름을 잘못 입력하면 KeyError가 발생합니다. 따라서 컬럼 이름을 정확하게 확인해야 합니다.

마무리

Pandas DataFrame에서 여러 컬럼을 선택하는 방법은 다양하고, 상황에 따라 적절한 방법을 선택할 수 있습니다. 코드의 가독성과 유지 관리를 고려하여 적절한 방법을 선택하는 것이 중요합니다.

이 기사는 저작권자의 CC BY 4.0 라이센스를 따릅니다.