포스트

Pandas에서 컬럼 타입 변경하기

소개

Pandas는 Python에서 데이터 분석을 위한 효과적인 라이브러리입니다. 종종 데이터를 다루다 보면 컬럼의 데이터 타입을 변경해야 할 필요가 생깁니다. 이 글에서는 이러한 작업을 어떻게 수행할 수 있는지 알아보겠습니다.

astype() 메서드로 기본 타입 변경하기

astype() 메서드는 Pandas DataFrame에서 데이터 타입을 변경하는 가장 간단한 방법 중 하나입니다. 이 메서드를 사용하면 정수형, 실수형, 문자열 등 다양한 데이터 타입으로 변경할 수 있습니다. 아래는 간단한 예시입니다.

1
2
3
4
5
6
7
8
9
10
11
12
13
import pandas as pd

# 예시 DataFrame 생성
df = pd.DataFrame({
    'A': [1, 2, 3],
    'B': [4.0, 5.1, 6.2]
})

# 'A' 컬럼의 데이터 타입을 실수형으로 변경
df['A'] = df['A'].astype(float)

# 'B' 컬럼의 데이터 타입을 정수형으로 변경
df['B'] = df['B'].astype(int)

convert_dtypes()로 자동 타입 추론

Pandas 1.0.0 이상의 버전에서는 convert_dtypes() 메서드를 사용하여 모든 컬럼의 데이터 타입을 적절하게 추론하고 변경할 수 있습니다. 이 메서드는 데이터를 보고 가장 적합한 타입으로 자동으로 변경해줍니다.

1
2
# 자동 타입 추론을 사용하여 DataFrame의 모든 컬럼 타입 변경
df = df.convert_dtypes()

오류 및 주의사항

값이 문자열로 저장되어 있는데 이를 숫자로 변경하려고 할 때, 만약 컬럼에 숫자로 변환할 수 없는 값이 있다면 ValueError 오류가 발생합니다. 예를 들어, ‘apple’ 이나 ‘banana’와 같은 문자열이 있다면 이러한 오류가 발생할 수 있습니다.

결론

Pandas 라이브러리는 데이터 타입을 변경할 수 있는 다양한 방법을 제공합니다. astype() 메서드를 사용하면 원하는 데이터 타입으로 간단히 변경할 수 있으며, convert_dtypes() 메서드를 사용하면 자동으로 타입을 추론하여 변경할 수 있습니다. 하지만 항상 데이터를 잘 살펴보고 적절한 타입으로 변경하는 것이 중요합니다.

이 기사는 저작권자의 CC BY 4.0 라이센스를 따릅니다.