포스트

판다스 데이터프레임에 행 하나씩 추가하기

소개

판다스는 파이썬에서 데이터 분석을 하기 위한 가장 인기 있는 라이브러리 중 하나입니다. 많은 사람들이 판다스의 DataFrame 객체를 이용해서 테이블 형태의 데이터를 쉽게 다룹니다. 이번 글에서는 DataFrame에 행을 하나씩 추가하는 방법에 대해 자세히 알아봅니다.

DataFrame 이해하기

DataFrame은 2차원의 테이블 형태로, 행과 열로 구성되어 있습니다. 각 행과 열은 서로 다른 데이터 타입을 가질 수 있습니다. 행은 데이터의 개별 항목을 나타내고, 열은 해당 항목의 특성을 나타냅니다. 예를 들어, ‘이름’, ‘나이’, ‘성별’ 등이 될 수 있습니다.

행 추가 방법

append 메서드 사용하기

판다스의 DataFrame 객체에는 행을 추가할 수 있는 여러 가지 방법이 있습니다. 가장 기본적인 방법은 append 메서드를 사용하는 것입니다.

1
2
3
4
5
import pandas as pd

df = pd.DataFrame(columns=['이름', '나이'])
new_row = {'이름': '홍길동', '나이': 30}
df = df.append(new_row, ignore_index=True)

이 코드에서 ignore_index=True는 새로운 행을 추가할 때 인덱스를 다시 설정하라는 의미입니다.

loc 메서드 사용하기

또 다른 방법은 loc 메서드를 이용하는 것입니다.

1
df.loc[len(df.index)] = ['홍길동', 30]

loc 메서드를 이용할 때는 DataFrame의 현재 크기를 알아야 하므로 len(df.index)를 사용하여 새로운 행의 위치를 지정합니다.

성능 관련 주의사항

행을 하나씩 추가하는 방법은 간단하지만, 큰 데이터셋에서는 비효율적일 수 있습니다. 왜냐하면 DataFrame이 각 행을 추가할 때마다 내부 데이터를 복사하기 때문입니다. 이런 작업이 반복되면 시간이 오래 걸릴 수 있습니다.

결론

판다스 DataFrame에 행을 하나씩 추가하는 것은 간단하지만, appendloc 메서드를 사용할 때는 성능 문제를 고려해야 합니다. 따라서 데이터의 크기가 큰 경우에는 다른 방법을 고려하는 것이 좋습니다. 이 글에서는 행을 하나씩 추가하는 방법을 중심으로 설명했습니다. 이러한 기초적인 내용을 이해하면 더 복잡한 데이터 분석 작업도 쉽게 할 수 있을 것입니다.

이 기사는 저작권자의 CC BY 4.0 라이센스를 따릅니다.