Python에서 CSV 파일을 다룰 때, 열 이름을 포함하는 헤더 행은 일반적으로 첫 번째 줄에 있습니다. 하지만 경우에 따라 메타데이터나 설명 텍스트가 앞에 오고 헤더가 파일 중간에 위치할 수 있습니다. 이 글에서는 Pandas 라이브러리를 사용하여 표준적이지 않은 행에 헤더가 있는 CSV 파일을 읽는 방법을 보여줍니다.
“ Pandas 설치
Pandas는 데이터 조작 및 분석을 위한 강력한 Python 라이브러리입니다. 아직 설치하지 않았다면 pip를 사용하여 설치할 수 있습니다:
```bash
pip install pandas
```
“ Python 코드 예제
다음 Python 코드는 헤더가 세 번째 행(Python은 0부터 시작하는 인덱싱을 사용하므로 인덱스 2)에 있는 CSV 파일을 읽는 방법을 보여줍니다:
```python
import pandas as pd
# CSV 파일 경로 정의
csv_file_path = 'example.csv'
# 헤더 행 지정하여 CSV 파일 읽기
df = pd.read_csv(csv_file_path, header=2)
# DataFrame 표시
print(df)
# DataFrame을 새 CSV 파일로 저장 (선택 사항)
output_csv_file_path = 'output_example.csv'
df.to_csv(output_csv_file_path, index=False)
```
이 코드에서:
* `import pandas as pd`는 Pandas 라이브러리를 가져옵니다.
* `csv_file_path`는 CSV 파일의 경로를 지정합니다.
* `pd.read_csv(csv_file_path, header=2)`는 CSV 파일을 읽으며, `header=2`는 헤더 행이 세 번째 행임을 나타냅니다.
* `print(df)`는 결과 DataFrame을 표시합니다.
* `df.to_csv(output_csv_file_path, index=False)`는 인덱스 열 없이 DataFrame을 새 CSV 파일로 저장합니다.
“ 예제 CSV 파일
다음 예제 CSV 파일(`example.csv`)을 고려해 보세요:
```csv
Some useless data1
Another useless data2
Column1,Column2,Column3
Data1,Data2,Data3
Data4,Data5,Data6
```
이 파일에서 실제 헤더(`Column1,Column2,Column3`)는 세 번째 줄에 있습니다.
“ 코드 실행
Python 코드를 `.py` 파일(예: `read_csv_with_header.py`)로 저장하고 `example.csv`가 같은 디렉토리에 있는지 확인하세요. 명령줄에서 스크립트를 실행합니다:
```bash
python read_csv_with_header.py
```
“ 출력
스크립트는 DataFrame을 콘솔에 출력합니다:
```
Column1 Column2 Column3
0 Data1 Data2 Data3
1 Data4 Data5 Data6
```
또한 새 CSV 파일(`output_example.csv`)이 생성되며, 내용은 다음과 같습니다:
```csv
Column1,Column2,Column3
Data1,Data2,Data3
Data4,Data5,Data6
```
“ 실용적인 응용 및 중요성
이 방법은 실제 헤더 행 앞에 메타데이터, 주석 또는 기타 관련 없는 정보가 포함된 CSV 파일을 다룰 때 특히 유용합니다. `pd.read_csv()`에서 올바른 `header` 인수를 지정하면 데이터를 정확하게 읽고 처리하여 데이터 무결성을 보장하고 추가 분석을 용이하게 할 수 있습니다.
우리는 사이트 작동에 필수적인 쿠키를 사용합니다. 사이트를 개선하기 위해 방문자들의 사용 방식을 이해하고, 소셜 미디어 플랫폼에서의 트래픽을 측정하며, 개인화된 경험을 제공하는 데 도움이 되는 추가 쿠키를 사용하고자 합니다. 일부 쿠키는 제3자가 제공합니다. 모든 쿠키를 수락하려면 '수락'을 클릭하세요. 선택적 쿠키를 모두 거부하려면 '거부'를 클릭하세요.
댓글(0)