Python

(파이썬) 엑셀 파일 읽어오기 pandas DataFrame

고니자니 2023. 10. 18. 12:56
반응형

파이썬에서 판다스(pandas) 모듈을 통해서 엑셀 파일을 불러오는 방법을 설명합니다.

 

pandas와 DataFrame

pandas를 이용해서 표 형식의 데이터나 다양한 형태의 데이터를 다룰 수 있습니다.

DataFrame은 스프레드시트와 같은 표 형식의 자료구조를 갖습니다.

행(row)과 열(column)에 대한 작업을 수행할 수 있습니다.

 

1. 주피터 노트북에서 불러오기

주피터 노트북을 사용하면 판다스 모듈 등 기본 모듈들이 모두 설치되어 있으므로 바로 코드를 작성하면 됩니다.

import pandas as pd

xls = pd.read_excel(r'c:\temp\성적처리.xlsx', sheet_name = 'Sheet1')
print(xls)

(파이썬) 엑셀 파일 읽어오기 panda DataFrame

 

pandas를 이용해서 엑셀 시트를 가져온 형식은 DataFrame입니다.

type(xls)
pandas.core.frame.DataFrame

 

head() 메서드는 처음 5개의 행을 반환합니다.

xls.head()

(파이썬) 엑셀 파일 읽어오기 panda DataFrame

 

columns로 열 이름을 가져올 수 있습니다.

xls.columns

 

필요한 열의 데이터를 가져올 수 있습니다.

xls['이름']

(파이썬) 엑셀 파일 읽어오기 panda DataFrame

 

loc(index)를 이용해서 원하는 행만 가져올 수 있습니다.

xls.loc[1]

(파이썬) 엑셀 파일 읽어오기 panda DataFrame
(파이썬) 엑셀 파일 읽어오기 panda DataFrame

 

 

2. 파이썬 IDLE에서 불러오기

파이썬은 기본으로 pandas 모듈을 사용할 수 없기 때문에 다음과 같은 모듈을 설치하여야 합니다.

- pip install xlrd
- pip install openpyxl
- pip install pandas

 

모듈만 설치되면, 코드는 위에서 설명한 코드를 사용할 수 있습니다.

 

 

반응형