반응형
파이썬으로 엑셀 파일을 불러오고 데이터 다루는 가장 기본적인 라이브러리인 openpyxl에 대해 알아보도록 하겠습니다.
[ 목차 ]
1. Openpyxl 설치
$ pip install openpyxl
2. 파일 생성
import openpyxl
# 새로운 엑셀 파일 생성
wb = openpyxl.Workbook()
# 새로운 시트 추가
sheet = wb.active
# 셀에 데이터 쓰기
sheet['A1'] = '가나다'
sheet['B1'] = '라마바사아'
# 엑셀 파일로 저장
wb.save('example.xlsx')
3. 파일 열기
import openpyxl
# 기존 파일 열기
wb=openpyxl.load_workbook('example.xlsx') #파일명 혹은 패스+파일명 입력
# sheet 선택하기
sheet = wb.get_sheet_by_name('Sheet1')
# 셀 값 가져오기 방법1
sheet['A1'].value
# 셀 값 가져오기 방법2
sheet.cell(row=1, column=1).value
4. 워크시트 추가
import openpyxl
wb = openpyxl.Workbook()
wb.create_sheet() # 기본값으로 시트 생성
wb.create_sheet(index=숫자, title=’시트명’) # 지정된 이름으로 시트 생성
5. 행/열 다루기
모든 행/열 출력
from openpyxl import load_workbook
import pandas as pd
wb = load_workbook('sample.xlsx')
ws = wb['sample']
all_values = []
for row in ws.rows:
for cell in row:
all_values.append(cell.value)
print(all_values)
6. Pandas Dataframe으로 데이터 변환
from openpyxl import load_workbook
import pandas as pd
wb = load_workbook('sample.xlsx')
ws = wb['sample']
data = ws.values
columns = next(data)[0:] #첫행을 칼럼으로 쓰고, 첫행은 data에서 지워짐
df = pd.DataFrame(data, columns=columns)
기본적인 내용만 정리해 올립니다.
반응형
'Programming > Python_Etc' 카테고리의 다른 글
Tkinter 위젯 배치 스터디 - grid / pack / place (0) | 2024.03.29 |
---|---|
Tkinter 기본 활용 (1) | 2024.03.28 |
파이썬보다 35,000배 빠른 언어 모조 (Mojo) (0) | 2023.07.13 |
머신러닝(ML) 알고리즘 알고리즘 카테고리 분류 - 지도학습, 비지도학습, 강화학습 (0) | 2023.05.18 |
Python 머신러닝 라이브러리 비교 : Scikit-learn, TensorFlow, Keras 및 PyTorch (0) | 2023.05.16 |