본문 바로가기

Programming/Python_Etc

파이썬 데이터분석 1 openpyxl로 엑셀 다루기

반응형

파이썬으로 엑셀 파일을 불러오고 데이터 다루는 가장 기본적인 라이브러리인 openpyxl에 대해 알아보도록 하겠습니다.

[ 목차 ]

    1. Openpyxl 설치

    $ pip install openpyxl

     

    2. 파일 생성

    import openpyxl
    
    # 새로운 엑셀 파일 생성
    wb = openpyxl.Workbook()
    
    # 새로운 시트 추가
    sheet = wb.active
    
    # 셀에 데이터 쓰기
    sheet['A1'] = '가나다'
    sheet['B1'] = '라마바사아'
    
    # 엑셀 파일로 저장
    wb.save('example.xlsx')

     

    3. 파일 열기

    import openpyxl
    # 기존 파일 열기
    wb=openpyxl.load_workbook('example.xlsx') #파일명 혹은 패스+파일명 입력
    
    # sheet 선택하기
    sheet = wb.get_sheet_by_name('Sheet1')
    
    # 셀 값 가져오기 방법1
    sheet['A1'].value 
    # 셀 값 가져오기 방법2
    sheet.cell(row=1, column=1).value

     

    4. 워크시트 추가

    import openpyxl
    wb = openpyxl.Workbook()
    
    wb.create_sheet() # 기본값으로 시트 생성
    wb.create_sheet(index=숫자, title=’시트명’) # 지정된 이름으로 시트 생성

     

    5. 행/열 다루기

    모든 행/열 출력

    from openpyxl import load_workbook
    import pandas as pd
    
    wb = load_workbook('sample.xlsx')
    ws = wb['sample']
    
    all_values = []
    for row in ws.rows:
      for cell in row:
        all_values.append(cell.value)
    
    print(all_values)

     

    6. Pandas Dataframe으로 데이터 변환

    from openpyxl import load_workbook
    import pandas as pd
    
    wb = load_workbook('sample.xlsx')
    ws = wb['sample']
    
    data = ws.values
     
    columns = next(data)[0:]  #첫행을 칼럼으로 쓰고, 첫행은 data에서 지워짐
    
    df = pd.DataFrame(data, columns=columns)

     

    기본적인 내용만 정리해 올립니다.

    반응형