pandasを使ってExcelを読み込む

スポンサーリンク

概要

  • Pythonを使用してデータ分析をしているときにExcelを読み込みたい
  • pandas + xlrdで読み込む

解決方法

準備

pip install xlrd

サンプルコード

複数ブック/複数シートを読み込んで、各シートをDataFrameにしてリスト化する。

import pandas as pd

books = ['book1.xlsx', 'book2.xlsx']
df_list = []

for book in books:
    # Excelファイル(book)を読み込む
    loaded_book = pd.ExcelFile(book)

    # シートを順々にデータフレーム化
    for sheet in loaded_book.sheet_names:
        df_list.append(loaded_book.parse(sheet))

pandas.ExcelFile.parseで比較的よく使う引数は以下の通り。

  • skiprows: 最初の何行をスキップするか
  • header: 最初の行をヘッダーとして読み込まない場合はheader=None
スポンサーリンク