概要
- Pythonを使用してデータ分析をしているときにExcelを読み込みたい
- pandas + xlrdで読み込む
解決方法
準備
pip install xlrd
サンプルコード
複数ブック/複数シートを読み込んで、各シートをDataFrameにしてリスト化する。
import pandas as pd
books = ['book1.xlsx', 'book2.xlsx']
df_list = []
for book in books:
# Excelファイル(book)を読み込む
loaded_book = pd.ExcelFile(book)
# シートを順々にデータフレーム化
for sheet in loaded_book.sheet_names:
df_list.append(loaded_book.parse(sheet))
pandas.ExcelFile.parseで比較的よく使う引数は以下の通り。
- skiprows: 最初の何行をスキップするか
- header: 最初の行をヘッダーとして読み込まない場合はheader=None