pandas.ExcelFile #

熊猫类 ExcelFile ( path_or_buffer , engine = None , storage_options = None , engine_kwargs = None ) [来源] #

用于将表格 Excel 工作表解析为 DataFrame 对象的类。

有关更多文档,请参阅 read_excel。

参数
path_or_buffer str、字节、路径对象(pathlib.Path 或 py._path.local.LocalPath)、

类似文件的对象、xlrd 工作簿或 openpyxl 工作簿。如果是字符串或路径对象,则应为 .xls、.xlsx、.xlsb、.xlsm、.odf、.ods 或 .odt 文件的路径。

引擎str,默认无

如果 io 不是缓冲区或路径,则必须设置它以识别 io。支持的引擎:xlrd, openpyxl, odf, pyxlsb,calamine 引擎兼容性 :

  • xlrd支持旧式 Excel 文件 (.xls)。

  • openpyxl支持较新的 Excel 文件格式。

  • odf支持 OpenDocument 文件格式(.odf、.ods、.odt)。

  • pyxlsb支持二进制 Excel 文件。

  • calamine支持 Excel(.xls、.xlsx、.xlsm、.xlsb)和 OpenDocument (.ods) 文件格式。

版本 1.2.0 中的更改:引擎xlrd 现在仅支持旧式.xls文件。当 时engine=None,将使用以下逻辑来确定引擎:

  • 如果path_or_buffer是 OpenDocument 格式(.odf、.ods、.odt),则将使用odf 。

  • 否则,如果path_or_buffer是 xls 格式, xlrd将使用。

  • 否则,如果path_or_buffer是 xlsb 格式, 则将使用pyxlsb 。

1.3.0 版本中的新增功能。

  • 否则,如果安装了openpyxlopenpyxl ,则将使用。

  • 否则,如果安装了,则会引发 a 。xlrd >= 2.0ValueError

警告

xlrd使用读取文件时请不要报告问题.xlsx。不支持此功能,请改为使用openpyxl

engine_kwargs字典,可选

任意关键字参数传递给 Excel 引擎。

例子

>>> file = pd.ExcelFile('myfile.xlsx')  
>>> with pd.ExcelFile("myfile.xls") as xls:  
...     df1 = pd.read_excel(xls, "Sheet1")  

属性

book

sheet_names

方法

close()

如有必要,关闭 io

parse([工作表名称、标题、名称、...])

将指定的工作表解析为 DataFrame。