OpenPyXL简介(发音:openpixel)
如果您在2010年之前进入就业市场,那么所需的最常用技能集之一是Microsoft Excel。
现在有一天,了解Microsoft Excel不仅是一项要求,而且几乎没有必要放上简历,因为假设每个人都知道如何使用它。
处理数据的大多数工作和任务都需要您处理电子表格。
这可能看起来像是#tbt,或者背离了我们对pandas库和python功能的乐趣,但是保持在我们众所周知的工具箱的最前沿仍然非常重要。
为什么?
好吧,底线,公司和管理层仍然严重依赖于Microsoft Excel电子表格和.xlsx文件类型,并且它们不会很快到达任何地方。
虽然许多企业已经意识到Excel的低效率,但许多公司仍然依赖它,如果没有其他原因,除了纯粹的习惯力。“ 企业时报”发表的一篇文章报道称,美国约有60%的企业仍然依赖电子表格,而21%的企业正在转向其他软件解决方案。
例如,您可能有一项无聊的任务,即
从一个电子表格中复制某些数据并将其粘贴到
另一个电子表格中。或者,您可能需要经历数千行,并根据某些标准选择少数行进行小编辑。或者您可能需要查看数百个部门预算电子表格,搜索任何红色的电子表格。这些正是Python可以为您做的那种无聊,无意识的电子表格任务。
- 自动化无聊的东西
因此,作为pythonistas,我们需要找出一种pythonic方式来处理这个重要的无所不在的现象。我们的解决方案:
- openpyxl:使用python读取和写入.xlsx文件的推荐包。一般可以处理以下包的用例。
- xlsxwriter:用于读取和写入文件以及格式化.xlsx文件的替代包。适用于格式化信息和图表。
- xlrd:这个包适用于读取和格式化旧版本的excel文件(.xls)
- xlwt:用于在旧(.xls)格式的文件中写入和格式化信息的包。
- xlutils:收集需要xlrd和xlwt功能的实用程序。包括过滤现有excel文件的功能。
使用这些包,我们可以直接从Python读取,编辑和创建.xlsx文件类型。
Numpy,Pandas和我们最喜欢的许多python库和软件包都可以轻松地与OpenPyXL集成,以自动执行任务并收集和分析数据。
为什么不直接使用Pandas和.CSV文件类型?
- CSV(逗号分隔值)文件类型只有2种数据类型 - 字符串和数字
- CSV是压缩文件类型,很容易损坏。
- CSV不保存和传输公式。
- 世界上没有关于分离价值的标准 - 美国的逗号,可能在德国使用短划线或管道。
- XLXS文件类型包含所有内容或没有任何内容,如果文件损坏,您将不会丢失部分数据。
- XLXS文件比CSV更具可操作性。
- XLXS支持更多数据类型 - 它有自己的内置日期类型。日期时间,浮点数,百分比......
仔细看看OpenPyXL
入门:
安装-
在终端
$ pip install openpyxl
为了能够在我们的Excel工作簿中包含图像文件,我们还需要安装枕头:
$ pip install pillow
Pillow(PIL) - Python Imaging Library是一个免费的Python编程语言库,它增加了对打开,操作和保存许多不同图像文件格式的支持。
我们可以使用Openpyxl包执行的功能和事情:
- 创建工作簿,创建工作表,创建工作表副本。
- 使用函数循环显示工作表(For Loops)。
- 访问一个单元格或多个单元格并使用数据。
https://openpyxl.readthedocs.io/en/stable/usage.html
底线:
OpenPyXL和其他与Python集成的软件包可以让您的生活更轻松,节省您的时间,让您成为办公室和客户的最爱。
进一步阅读:
OpenPyXL官方文档
python小白社群之Python遇到excel-1