办公自动化:Python中使用Excel / XLSX-xlsx文件怎么打开

OpenPyXL简介(发音:openpixel

办公自动化:Python中使用Excel / XLSX

办公自动化:Python中使用Excel / XLSX

如果您在2010年之前进入就业市场,那么所需的最常用技能集之一是Microsoft Excel。

现在有一天,了解Microsoft Excel不仅是一项要求,而且几乎没有必要放上简历,因为假设每个人都知道如何使用它。

处理数据的大多数工作和任务都需要您处理电子表格。

这可能看起来像是#tbt,或者背离了我们对pandas库和python功能的乐趣,但是保持在我们众所周知的工具箱的最前沿仍然非常重要。

为什么?

好吧,底线,公司和管理层仍然严重依赖于Microsoft Excel电子表格和.xlsx文件类型,并且它们不会很快到达任何地方。

虽然许多企业已经意识到Excel的低效率,但许多公司仍然依赖它,如果没有其他原因,除了纯粹的习惯力。“ 企业时报”发表的一篇文章报道称,美国约有60%的企业仍然依赖电子表格,而21%的企业正在转向其他软件解决方案。

例如,您可能有一项无聊的任务,即

从一个电子表格中复制某些数据并将其粘贴到

另一个电子表格中。或者,您可能需要经历数千行,并根据某些标准选择少数行进行小编辑。或者您可能需要查看数百个部门预算电子表格,搜索任何红色的电子表格。这些正是Python可以为您做的那种无聊,无意识的电子表格任务。

- 自动化无聊的东西

因此,作为pythonistas,我们需要找出一种pythonic方式来处理这个重要的无所不在的现象。我们的解决方案:

  • openpyxl:使用python读取和写入.xlsx文件的推荐包。一般可以处理以下包的用例。
  • xlsxwriter:用于读取和写入文件以及格式化.xlsx文件的替代包。适用于格式化信息和图表。
  • xlrd:这个包适用于读取和格式化旧版本的excel文件(.xls)
  • xlwt:用于在旧(.xls)格式的文件中写入和格式化信息的包。
  • xlutils:收集需要xlrd和xlwt功能的实用程序。包括过滤现有excel文件的功能。

使用这些包,我们可以直接从Python读取,编辑和创建.xlsx文件类型。

Numpy,Pandas和我们最喜欢的许多python库和软件包都可以轻松地与OpenPyXL集成,以自动执行任务并收集和分析数据。


为什么不直接使用Pandas和.CSV文件类型?

  • CSV(逗号分隔值)文件类型只有2种数据类型 - 字符串和数字
  • CSV是压缩文件类型,很容易损坏。
  • CSV不保存和传输公式。
  • 世界上没有关于分离价值的标准 - 美国的逗号,可能在德国使用短划线或管道。
  • XLXS文件类型包含所有内容或没有任何内容,如果文件损坏,您将不会丢失部分数据。
  • XLXS文件比CSV更具可操作性。
  • XLXS支持更多数据类型 - 它有自己的内置日期类型。日期时间,浮点数,百分比......

仔细看看OpenPyXL

入门:

安装-

在终端

$ pip install openpyxl

为了能够在我们的Excel工作簿中包含图像文件,我们还需要安装枕头:

$ pip install pillow

Pillow(PIL) - Python Imaging Library是一个免费的Python编程语言库,它增加了对打开,操作和保存许多不同图像文件格式的支持。

我们可以使用Openpyxl包执行的功能和事情:

  • 创建工作簿,创建工作表,创建工作表副本。
  • 使用函数循环显示工作表(For Loops)。
  • 访问一个单元格或多个单元格并使用数据。

办公自动化:Python中使用Excel / XLSX


https://openpyxl.readthedocs.io/en/stable/usage.html

底线:

OpenPyXL和其他与Python集成的软件包可以让您的生活更轻松,节省您的时间,让您成为办公室和客户的最爱。

进一步阅读:

OpenPyXL官方文档

python小白社群之Python遇到excel-1

推荐阅读