这里介绍如何用python来自动完成我们的excel工作。
本文的目的是展示一些常见的Excel任务,以及如何在python pandas中执行类似的任务。例子微不足道,但重要的是通过这个例子来循序渐进的介绍pandas简单到复杂的功能。展示pandas如何利用Python的完整的模块系统做一些简单的文字处理。
自动求和
数据如下:
第1步,求出每一行数据的和,并作为一个 新列附加到数据中。在excel里,可能用公式是sum(A2:E2)。
在这里,这功能就可以用pandas的dataframe来解决。这里简单说下dataframe,我们简单认为,dataframe就是对应了excel的数据结构,我们操作的时候,就可以认为dataframe就是对应excel的操作。
第2步,对P1~P5的每一列做一个求和。在excel里是用公式,SUM(G2:G16).python对应解决方案是用 pandas的对应列,然后直接求sum即可。
第3步,对第一列求和,平均值,最小值,最大值。
程序逻辑如下,读入excel,然后按行求和,把求出所有行的和作为一个新列加到数据里,为防止破坏原始数据,写入一个新的excel文件,接着在python运行结果里显示对数据的操作结果。
程序如下:
运行结果:
让我们看看新生成的excel.
只需要这么几行代码,就完成了读取excel,然后对P1,P2,P3,P4,P5求和,平均值,最小值,最大值,并写入新文件的功能。
第17,18行代码,把求各行和的结果写入一个新的excel文件,名字为newxls.xls,并指定写入第一个名为0的工作表中。
其中14行代码中df.head()使用head()函数查看列表前几行数据(默认是前5行),如果我在括号里写3,结果只会显示前3行,如下: