拯救你于系统崩溃的水深火热之中——Excel数据整理思路(一)

一、写在开篇的一些话

从参加工作至今已经快有十年之久了,好像大家都喜欢用时光荏苒、光阴流逝。。。(捂嘴笑)。好吧,一转眼,我就从一个翩翩少年(我就是这么认为的!手动滑稽)成长为一个中年大叔。

感觉上,对人力的工作也略有些了解,其中EXCEL的小技巧也些许研究。我想,也许可以先把这部分跟大家聊一聊。这里,我说的不只是功能的介绍,更多的是在数据处理时的一些思路。

二、多做版本更迭,救你于崩溃的水深火热之中

Excel是世界上最重要的数据计算软件之一,它包含了大家用得到或用不到的小技巧超过几万种。其中,不少功能需要的运算时间非常长。尤其在你处理的数据过多,跨表格引用公式也非常多的时候,Excel的反应速度会变得非常慢。甚至Excel会时不时的假死或崩溃,相信大家也都有过类似的经历。

由于日常工作中,会经常遇到这种问题,我就这方面来谈一谈自己的想法:

(一)Excel本身不适用于超大型的数据处理,2003版的Excel行的上限是6.5万行,虽然2007之后的版本大幅提升了这个限制,但实际工作中,超过了两万行的数据处理起来就不是非常快了。所以,建议大家在做超大型数据处理时选择ACCESS、MYSQL等数据库或SAS、SPSS等大数据软件。

(二)如果一定要在Excel中进行数据计算,并且数据量不是超大的情况下,给大家以下建议:

1、养成经常保存的习惯

大家在处理复杂工作任务时,在Excel中的工作时间可能从5分钟持续到5个小时,甚至更久。如何能减少在此期间的崩溃概率,我养成了每隔几分钟,甚至每敲几行数据就保存一次的习惯。

这里的小技巧就是多用、常用“Ctrl + S”,这是“保存”命令的快捷键。每按一次,EXCEL就会把大家已完成的数据记录下来。以后再崩溃的时候,也可以用已保存的地方恢复。这样可以尽可能减少大家从头开始的尴尬局面。

2、设置“自动保存”

为了方便大家保存数据,Excel内置了“自动保存功能”,可以设置每隔一定时间自动保存一下数据。具体的操作流程如下:

(1)点击“文件”按钮


(2)在弹出的菜单中,选择“选项”按钮。


(3)在弹出的对话框中,选择“保存”选项,并在右方设置每隔X分钟,保存自动恢复。


3、屏蔽掉干扰

这里说的屏蔽掉干扰包括两个方面:

一是由于电脑的内存有限,打开过多的工作簿或其他工作程序,容易占掉内存。而EXCEL本身就非常占内存,所以更容易出现卡死崩溃的情况。因此建议在处理大型数据时,除了与此次数据处理相关的程序,其他全部关掉。

二是屏蔽掉EXCEL内多余的数据。很多时候,大家习惯在做表时带上姓名、身份证号、工号等等各种用于识别员工的字段。一方面,这样确实强化了读取员工身份信息的手段;但是另一方面来看,这些都是重复的冗余数据。

为什么这么说呢,“姓名”这个字段,在进行批量公式等处理时,几乎不发挥任何作用。因为可能会有很多员工重名,比如我们单位有五个以上的“刘颖”。。。因此建议大家在使用身份识别字段时取“身份证号”或“工号”等具有唯一的代码。

另外,由于“工号”、“身份证号”都可以对应到同样的一个人,没有必要在信息处理时将他们同时用上。要知道在大型数据表中,每增加一个字段都可能会增加几十兆的内存占用。

三是屏蔽其他工作干扰。这个可能跟EXCEL无关,是自己在数据处理的一点感受。处理人力方面的数据,各种列间、行间的数据逻辑关系复杂,如果工作过程中不能够全神贯注,很容易造成公式混乱。而且,由于EXCEL本身的缺陷,一旦出现错误,很难找到问题的根源在哪里。所以,建议大家在处理大型项目的时候,能够找到一个合适地方,尽量避免其他同事的干扰,专注于工作本身。

4、建立数据版本存档的习惯

重要的部分放在最后说~

在工作后,我的BOSS曾经极其严厉的要求我建立工作簿的命名习惯,现在想来,她是希望我能养成这种数据版本存档的习惯。在这里也希望跟大家一起分享一下。

1、在较大型的数据变更后,另存一张工作簿。

在工作中,很多时候在有新的思路或领导有新的要求时,需要大家完全或部分推翻之前做的数据、公式等等。一般情况下,大家可能会直接在原来的工作簿上做修改,希望借用之前工作簿中的数据积累,减轻自己的工作量。

但现实是,很多时候之前的数据中保存这非常多的隐藏公式或无法重复使用的数据。调整思路后你会发现这些数据会影响你重新计算的效率,尤其是在列命名不是非常规范的情况下,很有可能新公式上引用了老的数据源。

另外一个关键的问题是,很可能领导在比较了两版数据结果后,决定重新采用第一版的数据。这时候,如果你覆盖了第一版的数据内容,就意味着你可能需要再大干几个小时了。

所以,我希望大家在遇有重大或思路调整的情况时,另存一个版本的数据。这个时候,大家可以多使用另一个快捷键“F12”,这是“另存为”功能的快捷键。

2、工作簿命名习惯。

不知道大家有没有发现,在处理过几版数据后,你自己都不知道哪版是最新的了。所以很多小伙伴会这样命名:

XXXX工作表(第一版)、XXXX工作表(第二版)、XXXX工作表(最终版)、XXXX工作表(最终一版)、XXXX工作表(最终最终版)。。。等等。

大家会发现,可能你永远都不知道这一版是不是最终版。因此我建议大家在保存工作簿时,不要自己随便命名。我个人认为遵循两个原则较好:一是时间原则,即文件名称中包含当天的时间,以确定哪个是最新、最终的文件。如果当天具有多个版本数据,建议在日期后加上每版数据的时间。二是简明原则,即文件命名不宜过长,能够清楚的表明工作簿的工作内容即可。

这里我举几个例子:“201907041322公司公积金缴费测算表”。这样的命名文件表示为2019年7月4日13点22分时保存的,关于公司公积金缴费测算的数据表。

以上,是我在EXCEL处理的一些小感想,欢迎大家和我交流。谢谢!

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容