上次在工业4.0中写到关于数据分析方面的内容希望能进一步了解,所以本次选择了这本书。
本书从大数据时代的思维变革、商业变革和管理变革三个方面讲述了大数据给我们的生活、工作和思维带来的改变。书中也例举了很多实例,特别是在数据分析方面给我带来一些启发。
记得在做回波库管理时客户提出的困惑,面对海量的格式不一致的数据如何将有价值的数据提取并利用起来。在书中提到,只有百分之五的数据是结构化且能适用于传统数据库的,剩下的百分之九十五的结构化数据都无法被利用。那是不是说明我一开始的想法就是错误的,解决方法就是接受这些数据的混杂性,从“小数据”到“大数据”的转变(难点就是需要进行新的数据库的设计)之前我们总是绞尽脑汁想更好的算法机制,但是谷歌翻译的成功可以给我们一些启示(见书中谷歌翻译系统)-也许我们在通往一条错误的路上。
怎样的方式我们可以尝试一下?
书中提到的一种新的思维让我非常感兴趣——知道“是什么”就够了,没必要知道“为什么”。书中提到的一些成功的例子说明找出问题之间的关联性比找出问题的原因更具有价值(见书中“不是因果关系”而是“相关关系”),根据这一点可以确定数据分析的方向。
“量化一切,数据化的核心”,书中提倡一切皆可量化,这可能就是在实际工作中需要花些时间思考的地方。在实际方案中进行数据量化的设计和论证,比如书中提到的谷歌数字图书馆。
之前在工作中面对数据分析的问题会听到这样的声音“数据存在问题”、“技术不可实现”等,但是很少有人会注意到是思维出现问题,所以如果想把数据分析做好,数据、技术和思维(见书中大数据思维)缺一不可。
这本书提供的是一些启发性的思路,在日后的工作中遇到数据处理和分析方面的问题可以参考,具体的实践还需要搜集更多的资料并论证。