第三章 “你把生命献给谁” 讲的是我们应该如何确定为之奋斗的领域。就理论上的逻辑关系来说,我认为这一章本应放在第一、二章之前。但是作者可能是从阅读体验上考虑的,毕竟一位抱着学习数据分析的想法阅读这本书的读者打开书一看却看到行业选择方面的内容的话,可能是会有些失望的。
首先,这一章提到了“精益画布”的概念,这个画布的特点是合理的将创业这么一件很复杂的事情拆分成了几块儿,让每一个创业者在一张纸上就可以了解并掌握到整个创业的方方面面,也容易让创业者很快的意识到自己想法中不成熟的地方,毕竟当你对自己写下的东西并不自信,甚至不知道该写些什么的时候,问题自然就浮现出来了。
其次,作者便谈到了一点点职业选择的内容。创业与拿固定工资得过且过的日子不同,创业是一件需要全身心投入的事情,只有心底里真的热爱所从事的事业,才能创业成功。因此,对于选择职业的三大标准来说,一般人找工作时可能只需要在“想做的”、“擅长做的”、“能赚钱”的这三者中至少满足一个就可以了,而创业者却必须找到三者之间的交集部分后,方能依此开始创业。
第四章 “以数据为导向与通过数据获取信息”中,作者首先说明了量化的数据分析并不是万能的,数学的量化的方法擅长找到问题的局部最优解,这也是我们在优化领域中常常遇到的问题。局部优化在很多时候是奏效的,但是长期的局部优化却会导致前进方向逐渐偏离正确的轨道,忽视了大局,造成了灾难性的结果。书中有两句话说的很好:“渐进式的改变可以达到局部的极限,但是创新会导致全局洗牌”,而创新则依赖于本书的核心观点之一:“人类负责提供灵感,机器负责验证”。
我们不知道未来人工智能会发展成什么样子,但是就目前来说,要想取得长期稳定的成就,或者是革命性的改变的话,那么依赖于计算机/数学的数据分析永远只是人类的好帮手,人类要做的是如何巧妙地运用数据分析,而不仅仅是看图标而后得出结论。
在这之后,作者提到了一些数据陷阱,例如没有没有与总体对比(归一化)、对于异常点的处理不应只是简单的删除,而是应该在总体之外单独对异常的数据进行分析(前提是这些数据的来源是真实可靠的),这样可能会有意料之外的结果。除此之外,还有抛开基数谈增长率,或者抛开增长率谈基数,过于敏感/松弛地设置阈值,忽视季节性等。这些都是数据分析的初学者常犯的错误,或者是利用数据耍流氓的人常用的技俩。
最后,作者还提到创业实际上并不是在创造那个产品,而是通过不断的反馈与改进在创造一个告诉创业者到底应该创造出一个什么东西的工具。这样想来,创业到最终实现的并不是一个完美的产品,而是实现一个愿景、理想与初心。