惯例来从自己摘抄的话来谈读后感。
1,不再追求精确度,不再追求因果关系,而是承认混杂性,探索相关关系。
放弃对因果关系的渴求,很喜欢这个概念。而人们通常理解范围里的因果关系,也常常是病态的,总是两件事先后发生,便强加“因果关系”于它们。这也是GRE阅读里极易犯下的错误。甚至在八卦新闻里,也是如此。人们总是不知疲倦地挖掘事物之间的因果关系、先来后到。殊不知,有那么一点相关已经足够,再放到大数据的时代,在全局观下,关注相关关系节省精力,cost-effectivly.
2,量变导致质变。
e.g. 纳米技术关注把东西变小而非变大,其原理就是当事物达到分子级别,其物理性质就会发生改变。金属可以变得柔软,陶土可以具有弹性。同样,我们增加所利用的数据量,就可以做很多在校数据量的基础上无法完成的事情。
这句话本身就曾经作为过我自己的人生准备,但是书中这个具象的例子还是让我更加增添了几分喜欢。当被确定的变成了不确定,这本身就是一件很好玩的事情。
3,技术成熟曲线(技术循环曲线)(炒作周期)
很喜欢提取型名词,这个名词用来形容大多数市面上电子产品的运作模式都不为过。而相反从用户的角度来考虑,一开始新技术被大肆炒作,用户却容易唱反调,保持观望态度。等到平缓期,褒贬不一,愿意相信铁粉去尝试的人发现甜头,又会让它热起来。当然个体有差异。
4,采样分析的精确性随着采样随机性的增加而大幅提高,但与样本的数量的关系不大。(类似经济学中边际效应-递减)
说实话人类那么酷爱研究A增B增,A减B减,最后还是得无可奈何承认它的大范围和一定局限性。
5,执迷于精确性是信息缺乏时代和模拟时代的产物,只有5%的数据是结构化且适用于数据库的,如果不接受混乱,剩下95%的非结构化数据无法被利用,只有接受不确定性,才能打开新的窗户。
再一次完美契合我的“设计随机论”的观点。这段话很容易让我联想到大学做物理实验,我的物理天分不高,做起实验来也东倒西歪,通常只要得出一个数据就万事大吉。现在想想统统都是在制造混乱,好险最终没有走精准的科研路线,否则统统都是把结果引上一条不归路。
而对于信息而言,本身就是没有对错的,大多都是人为设定的,“我想要的数据的样子”,等到了最后,却没有人去验证和讨论“我想要的”这个前缀是不是有太多偏执。总之太多的“要果造因”,再“因”一出来print\print\print作为后续一堆莫名其妙的参照源头。这样下来,尽管信息是没有对错,却人为地给制造出来了对错,再被现在充满戾气的网络民众所利用,就更加面目全非。
6,If you have too much data, then "Good Enough" is Good Enough
人们就是喜欢追求看不见的,却不把握手中已有的。在高频率信息流的冲击下,无需人工关联以及建立飘渺的假设基础。总是现有的就是好的,全部一起用上吧!
再深之剖析人类思维模式:
A-不费力的快速思维,几秒得出结果,通过已有知识和信仰的执着
B-比较费力的慢性思维,特ing问题考虑到位
人们就爱A,而A其实就是思维惰性,也就是无论考试中错题,生活中误会所贯穿的“想当然”。
7,“病毒型社交”“数据废气”“数据折旧值”“可扩展型数据”
这些都是非常好的名词,作为名词控深深M一下。
8,卓越的才华并不依赖数据。
这句话非常好,并借用interactive design课上老师做的分类:
User-Centered Design/Activity-Centered Design/System Design
/Genius Design
其中Genius Design就是这个道理,relies on skills and wisdom of designer。通用例子苹果公司。乔布斯没有市场调研就是因为他知道“消费者没义务去了解自己想要什么。”以及亨利‘福特那句“如果我当年去问顾客想要什么,他们肯定会告诉我,一匹更快的马。”
当然这同样是需要辩证的在现实当中实践。
总的来说,虽然这本书没有看英文原版,但是还是收获了很多。这个贯穿的主核心也很好理解,就是全局观念去处理分析数据,而不是设限地为了数据而数据。Just Let it Flow~