🎁此书来历
这本书是我参加CSDN公众号活动时赢取的,感谢小李以及我小伙伴们的援助~
👀感受
1. 英文翻译过来的书,看起来真别扭
2. 太久没读“枯燥的”科普读物,很难精心,需要进一步修炼
📚内容
零 廉价改变一切
# 目前的“人工智能”其实是预测,预测是根据你掌握的信息(数据),生成你未掌握的信息
# 预测成本下降会影响其他东西的价值:互补品(如数据)价值升高,替代品(人类预测)价值降低。然而,廉价带来的影响却常常意想不到。例如,计算变得廉价后,音乐CD行业由于数字音乐的兴起而变得一蹶不振
# 计算机还不会思考,思考不会变的廉价
# 人工智能能协助组织执行当前的战略,但当人工智能过于强大时,会促成战略的改变。例如,如果亚马逊可以预测购物者想买什么,就可以先寄后买。2013年亚马逊就申请了“预测性购物”的专利
第一部分 预测
# 预测除了生成未来的信息,还会生成现在和过去的信息。例如,信用卡盗刷检测
# 准确度的小幅提高可能有迷惑性。比如,准确度从80%提高到90%,幅度为从98%到99.9%的两倍。然而,前者意味着错误率降到了2/3,后者意味着降到了1/20
# 回归是根据过去发生的事件的平均值进行预测,回归模型渴望无偏差的结果。因此,预测的足够多,预测在平均概率下就是完全正确的。但无偏差的预测也并非完美
# 与回归不同,机器学习的预测平均概率下可能是错误的,但允许偏差,以求减小方差
# 🌰预测无线电视客户流失,运用回归模型的人会挑选影响因素,而运用机器学习的人会将影响因素的选择权交给了机器。因此,我们“意外的”发现,爱发大量短信、付费时间迟的人容易流失。而上述因素恰恰未被归入回归模型
# 数据是预测的互补品,随着预测变得廉价,数据的价值水涨船高
# 大数据热的原因:人们希望数据能帮助减少不确定性,以及了解正发生的事情
# 要平衡获取数据的成本,与提高预测准确度的好处,需要估算投资回报率
# 从统计角度看,数据收益递减。每增加一个数据对预测的改善,都比前一个小。例如,第一百次测量,比第一万次测量对预测提升更大
# 从经济角度上看,往大库存中增加数据,或许比往小库存中增加数据效果更好。例如,就算只比竞争对手好一点点,也能获得巨大的收益
# 亚当 · 斯密(Adam Smith)提出劳动分工的经济思想:根据相对优势来分配任务
# 即使是专业人士,人类也会过分看中凸显信息,而忽视统计信息。例如,“存活率为90%”时更多医生选择手术,而“死亡率为10%”时更少医生选择手术。
# 世上存在“已知的已知”,“已知的未知”,“未知的已知”,“未知的未知”
# 对于“已知的已知”,机器能提供更好地预测
# 对于“已知的未知”,人类更擅长在数据极少时进行预测。例如,美国总统选举时,候选人和环境随时都在变化,只提前几天预测也很难做到。(不只是对于机器,人类亦然)
# 面对“未知的未知”,人和机器都会失败。黑天鹅事件
# 面对“未知的已知”,例如,旺季需求多价格高,但错误归因会让人认为,价格高可以提升销量
# 人和机器之间应该恰当分工
# 预测的成本随着应用频率而下降,预测机器可以规模化扩展。总而言之,人类有认知,故可根据少量数据来预测。机器则生成大部分常规预测,面对罕见情况时,要寻求人类协助。