序
道德经阐述:道生一,一生二,二生三,三生万物。
1964年美国科学家盖尔曼提出中子,质子这一类强子是由三个更基本的单元夸克构成的,验证了道德经中《三生万物》的物理存在原理。
数据科学是一门日新月异的科学,数据库常变,软件常变,硬件常变 ……不变的只有洞察本质的思维方式和对问题解决之道的不懈追求。
第二章 通过好的提问设置目标
- 保持意识:经验、领域专家和其他与项目相关的知识会帮助你在问题出现之前做好规划和预测。
- 与客户沟通时需要了解客户的观点和他们的潜在的对数据科学知识的匮乏。
- 花时间思考所有可能的路径以回答那些好问题。
解决愿望和现实的矛盾
数据科学家在没有看到或者接触到相关的数据之前,面临着大量的不确定性,主要是关于具体哪些数据可用,能够提供多少证据来回答所提出的问题等。
- 针对具体问题来发现事实而不是意见
一个问题和哪些因素相关应当是通过自己的实践去证明,如果需要剔除某些因素,应当要求有明确的证据证明这些因素对问题没有影响。 - 建议可交付物
明确提出客户希望得到的结果的形式,确定完成项目的标准。 - 根据指示而不是愿望来迭代
要清楚地了解迭代的成本,项目的迭代方向,而不是根据自己的主观想法来开发程序。
要不断地提问自己,要解决什么问题
————————————————————————————————————
提出关于数据的好问题
- 好问题的假设是具体的。
想要验证一个假设的推论的正确与否首先要确认假设的场景是否正确。 - 一定要提问,提出的问题无论答案如何,都会使你更接近实际结果,让你的工作更容易。
- 正面和负面的结果都有所帮助。
数据科学家最有价值的特征之一是对可能发生的事情的意识以及为此做好准备的能力。
用数据来回答问题
- 数据相关并且足够么
- 以前有人做过么
上网查看别人做的经验,教训,看看有无有用的信息。 - 弄清可以用的数据和软件
社会上有很多容易得到或者成本较低的数据源。 - 预见行动的障碍
如果算法得不到期待的结果怎么办。
如何检验结果是否合理。