- 定义问题 - Define the question
- 定义理想的数据集 - Define the ideal data set
- 确定数据集 - Determine what data you can access
- 获取数据 - Obtain the data
- 清洗数据 - Clean the data
- 探索性数据分析 - Exploratory data analysis
- 统计预测/建模 - Statistical prediction/modeling
- 结果解释 - Interpret results
- 结果输出 - Synthesize/write up results
- 创建可重复研究的代码 - Create reproducible code
这一步的重要性在于别人可以依据你的代码复现你的数据结论, 而不是口头说服. - 将结果分发给他人 - Distribute results to other people
数据科学家行为准则 - What Do Data Scientists Do?
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。