本文参考自: Kaggle-Titanic Notebooks
数据挖掘实战项目:Kaggle -- 泰坦尼克生存预测
一. 数据挖掘的总体流程:
- 问题的定义(Problem definition)
- 获取原始数据(Acquire Data)
- 清洗、准备数据(Wrangle, prepare, cleanse the data)
- 分析模式并探索数据(Analyze, identify patterns, and explore the data)
- 对数据建模,并根据模型预测、解决所提出的问题(Model, predict and solve the problem)
- 可视化、报告并且呈现问题的解决步骤和最终解决方案。(Visualize, report, and present the problem solving steps and final solution)
- 提交结果(Submit the results)