1.采集数据2.数据清洗、特征选择、数据降维数据清洗:清除异常数据、异常特征 参考业务清洗数据 特征选择:选取建模用到的特征数据降维:降低数据的维度,减少模型的复杂度3.建模确定问题,分类,回归,推荐等题目