定义
数据科学家是伴随着大数据技术的崛起和数据科学的兴起而出现的新的就业岗位。其被评为21世纪最性感的工作。
数据科学家的技能
数据科学家需要具备跨学科的知识和技能,包括数学和统计分析、人工智能与机器学习、数据库与数据挖掘等。
具备数据处理全流程的能力,包括理解业务数据(Understand Data)、收集数据(Collect Data)、对数据进行集成(Integrate Data)、对数据进行分析挖掘(Analyze Data)、对结果进行可视化以及把结果表达给目标听众(communicate Result),下图为数据科学家的技能:
数据科学家的基本原则
原则1: 数据分析可以划分成一系列明确的阶段
原则2:描述性分析与预测性分析
原则3:实体的相似度
原则4:模型的泛化能力
原则5:分析结果的评估与特定应用场景相关
原则6:相关性不同于因果关系
原则7:通过并行处理提高数据处理(分析)速度