04 大数据的组织影响
将数据科学家纳入组织现有流程所产生的影响
数据科学:主要包括先进的统计、预测性分析、数据工程、程序编写以及数据可视化。
在企业的经营中,商业智能和数据科学扮演着不同的角色,需要不同的技能和方法。两者不能互相代替且非常互补。商业智能被认为具有回顾性,而数据科学则被认为具有典型的前瞻性。
数据科学生命周期
关键业务流程图,清晰定义了每一个关键利益相关者——业务用户、数据仓库管理者、数据科学家和商业智能分析师的角色、职责以及期望,以确保针对某个业务流程能够加强合作。
• 业务用户负责定义关键业务流程以及能够用来衡量这些业务流程的关键业绩指标。
• 数据仓库管理者负责定义、开发和管理数据平台。
• 数据科学家负责挖掘企业数据以便对业务有新的认识。
• 商业智能分析师负责识别、管理、呈现和发布业务用户用来监管和衡量业绩的关键指标。
• 数据分析周期最后又回到业务用户,他们使用报告结果、仪表盘和分析得到的洞见来运营他们的业务。
数据科学家的角色和职责
在数据科学生命周期的不同阶段中数据科学家的每一个关键任务,也确认了一些特殊的领域,在这些领域中加强与数据仓库小组、数据加载小组、商业智能小组的合作将有益于数据科学家。
模型建立是一个高度重复的步骤,需要多次修改数据、评估数据的可靠性、决定分析模型的质量和预测力。这不是一个直线型的过程,数据科学家会对不同的变量和模型进行测试,在经历了多次失败后才能找到正确的变量和模型。