本文翻译自O'Reilly网站,原文链接
引言:新的调查结果突出了组织处理机器学习向主流学习的方式
作者: Ben Lorica、Paco Nathan,2018年8月7日
从我们的机器学习采用调查中可以获得“企业机器学习采用情况”的免费报告,以获得完整的调查结果。
随着机器学习越来越广泛的被企业采用,O’Reilly开始着手调查我们的读者,去更多的了解公司是如何处理这项工作的。具有更多的在生产中应用机器学习经验的公司与刚刚起步的公司,在方法的使用上有显著的不同吗?对于那些还没有开始这项工作的公司,有没有可能有帮助的最佳方法呢?
现在来看看机器学习的主流应用——特别是考虑到最近数据隐私立法,例如欧洲的数据通用保护条例(GDPR)和加利福尼亚一次类似的政治运动——我们想要探讨当前的趋势,尤其是这些问题:
1、随着在生产中应用模型的年限增长,采用了机器学习的公司能够得到什么程度的经验。
2、文化和组织方面的影响是什么?——比如,岗位支撑变了吗?
3、谁来构建机器学习模型:内部团队、外部顾问、云API吗?
4、组织中决策和优先事项是如何设置以及由谁设置的?
5、应用于开发机器学习的方法是什么,例如,Agile敏捷开发插件?
6、用什么指标来度量成功?
该调查的显著发现包括:
1、在机器学习领域有丰富经验的公司中,专门针对机器学习的职位已经被广泛应用:数据科学家(81%)、机器学习工程师(39%)、深度学习工程师(20%)。
2、来在具有广泛机器学习经验的公司中,二分之一(54%)的受访者检查公平性和偏见。总体而言,40%的受访者表示他们的公司检查模型的公平性和偏见。随着教程和培训材料的提供,能够解决公平和偏见的公司数量应该增加。
3、在机器学习方面具有丰富经验的公司中,有两分之一(53%)的受访者检查隐私(所有公司的受访者中43%)。欧盟的GDPR规定“通过设计隐私”(“包括从系统设计开始的数据保护而不是后期增加”),这意味着更多的公司将把隐私添加到他们的机器学习清单。幸运的是,随着隐私保护分析和机器学习的工具和方法的兴起,新法规也在兴起。
4、1/2(51%)的受访者使用内部数据科学团队来构建机器学习模型,而来自云供应商的AutoML服务的使用率很低,而且这种分化在成熟的团队中更加明显。经验较少的公司往往依赖于外部顾问。
5、成熟的团队倾向于让数据科学领导者设定团队的优先事项,并确定项目成功的关键指标——这是传统软件工程中通常由产品经理执行的职责。
要深入的了解这些观点和更多内容,请下载免费报告《企业中机器学习采用状况》,其中包含我们机器学习采用调查的全部结果。
参加9月11日-9月13日在纽约举办的全球顶级大数据会议Strata Data Conference,对机器学习有更深入、更广泛的理解。