算法有没有突破都需要标注,没有突破更需要标注。数据是人工智能的核心之一。获取高质量的标注数据对于人工智能项目的成功至关重要。AI标注未来必定成成为人工智能产业链中的一环,只是在我看来先解决标注公司还处于原始阶段。
为什么这样说呢?
大多数标注团队(公司)都还处于刀耕火种的阶段:
一方面,没有看到使用主动学习大幅降低标注需求的团队。使用主动学习,模型与标注联动,绝对是AI标注未来发展的重要方向,主动学习可以使得需要标注的数据量成数量级减少。但需要模型辅助。而现在还没有这种把主动学习算法和模型做深做透的标注公司。
一方面,人工智能项目不仅仅需要标注样本,还需要大量对抗样本对模型性能进行检验。这时候要求标注团队更加类似一个安全团队,对人工智能模型进行扫描和检测,发现其中的漏洞,并提供解决方案。而现在还没有这种把人工智能安全做深做透的标注公司。
一方面,标注永远不只是标注,更应该成为业务的参与者。标注需要理解业务,为业务和算法团队提供更加合理的标注服务,而如今的标注团队基本都是等着业务和算法定制好需求,被动的去完成需求。而现在还没有这种把业务数据做深做透的标注公司。
说实话,我觉得这些都是很好的创业方向。