Machine Learning,经过几十年的发展,特别是近年来工业界的大规模应用和媒体界的推波助澜,得到越来越多人的关注,并且越来越多的人进入相关的行业,促进整个生态的发展。
从何处来?
机器学习(ML)是人工智能(AI)发展过程中逐渐形成的一种基于数据解决方案。AI是目标,ML是手段。因此不排除有其他手段达到AI的效果。
比如在ML前采用的是大量的人工规则,人工规则属于总结的先验知识,编码在系统中提供服务,对于复杂的情形,人工规则覆盖率太低。
而机器学习范式,通过数学模型,从历史数据中学习发现规律,从而解决现实问题。相对于人工规则,覆盖率高。
人工规则具有高准确性,而机器学习抖动性大(每次学习后,对于相同的数据,得出的结果可能不同)。工业上的系统,大都是流量金字塔模式,先经过人工规则,而后经过多级机器学习系统。
近年来深度学习(DL)如日中天,大有唯我独尊之势,是ML发展过程中形成的新范式。未来会出现什么新的物种,本人才疏学浅,未能想象的到。
以下是AI、ML、DL间的关系:
学习什么?
机器学习采用数据模型,从数据中,总结规律。那么,机器学习本质上到底在做什么呢?把模型看做是人脑,模型的参数是人脑中的知识;数据是经验,用于更新人脑中的知识。主观世界根据客观事实的改变而更新(对于人而言,"狗改不了吃屎",机器学习也有类似的情形)。对于新的情形,人脑根据目前的知识做决策,机器学习根据目前的参数做决策。
机器学习系统
工业界搭建一个完整的机器学习系统,需要考虑多个方面问题,如下:
数据是搭建机器学习系统的前提,这也是为什么机器学习没有在全行业推广的原因。
工程是搭建机器学习系统的门槛,没有一个好的工程团队,运行大规模系统困难重重。
算法只是整个机器学习系统的一部分。在机器学习前,这一部分是人工规则,现阶段是人工规则 + 算法。
算力影响算法的迭代速度。
机器学习分类
机器学习,整体上分为监督学习、半监督学习、无监督学习、强化学习。
监督学习:监督学习是小学时代,全靠老师教,学生学。学生能学到多少,取决于学生的悟性,即模型的容量。
半监督学习:半监督学习是大学时代,老师指点 + 学生自学。
无监督学习:无监督学习是自学时代,全凭学生自己从实践中不断的悟。
强化学习:强化学习是智能时代,学生的每一次实践,都能得到客观世界的反馈,大脑依据每一次的反馈进行学习,进而影响下一次实践。