1.机器学习概念:
机器学习是人工智能(AI)的一部分,研究如何让计算机从数据学习某种规律;是用数据或以往的经验,并以此来优化程序的性能标准。
机器学习、深度学习、人工智能三者的关系可用下图中的集合表示。从范围上来说,人工智能包含机器学习,而机器学习又包含深度学习,三者的关系是在表示的范围上是逐渐缩小的。
人工智能泛指让机器具有人的智力的技术。这项技术的目的是使机器相认一样感知、思考、做事、解决问题。人工智能是一个广泛的技术领域,包括自然语言理解、计算机视觉、机器人、逻辑和规划等。它可以被看做计算机专业的子领域,除了和计算机相关,它还和心理学、认知学、社会学等有不少的交叉。
机器学习指计算机通过观察环境,与环境交互,在吸引信息中学习,自我更新和进步。跟进一步的说,机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测。
机器学习的对象是:具有一定的统计规律的数据。
机器学习的目的:让机器学习替换手动步骤,减少企业的成本也提高企业效率。在《统计学习方法》一书中介绍机器学习主要包含:算法、策略、优化 三个方面。
2.机器学习的划分
1).根据学习任务的类型,机器学习可以划分为:
有监督学习:从已标记的训练数据来训练模型。 主要分为:分类任务、回归任务、序列标注任务。
无监督学习任务:从未标记的训练数据来训练模型。主要分为:聚类任务、降维任务。
半监督学习任务:用大量的未标记训练数据和少量的已标记数据来训练模型。
强化学习任务:从系统与环境的大量交互知识中训练模型。
2).根据算法类型,机器学习可以划分为:
传统统计学习:基于数学模型的机器学习方法。包括SVM、逻辑回归、决策树等。
这一类算法基于严格的数学推理,具有可解释性强、运行速度快、可应用于小规模数据集的特点。
深度学习:基于神经网络的机器学习方法。包括前馈神经网络、卷积神经网络、递归神经网络等。
深度学习算法是基于神经网络的学习方法,它的可解释性较差,强依赖于数据集规模,只有在拥有大量训练样本的时,才能发挥作用。目前,深度学习算法在语音、视觉、自然语言等领域非常成功。