一、相关概念的简介
在了解深度学习前应该还有两个专业名词大家也想必是耳熟能详,那么就是人工智能、机器学习。
人工智能(Artificial Intelligence)
:也就是我们经常听到的AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。但是在早期的时候,人工智能充满了局限性,只是在特定的环境范围下。机器学习(Machine Learning)
:简称ML。机器学习其实是人工智能的一个分支。如果一个程序可以在任务(T)
上,随着经验(E)
的增加,效果(P)
也可以随之增加,则就可以说这个程序可以从经验中得到学习。深度学习(Deep Learning)
:简称DL。深度学习也是机器学习的一个分支。主要是在机器学习的基础之上有所改进:它除了可以学习特征和任务之间的关联,还可以自动的将简单的特征组合成更加复杂的特征,并使用这些组合特征解决问题。
二、了解机器学习(ML)
1. 用例子认识机器学习的概念
其实,邮件系统中判断收到的邮件是否为垃圾邮件就可以看做是一个机器学习的过程。首先对垃圾邮件分类概念进行一个拆分、类比:
一个程序
<======> 需要用到的机器学习算法,比如逻辑回归算法任务
(T)
<======> 区分此邮件是否是垃圾邮件这个任务经验
(E)
<======> 已经区分过是否为垃圾邮件的历史事件效果
(P)
<======> 机器学习算法在区分此邮件是否是垃圾邮件这个任务的精确率
在整个过程中,首先会从每一封邮件中抽取出对分类结果可能有影响的因素(比如:发件人的地址、邮件的标题、收件人的数量、邮件正题内容,so on)。这样的每一个因素
其实可以成为是一个特征
(feature)
。然而机器学习算法中的逻辑回归算法可以从训练数据中计算出每个特征和预测结果的相关度。例如,在垃圾邮件分类过程中,可能会发现如果一个邮件的收件人越多,那么这封邮件是垃圾邮件的可能性越大。
在对一封完全未知的邮件进行区分时,逻辑回归算法会根据这封邮件中抽取到的每一个特征以及这些特征和垃圾邮件的相关度进行判断是否为垃圾邮件。
所以,从例子中不难看出:一般情况下,在训练数据
达到一定数量之前,越多的训练数据可以使得逻辑回归算法
对未知邮件做出的判断越精确
。
也就是说
逻辑回归算法
可以根据训练数据【经验(E)】
提高垃圾邮件分类问题【任务(T)】
上的准确率【效果(P)】
2.机器学习的分类
- 有监督学习(Supervised Learning)
有监督学习可分为
回归
和分类
问题。例如上述示例垃圾邮件分类就属于有监督学习。
1.在回归问题中,我们会预测一个连续值;也就是我们试图将输入变量和输出用一个连续函数对应起来。
2.在分类问题中,我们会预测一个离散值,我们试图将输入变量与离散的类别对应起来。
- 无监督学习(Unsupervised Leanring)
这种学习方式,数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。
- 增强式学习(Reinforcement Learning)
输入数据作为对模型的反馈,不像监督模型那样,输入数据仅仅是作为一个检查模型对错的方式,在强化学习下,输入数据直接反馈到模型,模型必须对此立刻作出调整。