1.机器学习,神经网络,深度学习和人工智能之间有什么关系?
· 神经网络是深度学习的“根基”。
· 深度学习是机器学习的一个分支。
· 机器学习是人工智能领域的一种技术。
对于机器学习而言,核心内容是:算法("学习的能力")和数据("学习的素材")。在传统的机器学习模型中,算法往往是比较关键的部分;数据虽然也至关重要,但往往会着重要求它的“质量”而非“数量”。
对于神经网络模型,数据的“数量”往往是最为重要的一环(当然,质量也很重要),这也是为什么不少人称之为“数据驱动的模型”。
“AlphaGo Zero”它没有利用任何数据、从头学习的围棋AI,但其最终性能却比以往所有利用了数据的围棋AI都要强。AlphaGo Zero的成功虽然确实说明了数据在特定领域并不是必须的,但却并不能说明数据的重要性降低了。事实上我们在讨论围棋时,常常以其“规则简单却博大精深”来赞扬它,而这个“简单规则”很可能恰恰的AlphaGo Zero无须人工数据的关键。 但,当面对一个实际问题时,规则常常是模糊且充满不确定性的,此时大量的数据是不可或缺的。
模型Model:用数据来训练模型G,并让模型G能够解决一系列特定的事情。
参数Parameter:参数决定模型的行为,训练的目的就是找到一个能够使模型表现最好的值。
超参Hyper Parameter:与参数不同,不是训练模型得到,而是可以人为设置的参数。
空间Space:是一个后缀词,“模型空间”指“所有可能的模型”, “参数空间”指“所有可能的参数”, “样本空间”指“所有可能的样本”。
数据集Data Set:所有数据的集合,还可以划分为训练集、测试集、评估集(交叉验证集)。
样本Sample:数据集中的一条数据。
特征向量Feature Vector:常常是模型输入的来源。
标签Label:模型训练的目标。
获取数据集是一个不容易的过程,以下是两个非常著名、含有大量真实数据集的网站:OpenML UCI