先说明下:
本系列blog重点在于最前沿AI技术的实践使用:包括CNN在移动终端上的应用和优化、增强学习的实际使用、如何一步一步打造一个和google 翻译一样的结合图像预处理+AI识别+AR跟踪显示的app等。
因此前几章的技术介绍只是大纲和介绍性质,会比较精简,其中会包括一些文章链接要去看看,我也会尽量以直观的形式去说明这些数学概念和模型。
首先,建议完全没有接触过机器学习概念的人看看这篇文章:http://blog.jobbole.com/67616/,里面没什么大段的数学公式,真的简单易懂,实属最简单的AI入门介绍。
一,人工智能、机器学习、深度学习之间的关系
大家可能经常遇到这3个名词,这3者间是什么关系,一图简言之:
上图的意思是:机器学习是人工智能的子类,深度学习又是机器学习的子类。
1)机器学习—— 一种实现人工智能的方法
机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。
2)深度学习——一种实现机器学习的技术
深度学习就是一种特征学习方法,把原始数据通过一些简单的但是非线性的模型转变成为更高层次的,更加抽象的表达。通过足够多的转换的组合,非常复杂的函数也可以被学习。
https://sdk.cn/news/5098深度学习和机器学习关系
http://www.36dsj.com/archives/20382 一文读懂机器学习这篇文章,介绍得更加全面,看完后基本就对AI领域的技术概念都会大致了解了。
二,机器学习分类
1)按有无label分
按数据样本是否有label ,机器学习大体上可以分为3类:有监督学习、无监督学习、半监督学习。有label是指,已经给数据做了标注,比如把一幅图片归为猫,把另一张图片归为狗。
2)按任务分
机器学习的主要任务有:分类、回归、聚类等。
定量输出称为回归,定性输出称为分类:将实例数据划分到合适的分类中,即分类问题,回归主要用于预测数值型数据。回归的目标是连续的,分类的目标是离散的。 举个例子:预测明天的气温是多少度,这是一个回归任务;预测明天是阴、晴还是雨,就是一个分类任务。
分类和回归属于监督学习,之所以称之为监督学习,是因为这类算法必须知道预测什么,即目标变量的分类信息。
对于无监督学习,此时数据没有类别信息,也不会给定目标值。在无监督学习中,将数据集合分成由类似的对象组成的多个类的过程被成为聚类;将寻找描述数据统计值的过程称之为密度估计。此外,无监督学习还可以减少数据特征的维度,以便我们可以使用二维或者三维图形更加直观地展示数据信息。
回归方法主要有:线性回归,GBRT,深度神经网络DNN等算法。
分类方法相对多一些: GBDT,DNN,CNN,RNN。
聚类的话,主要针对无监督学习,方法上有k-means,psc等。
三,深度学习分类
深度学习主要有DNN、CNN、RNN等分类,最新的增强学习、GAN等新方向会在后面文章中介绍。
这里就不展开说明深度学习原理了,大家看看下面的链接文章效果更好:
https://www.zhihu.com/question/34681168 CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构详解。
https://www.zybuluo.com/hanbingtao/note/433855 零基础入门深度学习。
下一章将介绍深度学习的重要部分:CNN卷积神经网络,建议大家把本文的链接文章多看看。