机器学习——机器学习概论


上半年的alphago围棋大战李世石,以4:1的比分大胜李世石——新浪科技-AlphaGo最终局战胜李世石 人机大战总比分1:4,这也让人工智能再一次的吸引了全世界人的目观,其中的一些词汇也是火了一把,人工智能(Artificial intelligence),深度学习(Deep learning)以及DeepMind。这里稍微解释以上几个词汇。

人工智能:人工智能格式计算机科学的一个分支,它研究的是计算机模拟人的意识,思维方式来处理问题。就是说计算机能像人一样思考。

深度学习:深度学习是只是机器学习的一类方法,机器学习是人工智能的一个分支,主要是实现人工智能的一些方法,可以说是方法论。

DeepMind:DeepMind只是一个组织,主要研究方向也就是深度学习相关内容。现在被Google收购

机器学习概论

深度学习是一种特殊的机器学习machine learning)方法,为了更好的理解深度学习,首先要对机器学习的主要内容有一个大致的了解。接下来的一些章节是机器学习的一些重要的方法。这样对于新手读者或者那些想要对机器学习有一个更加广阔了解的人来说基本都能全面覆盖。如果你对机器学习的基本方法比较了解可以略过这些内容。

我们先定义学习算法到底是什么,提出以下的例子:线性回归算法Linear regression algorithm)。然后,我们会继续描述如何拟合训练数据发现其模式,把该模式推广到新的数据中。这其实就是学习的基本定义,能从训练数据中学到“知识”,然后把该“知识”应用到新的数据中。大部分机器学习算法需要学习的其实是模型的参数。为了得到该学习的模型一般是最小化一个代价函数,该函数需要求解的未知数就是模型的参数,而该模型的已知变量就是训练数据集。机器学习的本质是应用统计学习,统计训练数据的模型得到一系列的规律。

大部分的机器学习方法可划分成以下两种:监督学习(supervised learning)和无监督学习(unsupervised learning)。对于这两种分类,我也会给出一些学习算法的实例。大部分的机器学习(深度学习)问题都是通过随机梯度下降的方法解决的,随机梯度下降是一种优化算法,简单来说就是求解代价函数的方法。所以把机器学习可以看成是以下的几个组成:一个代价函数,一个模型,一个数据集和一种求解的算法。

学习算法

一个机器学习算法其实就是能从数据中学到“知识”的一种方法。但是如何定义学习呢?Mitchell 1997年给了一个定义:一个计算机程序通过经验E完成了一个任务T,评价它的性能的办法是P。所以这章的内容将会从机器学习的任务T,评价方法P和经验E来展开。

机器学习任务

机器学习可以解决一些人类能够解决的任务,如果是提供一些训练数据和一个任务,机器学习能做的效果也是接近于人类的。一般的,机器学习要做的事情是对于一个样本该如何处理。这个样本可以用特征来表示,也就是说一个样本可以通过一个n维的向量来表示,$x \in R^n$。比如一幅图像可以用像素值来表示。

许多任务都能通过机器学习来解决,包括以下的任务:

分类(classification)

在这个任务中,计算机程序需要讲一个样本分在K个类中的一个。K是指所有的类别的个数。为了解决这个问题需要得打这样一个函数$f: R^n \rightarrow {1,...,K}$,该函数$y=f(x)$可以表示从样本x到类别标签y的映射。这样的一个函数就能解决我们需要的分类任务。一般的,函数f的输出是一个概率分布,它是指样本x属于每一个类别的概率,概率最高的那个即是x的类标。一个分类的例子就是物体识别(Object Recognitions),即给定一张图像,判断这张图像属于什么物体。

CIFAR-10

现在解决物体识别任务基本最好的方法都是深度学习(Krizhevsky et al 2012

回归任务(Regression)

在这个任务中,计算机程序需要的是在给定一个输入时,输出一个数值。解决该任务需要得到的函数是 $f:R^n \rightarrow R$,该任务与分类任务很像但不同的地方是输出是一个数值(连续的)而不是一个类标(离散的)。例如我们要预测从某地到另一地所需要的时间,输入的可能是两个地点或者一连串地点的坐标信息,需要输出的是花费的时间time。再比如本文开始alphago下围棋问题,计算机程序要做的是在当前状态下判断最佳的下棋位置,即计算每一个空位的得分。

机器翻译(Machine Translation)

在机器翻译的任务中,给定某种语言的一个文字序列,需要翻译成给定语言,即得到另一个文字序列。比如中文翻译成英文,现在常用到的一些应用包括Google翻译,百度翻译都是机器学习的成果。现在机器翻译大都是基于深度学习的一些方法。

其实还包括许多的机器学习任务,比如推荐系统,结构输出,聚类,目标检测等。还可以通过应用分成三大类,一个是对于图像的处理,还有一个是对于文本处理和语音。对于图像比如给图像着色,找出图像中的人脸,找出背景图,识别图片中的物体,描述一幅图像等。对于文本处理比如机器翻译,文本分类,文本的情感分析,文本总结,阅读理解等。语音可以是语音识别,生成语音等。能想到的很多任务都是机器学习的常见任务,大概机器学习的终极目标就是解决人类能解决的所有问题吧。

性能方法

为了评价一个机器学习算法的能力好坏,需要设计一个性能的评价方法P,不同的机器学习任务一般有不同的评价方法。对于一个分类任务,评价办法就是对于给定一个测试集合,分类之后计算其分类的正确率(Accuracy),即算法分类得到正确结果的比例,也可以用错误率来评价。正确率越高(错误率越低)则该算法的性能越好,否则越差。而对于一个回归问题,可以计算预测结果与正确结果的误差来评价。总误差越小说明算法的性能越好。对于一些其他的机器学习的评价也可以通过误差来计算。有了评价方法就可以判断机器学习算法的性能,人们根据这个来挑战更加好的机器学习算法。

参考�

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,362评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,330评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,247评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,560评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,580评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,569评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,929评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,587评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,840评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,596评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,678评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,366评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,945评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,929评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,165评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,271评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,403评论 2 342

推荐阅读更多精彩内容