机器学习入门总结(一):概述

什么是机器学习?

第一个机器学习的定义来自于Arthur Samuel,他定义机器学习为:在不直接针对问题进行编程的情况下,赋予计算机学习能力的一个研究领域。

我个人来讲更倾向于第二种定义方式,我觉得第二种定义方式更容易去理解,是由CMU的Tom MItchell提出:对于某类任务T和性能度量P,如果计算机程序在T上以P衡量的性能随着经验E而自我完善,那么就称这个计算机程序从经验E学习。

简单的解释一下任务T、性能度量P和经验E。前段时间热度非常高的AlphaGo Zero想必大家都有所了解,它通过与自身的棋局对弈来进行学习,之后在对战中战胜诸多高手。实际上在这个学习的过程中,经验E就是AlphaGo Zero成千上万次的自我练习,任务T就是下棋,而性能度量值P,就是它在与其他人对战时获胜的概率。接下来详细解释涉及到的概念

任务T

通常机器学习任务定义为机器学习系统应该如何处理样本。样本是指我们从某些希望机器学习系统处理的对象或事件中收集到的已经量化的特征的集合。我们通常会将样本表示成一个向量

其中向量的每一个元素xi(i小写,你们知道是啥就行,简书编辑公式太难搞)是一个特征。
举个例子。影响房价的因素有面积,位置等,在本例中的每个样本是指每一套房子的面积、位置和房价,而在这其中两个影响因素面积和位置都是该房子具有的特征。后面还会继续细说这个问题。(关于基本术语的解释,在此强推周志华老师的《机器学习》,P2-P3解释的很详细且通俗易懂)
机器学习可以解决很多类型的任务,比如分类、回归、机器翻译和缺失值填补等,在此不多赘述,如果感兴趣可以通过其他资料了解。

性能度量P

为了评估机器学习算法的能力,我们必须设计其性能的定量度量,通常性能度量P是特定于系统执行的任务T而言的。对于分类等任务,我们通常度量模型的准确率。准确率是指该模型输出正确结果的样本比率。我们也可以通过错误率得到相同的信息。错误率是指该模型输出错误结果的样本比率。
关于具体的评估方法,后续还有文章对其进行详细讲解。

经验E

根据学习过程中的不同经验,机器学习算法可以大致分类为监督学习算法和无监督学习算法。

监督学习

监督学习算法训练含有很多特征的数据集,不过数据集中的样本都有一个标签。例如,kaggle上著名的问题“猫狗大战”,在数据集中注明了每个图像分别是猫还是狗,监督学习算法通过研究测试集,学习如何根据训练集中提取来的特征来将测试集的图片分为猫和狗两类。
简单说监督学习的基本思想就是,数据集中的每个样本都有相应的“正确答案”,再根据这些样本对其他样本进行预测。

无监督学习

无监督学习算法训练含有很多特征的数据集,然后学习出这个数据集上有用的结构性质。聚类算法是典型的无监督学习算法。不同于监督学习,无监督学习中没有任何的标签。我们预先不知道样本应该属于哪一类,通过学习数据集的特征,我们自行将数据集分成若干类,将每个样本归到某一类中。

写在后面

本文是对机器学习的定义做了一个最基本的解释,算是为我后续的总结开了一个头吧。鉴于本人水平有限,所接触的都是通过自学,入门时间短,甚至说还没能入门。。。文中如有出现错误,欢迎大家指正!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,222评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,455评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,720评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,568评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,696评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,879评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,028评论 3 409
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,773评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,220评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,550评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,697评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,360评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,002评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,782评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,010评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,433评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,587评论 2 350

推荐阅读更多精彩内容