机器学习笔记(1)

机器学习笔记(1)

参考书:周志华《机器学习》

第1章 绪论

Part1 基本概念

1.机器学习的研究内容:如何从数据产生模型(学习算法)

2.数据集样本属性属性值

3.属性空间输入空间):由属性张成的向量空间,由此,每一个样本可以表示为一个向量

4.学习训练):由数据建模的过程,所使用的数据称为训练数据,相应的样本称为训练样本,数据集称为训练数据集

5.假设真实:训练所得模型为假设,规律本身为真实,学习要使假设尽可能逼近真实

6.标记样例:已经发生的已知的结果称为标记,拥有标记的样本称为样例

7.标记空间输出空间):由标记张成的空间,每一个样例表示为一个向量

8.泛化能力:模型不能只针对样例有效,对于未知的新样本也要有效,这种能力称为泛化

Part2 机器学习的分类

1.按有无样本空间分:

  • 有监督学习,包括分类回归
  • 无监督学习,包括聚类

2.按预测值的类型分:

  • 分类:预测值离散预定
  • 回归:预测值连续
  • 聚类:预测值离散不预定,其自动形成的组称为

Part3 机器学习的抽象过程

1.科学推理的基本手段:

  • 归纳:由特殊到一般,泛化
  • 演绎:由一般到特殊,特化

2.机器学习一般是指归纳学习

3.归纳学习分为:

  • 广义:模型视为黑箱
  • 狭义:能抽象出概念,又称概念学习

4.假设空间:由所有假设构成的空间,学习的过程就是在假设空间中找到最合适的假设(也就是模型)的过程

例如:有以下数据集

样本序号(采样的西瓜) 属性A(色泽) 属性B(根蒂) 属性C(敲声) 标记Y(是否为好瓜)
1 0(青绿) 0(蜷缩) 0(响亮) 1
2 1(乌黑) 0(蜷缩) 0(响亮) 1
3 0(青绿) 1(硬挺) 1(沉闷) 0
4 1(乌黑) 0(蜷缩) 1(沉闷) 0

其假设空间为{(0,0,0),(0,0,1),……(1,1,1)}的所有子集的集合,从其中搜索到(0,0,0)+(1,0,0)是符合的,则其假设为{(0,0,0),(1,0,0)},可以构建模型,Y=(非B)(非C),这就抽象出了一个概念:“根蒂蜷缩且敲声响亮的瓜为好瓜”,这个例子是概念学习中最简单的一类——布尔值概念学习*

5.版本空间 :符合条件的假设可能不止一个,所有符合条件的假设构成的空间为版本空间

6.归纳偏好 :事先无法判断版本空间中哪一个假设最好,但又必须输出一个确定的模型,因此一个学习算法必须有归纳偏好,常用如下:

  • 尽可能特殊复杂
  • 尽可能一般简单,即奥卡姆剃刀法则

7.NFT定理 :学习算法不影响总误差,即"No Free Lunch",所以我们不能一概而论说某个学习算法最好,而要具体问题具体分析

8.小结:什么是学习

(1)数据->模型

(2)特殊->一般

(3)样本空间->版本空间

Part4 机器学习理论的发展历程

1.推理期(二十世纪五十到七十年代初):机器要有逻辑推理能力,Newell和Simon的”逻辑推理家“

2.知识期(二十世纪七十年代中期):机器要有知识,Feigenbaum的”知识工程“

3.学习期(至今)

(1)连接主义:基于神经网络,例如”感知机“,BP算法

(2)符号主义:基于逻辑表示,例如”结构学习系统“,归纳逻辑程序设计(ILP)

(3)决策主义:基于决策理论,例如”学习机器“,决策树

(4)统计主义:基于统计理论,例如SVM,核方法

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,558评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,002评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,024评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,144评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,255评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,295评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,068评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,478评论 1 305
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,789评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,965评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,649评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,267评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,982评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,800评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,847评论 2 351

推荐阅读更多精彩内容