想入门机器学习，先弄懂这8个基础概念

2018.01.08 10:14

【AI大学】课外补习

这2天很多地区都下起了2018年第一场大雪，班主任在这里提醒大家，出行要注意安全哦。

今天咱们要学习的课程是机器学习的8个基础概念。

01、监督学习

根据训练方法的不同，机器学习可分为：监督学习，无监督学习，半监督学习，强化学习。

在这里我们讲2种机器学习的常用方法：监督学习，无监督学习。

监督学习是从标记的训练数据来推断一个功能的机器学习任务，可分为“回归”和“分类”问题。

定量输出称为回归，定性输出称为分类，比如根据房屋的地理位置，房屋面积大小，以及房屋周边的配套设施等因素，来预测下给定房屋的价格，这就是典型的回归问题。

根据图片识别出图片中的物体是猫还是狗，这就是典型的分类问题。

02、无监督学习

无监督学习也被称为非监督学习，无监督学习和监督学习最大的不同在于，事先没有任何训练样本，而需要直接对数据进行建模。

无监督学习只能默默的读取数据，自己寻找数据的模型和规律，比如聚类（把相似数据归为一组）和异常检测（寻找出一组数据的不同一个），在无监督学习中给定的数据没有任何标签或者说只有同一种标签。

比如小时候我们还不认识钱币的时候，看到一堆纸币和硬币，会很自然的把纸币和硬币分开，这就是聚类的最简单原理。

03、过拟合

过拟合一般是在回归算法中的，是指训练出的模型和训练数据集一致性非常高，影响到新数据结果的预测。

避免过拟合是分类器设计中的一个核心任务，通常采用增大数据量和测试样本集的方法对分类器性能进行评价。

举个简单的栗子，高中的时候老师不太提倡我们弄题海战术，为什么？

因为题海战术里我们只是机械的记住了每道题的答案，但并没有把题目中原理抽取出去，等遇到新的题目，依旧还是不会做。

04、决策树

决策树是一种十分常用的分类方法，机器学习中，决策树是一个预测模型，代表的是对象属性与对象值之间的一种映射关系。

决策树顾名思义是一个树结构，每个非叶节点表示一个特征属性上的测试，每个分支代表这个特征属性在某个值域上的输出，而每个叶节点存放一个类别。

决策树最典型的案例就是周志华老师《机器学习》（西瓜书）中所提到的，通过纹理，根蒂，触感来判断一个西瓜是好是坏。

图摘自周老师的西瓜书

05、自然语言处理

自然语言处理技术主要是让机器理解人类的语言，近几年随着语音交互的热度不断提高，语音识别，自然语言理解，自然语言生成等名成开始逐渐出现在大家的视野里。

其实这些大热名词都是自然语言处理技术里某一个分支技术，自然语言理解是指计算机通过一定的运算理解了人类输入的文本，自然语言生成是将计算机所特有的逻辑性表达转成人类生成的文本。

这2项技术在现在的聊天机器人如阿法蛋等中，很是常见。

06、数据挖掘

数据挖掘又称为数据采矿，说到数据挖掘的时候，通常都会提到另外一个词：数据分析。

不少人都认为数据挖掘=机器学习+数据库，这样认为基本没问题，简单来说数据挖掘就是在数据库中，自动发现有价值的信息，并对其进行分析，也就是我们常说的KDD（Knowledge Discovery in Database）。

数据挖掘的任务主要有四块，聚类分析，预测建模，关联分析，异常检测，这四块可独立运行，也可联合操作。

07、感知机

感知机是比较入门的机器学习算法，相对于其他复杂算法，感知机较好理解，它是二分类的线性分类模型，输入为实例的特征向量，输出为实例的类别。

感知机模型的数学定义为：假设输入空间(特征空间)是X⊆Rn ，输出空间是 y={+1, -1}。

由输入空间到输出空间的如下函数：

f(x)=sign(ω⋅x+b)

其中，向量 ω=(ω(1),ω(2),...,ω(n)) 是一个符号函数，即：

sign(x) =\begin{cases} +1, & x \geqslant 0 \\[2ex] -1, & x \lt 0

08、神经网络

神经网络是一个非常广泛的机器学习模型集合，一般指向2种，一个是生物神经网络，一个是人工神经网络。

神经网络最为重要的用途就是分类，比如让机器把一张照片上的动物区分出是猫还是狗，它的主要思想是模拟人类大脑的行为来处理数据。

神经网络的基础在于各个神经元，神经元本来是生物学上的名词，人们对生物神经系统进行研究，以探讨人工智能的机制时，把神经元数学化，从而产生了神经元数学模型。

好了，今天就讲到这里啦，这8个基础名词概念，大家在以后的学习中会经常碰到，一定不要弄混淆哦~

AI学习，天天向上。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 217,907评论 6赞 506
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,987评论 3赞 395
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,298评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,586评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,633评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,488评论 1赞 302
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,275评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,176评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,619评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,819评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,932评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,655评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,265评论 3赞 329
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,871评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,994评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,095评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,884评论 2赞 354

想入门机器学习，先弄懂这8个基础概念

推荐阅读更多精彩内容