机器学习到底是个啥

机器学习是装逼神器?

曾几何时,当我还在本科打dota 玩屁股的时候,身边总有一帮大神。听他们谈话我的心情是。。。


大佬中有各路高手前端、后段、java三大架构。。。但最令本渣一听到就仰慕甚至肃然起敬的是当听到卷积神经网络的时候。顿时就有种掉线三十分钟别人都是六神装的感觉。另外,班会上别班小哥用说用机器学习把图片转换成梵高风格时自己班妹纸那一声声尖叫怕是很难忘掉了。。。

好在家里爸妈给了次重新做人的机会,来到美帝在选了可能是学校最恐怖的一门课python机器学习后,我发现装逼原来也没那么难嘛。。。不过毕竟付出了巨大的发量,所以想着要趁着暑假赶紧记下来,以后跟崽吹个逼啥的。。。哈哈哈


机器学习是数据挖掘

机器学习就是用一大堆数据来训练模型以作出判断或预测。机器学习中有很多的模型(Logistic Regression, SVM, CNN...看不懂?没关系,点个关注后面会一个个讲的),但不论你用那个模型都离不开数据啊,抛开数据谈那就是裸奔。另外我会告诉你,机器学习最快乐的时刻就是搭建完模型看着机器训练数据抛出一行行输出的时候吗?简直比玩口袋妖怪这种养成类游戏还要爽!

不会做gif...



机器学习是求极值

好了,敲黑板。。。到了今天的干货时间了。在说明为什么机器学习是求极值前我们先来回顾下高中求极值的题目我们都是怎么做的。

首先,我们有一个函数f(x)长得下面这样


图片来源知乎

我们先对他求导得到他的导函数g(x), 然后令g(x)=0 得到三个点x_{1},x_{2},x_{3} ,由左右导数的正负情况判断出x_{1},x_{3}是极小值。再带回到f(x)算出f(x_{1})f(x_{3})要小,所以函数在x_{1}处有最小值。

说了这么多,那和机器学习有啥关系咧。。。


是不是一上这张图,顿时就嗅到神经网络高大上的气息。然鹅上面这张图最坑的地方在于除了感觉高大上对新手也太不友好了,把这些饼饼和线连起来是要干嘛呀。所以我们还是看自己画的把。。。

自己画的

首先每个圆粑粑神经元里是有值的,叫做activation(激活值),每条线上也是有值的叫做weight(权重),而每一列神经元叫做一个layer(层)。

那么问题来了,第二层神经元里的值怎么来的呢?没错!就是第一层里三个神经元分别乘上与自己相连的权重——5*100+2*10+0*1=520。 

下面我们想象一下这个场景,假设第一层里三个值分别代表一个人腰的宽度,胸的宽度和脸的宽度。我们想要根据这三个值来判断一个人是不是小肥肥。由常识可知,脸大不一定胖,胸大不一定胖但一般腰要是很宽的话。。。额那就很有可能和我一样要快乐起来了。。。哈哈哈。所以我们希望与脸宽相连的权重小一些,与胸宽相连的权重也稍微小一些,与腰宽相连的权重大一些,这样我们就可以通过第二层神经元的值的预测是否肥胖——1:小肥肥,0:不肥肥

那么具体这些权重是怎么设置的呢,当然不是手动去设的啦。虽然远古时期的前辈真的造过那种用扳手手动调节的机器这应该叫人工学习吧。。。  要回答这个问题就要引出我们的下一个概念——Loss function(损失函数)

损失函数是用来量化预测值与实际值差别的函数。最经典的是MSE(Mean Square Error)                {\displaystyle \operatorname {MSE} ={\frac {1}{n}}\sum _{i=1}^{n}(Y_{i}-{\hat {Y_{i}}})^{2}.}

学机器学很重要一点就是别被公式劝退了,MSE很简单其实就是预测值与实际值的差值(也叫残差)的平方。平方过后就不用担心正负误差相互抵消了。

我们希望预测值与实际值越接近越好,也就是希望损失函数越小越好。那怎么减小损失函数的值呢,答案就是前面说的修改权重也就是线上的值。哪些想要修改神经元里值的同学注意了,第一层神经元里值是样本的数据,也就是每一个人具体的脸宽、胸宽、腰宽,是改不得的(别绝望,有毅力的同学还是可以减肥的。。。)

那怎么修改权重的值来使得损失函数的值最小呢?还记得前面求极值的例子吗,我们也是先求损失函数对权重的导数。但接下来我们不是直接令导函数为零了,因为这个零点求不出啊(后面我们会细讲零点为啥不好求)。那我们怎么办呢,我们朝导数的相反方向一小步一小步挪啊!!! 所以作为一名严谨的up,正如我们前面所说机器学习是求损失函数的极小值,而不保证可以求到最小值 ,当然我们有很多办法来尽可能向最小值逼近。

图片来源:quora

最后想起了高中数学的老师一句话——人生的目标就像求最小值,没有那么简单。但坚持下,说不定下个极值就是!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,530评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,403评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,120评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,770评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,758评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,649评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,021评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,675评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,931评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,751评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,410评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,004评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,969评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,042评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,493评论 2 343

推荐阅读更多精彩内容