跟我一起学人工智能(二)

跟我一起学人工智能(二)

文 | 小步

上一篇文章里简单说了下机器学习、深度学习的几个概念,如果你已经看完了上篇文章,还是建议你去搜索下这几个名词的权威解释,更能加深你的理解,也使你对这些概念的认识更加严谨和规范~

话不多说,这篇重点说下机器学习重要的两大模型:线性回归和逻辑回归模型。

学习之前你需要学会如下知识:

函数(一次函数、二次函数、反比例函数、三角函数等),导数,偏导数,矩阵知识。

如果对上述不懂,可以去万能的b站学习下高数,线代,离散,也不用全部都学,用啥学啥就好了~

这篇文章因为涉及很多数学方面知识,好多细节也没有表述清楚,再加之自己也没有理解透彻,如果想要学习的话,还是建议去b站看下ng的视频,从2-1开始看~

传送门:https://www.bilibili.com/video/av9912938/#page=6

如有此篇文章有不妥之处,还麻烦告知我下,大家共同进步!微信公众号:多一点思考

线性回归模型

通过一个房子的面积,房间数量等等,估算出这个房价是多少。

通过人均GDP,国民总收入等预测未来人口自然增长率。

研究用户的满意度与产品的颜色,重量,大小等之间的关系,改善产品。

…………

以上每个案例都其实可以用线性回归模型来解决,它们的特点:

需要先给模型输入大量的数据以及每条数据对应的标签值,如房子的面积,房间数量等的矩阵X(房子的面积,房间数量等属性称作特征量,矩阵X称作训练集)以及对应的房子价格的矩阵Y(矩阵Y称作预测集

矩阵X内每个元素的上标表示第几条数据,下标表示第几个特征量,如X上标2,下标3,表示训练集的第2条的第3个特征量。

矩阵Y对应训练集的每行的结果值。

有点迷糊?拿预测房价举例子,矩阵X的每行仅有两个特征量,房子面积和房间数量,矩阵Y每一行对应矩阵X的每一行特征量的房价。

线性回归就是通过矩阵X,Y和算法得到数据的一般规律进行预测~

下面先说下回归算法不得不提的三个概念:(这三个函数我找了好久权威概念,还是没找到~只好根据自己的理解说下)

假设函数:这个函数可以是一元一次函数,二元一次函数等等,可以理解为用来拟合数据的函数。

代价函数:用假设函数拟合数据时产生的代价。

优化目标:确认最优解的函数。

我们先拿只有一个特征量的训练集来说下线性回归模型算法,数据表如下:

对应的散点图如下:

从散点图上来看,我们可以用 h (Θ)  = Θ0+ Θ1 X 来作假设函数(当然也可以用二次函数,后面会提到,先这么认为)

代价函数:

优化目标:

我们要做的就是求得使J(Θ0,Θ1)最小(即代价最小,最能拟合数据)的Θ0,Θ1,这就又引出一个概念,梯度下降算法:

关于梯度下降的一个直观解释:我们在大山(J(Θ0,Θ1)函数)的某个位置,打算走到山底,于是决定走一步算一步,每走一步,就计算该位置的梯度(梯度是函数在该点下降最快的方向),沿着梯度的方向,也就是下山最快的方向走一步,这样一步一步走下去就可以快速得到达山脚下,当然还可能走到一个山谷的最低点。

这里需要注意的一点是,如果学习速率太小,则需要进行多次迭代才能到达最低点,学习速率过大,就有可能越过最低点。我们可以通过指定多个学习速率值,来选择最合适的那个。

在算法中,通过做自动收敛测试来检测是否得到了最低点的值,即∆J(Θ)< β 则可认为已经收敛。

通过上面这几个式子,我们就可以得出最能拟合数据的Θ0,Θ1的值,最重要的是,算法是可以用python代码写出来的~

上面的例子其实仅仅是对于一个特征量的情况下所说的,那如果多个特征量怎么办呢?

我们改下假设函数:

对于每条数据添加一个恒为1的X0(对于整体不影响),这样我们就可以将假设函数写成两个矩阵相乘的形式。X1,X2……Xn分别表示特征量1,2……n的值。

代价函数以及梯度下降算法:

这里梯度下降算法中将求导后的结果写了出来。

上面是多个特征量的情况,如果我要让一个二次/三次的函数来做假设函数怎么办?

对于这种情况的处理,可以直接将特征量的值N方带入,比如:

到这里线性回归模型已经差不多了。

为了提升梯度下降算法的性能,我们其实提前还需要对训练集进行优化,有个专业名词叫特征缩放

用(该特征量的值 - 该特征量集合的均值)/(该特征量集合中最大值 - 该特征量集合中最小值)来优化训练集,从而使梯度下降算法效率更高。

逻辑回归模型

预测一个用户是否点击特定的商品

判断用户的性别

判断用户是否购买给定的类别商品

判断一个肿瘤是恶性的还是良性的

…………

以上其实是逻辑回归中简单的二分类问题~下面是实现的具体算法。(以二分类举例,预测集只有0,1两个取值)

线性回归的结果输出是一个连续值,而值的范围是无法被限定的,那我们有没有办法将结果映射成(0,1)之间的概率值呢?于是我们找到了一个神奇的sigmoid函数,详见下面的假设函数h(X)。

新定义的代价函数J(Θ),如果y=1,h(x)越接近于1,J(Θ)越小即代价越小,反之,h(x)越接近于0,J(Θ)越大即代价越大。如果y=0,,h(x)越接近于1,J(Θ)越大即代价越大,反之,h(x)越接近于0,J(Θ)越小即代价越小。(可以结合函数图像来具体分析)

梯度下降算法不变。

多分类问题以后再归纳总结~

从前只是觉得数学只有考上上才能派上用场,没想到学好数学还能干这么多事情~后悔当初没好好学数学呀。

下篇文章不出意外的话,会出一篇python基本语法的文章,敬请期待~

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,080评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,422评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,630评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,554评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,662评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,856评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,014评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,752评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,212评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,541评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,687评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,347评论 4 331
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,973评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,777评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,006评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,406评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,576评论 2 349

推荐阅读更多精彩内容

  • AI人工智能时代,机器学习,深度学习作为其核心,本文主要介绍机器学习的基础算法,以详细线介绍 线性回归算法 及其 ...
    erixhao阅读 13,837评论 0 36
  • 注:题中所指的『机器学习』不包括『深度学习』。本篇文章以理论推导为主,不涉及代码实现。 前些日子定下了未来三年左右...
    我偏笑_NSNirvana阅读 39,936评论 12 145
  • 机器学习是做NLP和计算机视觉这类应用算法的基础,虽然现在深度学习模型大行其道,但是懂一些传统算法的原理和它们之间...
    在河之简阅读 20,488评论 4 65
  • 引言 机器学习栏目记录我在学习Machine Learning过程的一些心得笔记,涵盖线性回归、逻辑回归、Soft...
    hfk阅读 4,353评论 4 18
  • 这一章讲到的是一致性原则。这个原则可以用在教育孩子上,让他许下承诺,写下来,然后这样就可以变成对他的约束。我要加强...
    小金鱼藏在水草后阅读 298评论 0 0