机器学习笔记(一)

学习算法的任务:通过训练样本,选择或学习得到参数θ

  • 监督学习(Supervised Learning)

监督学习:通过已有训练样本进行训练,得到一个拟合效果最好的基本模型,再使用该模型,对新的训练样本计算出相应的输出结果,对输出结果进行判断实现分类的目的。并通过大量的迭代后,最后得到最终模型。

简单来说:
通过给算法提供一组标准答案,然后希望算法计算得到标准输入和标准输出之间的联系,然后返回更多的标准答案。
  • 非监督学习(Unsupervised Learning)

非监督学习:事先没有任何训练样本,需要直接对数据进行建模

  • 半监督学习(Semi-Supervised Learning, SSL)

半监督学习:是监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。


回归函数:

在支持向量机的算法中,把一些具有数据的点,在无限维的空间中画出来,这样就可以把数据在在空间中更加直观的显示出来。


  • 梯度下降算法

  • 随机(增量)梯度下降算法

通常用于样本数据量大的场景
最终收敛所得的参数值,会在局部最优点的参数 附近徘徊

对于数据量大的情况,随机梯度下降算法比简单梯度下降算法更高效

批梯度下降的算法过程:通过利用第一个样品数据,更新所有的参数,然后利用第二个样品数据,继续更新之前的所有参数

notation:符号注释:
m表示训练样品的总数量 m = training examples
x表示输入变量 x = input variables (features)
y表示目标变量 y = output variables(target)
(x, y)表示一个训练样品 (x, y) = one training example
第i个训练样品 (xi, yi) i th training example = (xi, yi)

公式一
Daum Equation Editor:
h( x )= { h } _ { \theta } ( x )  = { \theta  }_{ 0 }+{ \theta  }_{ 1 }{ x }_{ 1 }+{ \theta  }_{ 0 }{ x }_{ 2 }+…

训练样本 通过 学习算法,生成假设函数(历史,习惯)。假设函数的作用是接受数据,然后输出计算后的结果,And Repeating till convergence,不断重复算法执行直到参数得到收敛,进而得到一个更通用的函数

  • 对于梯度下降算法,不同的初始值,可能导致出现不同的局部最优解

θi 指的是学习算法中的实数参数 θi are called parameter
α 指的是学习速度 α is a parameter of the algorithm called learning rate

公式二
Daum Equation Editor:
{ \theta  }_{ i }={ \theta  }_{ i }-\alpha ({ h }_{ \theta  }-y)\cdot { x }_{ i }

how large step you take
你迈的步子有多大(选取最合适的值,过大过小都不一定为最好)
  • 假设在一个碗状的模型中,只存在一个局部最优点,学习速度不断减小,当达到局部最优点时,梯度下降速度(学习速度α)会减少到0

收敛的两种判断方式

  • 观察两次迭代中,两次迭代中常量的值是否变化很大,如果变化不大,可以认为其收敛
  • 观察你希望收敛的值,若该值变化量不再增大,则可认为其收敛
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 注:题中所指的『机器学习』不包括『深度学习』。本篇文章以理论推导为主,不涉及代码实现。 前些日子定下了未来三年左右...
    我偏笑_NSNirvana阅读 40,099评论 12 145
  • 第二个Topic讲深度学习,承接前面的《浅谈机器学习基础》。 深度学习简介 前面也提到过,机器学习的本质就是寻找最...
    我偏笑_NSNirvana阅读 15,696评论 7 49
  • 机器学习是做NLP和计算机视觉这类应用算法的基础,虽然现在深度学习模型大行其道,但是懂一些传统算法的原理和它们之间...
    在河之简阅读 20,551评论 4 65
  • 总是会觉得年纪还小,生活还很长,不幸和死亡离我们都很远,所以还是会尽情的做梦,肆意的畅想未来,甚至是肆无忌惮的熬夜...
    南栀哩阅读 344评论 0 0
  • 背景 远程ssh登录脚本服务器执行crontab -e 命令, 提示 “设备上没有空间”。 解决步骤 执行 df ...
    wenki阅读 1,240评论 0 0