CS229学习笔记(1)

CS229_1-线性回归


线性回归

我们在上一节房屋售价数据集的基础上,增添房间数量这一特征变量,如下图所示:

因此,特征变量x变为了维度为2的向量,记作x \in R^2,其中x_{1}^{(i)}表示数据集中第i个房屋的房屋面积,则x_{2}^{(i)}表示数据集中第i个房屋的房间数量。

对于此监督学习问题,若我们采用线性回归模型,其假设函数h(x)为:

h(x) = \theta_{0} + \theta_{1}x_{1} + \theta_{2}x_{2} = \sum\limits_{i=0}^m \theta_{i}x_{i} = h_{\theta}(x)

其中,h_{\theta}(x)表示以\theta为参数。为了便于向量化,我们令x_{0}=0,则上式可改写为:

h_{\theta}(x) = \theta^{T}x

从上式可知,\theta为未知变量。那么我们该如何根据数据集计算出\theta的值呢?我们不妨回想一下假设函数h_{\theta}(x)的定义。从上一小节可知,假设函数h_{\theta}(x)是我们从给定数据集中学习得到的,其输出的值与数据集中的y越相近越好。因此,我们可以定义如下的代价函数(Cost Function):

J(\theta) = \frac{1}{2} \sum\limits_{i=1}^{m} (h_{\theta}(x^{(i)}) - y^{i})^2

当代价函数J(\theta)最小时,其参数\theta的值为我们所要的,从而得到了拟合训练集的最佳参数。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 175,216评论 25 709
  • 不奢求皇冠 一个发夹足矣 不奢求华服 一个拥抱足矣 不奢求玫瑰 一棵小草足矣 不奢求戒指 一条红绳足矣 不奢求花环...
    蜉蝣也疯狂阅读 1,735评论 0 4
  • 已过而立之年的我,回顾自己的经历,充满了各种不易与辛酸,也充满了惊喜与欢乐。总结自己30年来的生活,所感颇深。 我...
    漫步者说事阅读 5,201评论 5 5
  • 只要你肯努力,你想要的岁月都会给你
    回忆成殇阅读 1,228评论 0 0
  • 我的生活就是除了正常上班,正常的作息时间,休息的时候无事可做,就是洗洗衣服什么的,无事可做或者重复洗衣服的生活就是...
    _田利阅读 1,709评论 0 0