回归分析技术

回归方法

  • 线性回归:目标函数为经验风险可以是最小二乘或似然函数
    J_R\left ( w \right ) = \frac{1}{2m}\left \| y - Xw \right \|^{2}
    最优解为:
    w = \left ( X^TX \right )^{-1}X^Ty
  • 岭回归:目标函数为由经验风险和L2正则化项组成的结构风险,如下:
    J_R\left ( w \right ) = \frac{1}{2}\left \| y - Xw \right \|^{2}+ \frac{1} {2}\lambda \sum \left \| w_i \right \|^{2}
    最优解为:
    \hat {w_R} = \left ( X^TX + \lambda I\right )^{-1}X^Ty
  • Lasso回归:目标函数为由经验风险和L1正则化项组成的结构风险,如下:
    J_L\left ( w \right ) = \frac{1}{2}\left \| y - Xw \right \|^{2}+ \lambda \sum \left | w_i \right |
    最优解为:
    \bar {w^j} = sgn\left ( w^j\right )\left ( \left | w^j\right | - \lambda\right )_+
    其中w_j表示其任一维度,(x)_+表示取x的正数部分,(x)_+=max(x,0)
    需要注意的是L1正则化项是不可导的,此处最优化策略一般有两种,即:贪心算法和逐一优化
    介绍贪心算法和逐一优化之前需要先介绍一种最优化方法即subgradient:它把不可导点的切线斜率范围定义为这一点的subgradient,如f(x) = \left | x \right |在x = 0处不可导,它在x = 0处的切线的斜率范围为[-1, 1],也就是说x = 0处的导数可以是这个导数子集中的任意值

这可以解释Lasso可以得到稀疏解的原因:在x = 0处,只要经验风险的导数中的参数满足一定的条件则结构风险的导数就是0,即在x = 0处结构风险最小,因为目标函数以模型参数为自变量,即x在此处为模型参数,则多个维度的参数x = 0,导致模型的解稀疏。

下面解释贪心算法和逐一优化算法:
1、贪心算法:它实际上是每次都选取和目标最相关的特征进行优化,每次优化都用到了subgradient,常见的有:LARS、feature-sign、search
2、逐一优化:每次顺序选择一个维度的参数进行优化,每次优化都用到了subgradient,常见的有:coordinate descent,block coordinate descent等

  • ElasticNet回归:这个是岭回归和Lasso回归的组合,当有多个相关特征时,Lasso会选择其中的一个,而ElasticNet则会选择两个,即在变量高度相关的情况下,ElasticNet会产生群体效应。
  • 多项式回归:这个就是自变量的指数大于1,该方法可以诱导拟合一个高次的多项式且有较低的错误,但是很可能会导致过拟合问题,可以通过画出训练误差和验证误差图来观察。
  • 逻辑回归
    线性回归通常处理因变量是连续变量的问题,如果因变量是离散值,那线性回归就不能用了,我们需要使用逻辑回归
    逻辑回归用于处理因变量是分类变量的回归问题,常见的就是二分类,也可以是多分类。
    因为逻辑回归处理分类问题,所以我们需要将特征的线性组合通过一个函数映射成一个0~1之间的数,这个数如果大于0.5则归为第一类,反之归到第二类中,逻辑回归中引入的函数正是logit变换,公式如下:
    p\left( y = 1 | x\right)=\theta_0 + \theta_1x_1 + \theta_2x_2 + \theta_3x_3 + ……+ \theta_nx_n
    logit\left( p \right) = ln\left( \frac{p}{1 - p} \right) = p\left( y = 1|x \right )
    推导得:
    p = \frac{1}{1 + e^{-\left( \theta_0 + \theta_1x_1 + \theta_2x_2 + \theta_3x_3 + ……+ \theta_nx_n\right)}}
    上式p即为sigmoid函数,接下来的工作就和线性回归一样了,所以我们经常说的sigmoid传递函数的效果就是在原来特征的基础上进行了逻辑回归
  • Bayesian回归
  • Ecological回归
  • Robust回归
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,591评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,448评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,823评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,204评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,228评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,190评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,078评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,923评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,334评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,550评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,727评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,428评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,022评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,672评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,826评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,734评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,619评论 2 354