集成学习(二)机器学习基础模型回顾 (作业三)

作业三

  

    1. 回归问题和分类问题的联系和区别,如何利用回归问题理解分类问题?

区别
浅层:两者的预测目标变量类型不同,回归问题是连续变量,分类问题是离散变量
中层:回归问题是定量问题;分类问题是定性问题
高层:回归与分类的根本区别在于输出空间是否为一个度量空间。

特性 分类(监督学习) 回归
输出类型 离散数据 连续数据
目的 寻找决策边界 找到最优拟合
评价方法 精度(accuracy),混淆矩阵等 SSE或拟合优度

本质
  分类模型和回归模型本质一样,都是要建立映射关系。在实际操作中,可以将分类问题和回归问题进行转换:分类模型可将回归模型的输出离散化,回归模型可将分类模型的输出连续化。例:分类问题回归化:逻辑回归;回归问题分类化:年龄预测问题-->年龄分段问题。

    1. 为什么分类问题的损失函数可以是交叉熵而不是均方误差?
        神经网络中如果预测值与实际值的误差越大,那么在反向传播训练的过程中,各种参数调整的幅度就要更大,从而使训练更快收敛,如果预测值与实际值的误差小,各种参数调整的幅度就要小,从而减少震荡。
        使用平方误差损失函数,误差增大参数的梯度会增大,但是当误差很大时,参数的梯度就会又减小了。
        使用交叉熵损失是函数,误差越大参数的梯度也越大,能够快速收敛。
    1. 线性判别分析和逻辑回归在估计参数方面有什么异同点?
      相同点:
      两个都是线性模型,线性回归是普通线性模型,逻辑回归是广义线性模型
      表达形式上,逻辑回归是线性回归套上了一个Sigmoid函数
      参数估计上,都是用极大似然估计的方法估计参数
      区别
      线性回归优化的目标函数是均方差(最小二乘),而逻辑回归优化的是似然函数(交叉熵)
      线性归回要求自变量与因变量呈线性关系,而逻辑回归没有要求
      线性回归分析的是因变量自身与自变量的关系,而逻辑回归研究的是因变量取值的概率与自变量的概率
      逻辑回归处理的是分类问题,线性回归处理的是回归问题,这也导致了两个模型的取值范围不同:0-1和实数域
      线性回归假设响应变量服从正态分布,逻辑回归假设响应变量服从伯努利分布
      参数估计上,都是用极大似然估计的方法估计参数(高斯分布导致了线性模型损失函数为均方差,伯努利分布导致逻辑回归损失函数为交叉熵)
    1. 尝试从0推导SVM(面试题)
    1. 二次判别分析,线性判别分析,朴素贝叶斯之间的联系和区别?
    1. 使用python+numpy实现逻辑回归
def initial_para(nums_feature):
    """initial the weights and bias which is zero"""
    #nums_feature是输入数据的属性数目,因此权重w是[1, nums_feature]维
    #且w和b均初始化为0
    w = np.zeros((1, nums_feature))
    b = 0
    return w, b


def activation(x, w , b):
    """a linear function and then sigmoid activation function: 
    x_ = w*x +b,y = 1/(1+exp(-x_))"""
    #线性方程,输入的x是[batch, 2]维,输出是[1, batch]维,batch是模型优化迭代一次输入数据的数目
    #[1, 2] * [2, batch] = [1, batch], 所以是w * x.T(x的转置)
    #np.dot是矩阵乘法
    x_ = np.dot(w, x.T) + b
    #np.exp是实现e的x次幂
    sigmoid = 1 / (1 + np.exp(-x_))
    return sigmoid



    1. 了解梯度下降法,牛顿法,拟牛顿法与smo算法等优化算法。

refer
浅谈机器学习-回归与分类的区别 - 云+社区 - 腾讯云 (tencent.com)
为什么分类问题的损失函数采用交叉熵而不是均方误差MSE? - 知乎 (zhihu.com)

【★ 推荐】直观理解为什么分类问题用交叉熵损失而不用均方误差损失? - shine-lee - 博客园 (cnblogs.com)
分类问题为什么要使用交叉熵损失函数而不是均方误差Lavi的专栏-CSDN博客分类问题为什么用交叉熵
逻辑回归和线性回归相同点和不同点Jiashilin-CSDN博客逻辑回归和线性回归的异同点是什么

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,951评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,606评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,601评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,478评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,565评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,587评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,590评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,337评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,785评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,096评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,273评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,935评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,578评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,199评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,440评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,163评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,133评论 2 352

推荐阅读更多精彩内容