常见机器学习算法简述

kNN(k近邻):

给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本。在分类中,通过投票法选择这k个样本中出现最多的类别作为预测结果。在回归任务中,通过计算这k个样本的实际值的平均值作为预测结果。

LDA(线性判别分析):

核心:向最大化类间差异、最小化类内差异的方向线性投影,
是有监督的线性降维算法,确保样本向量线性映射到低维空间后,同类样本的差异尽可能小,不同类样本间的差异尽可能大。

LDA支持向量机:

核心:最大化分类间隔的线性分类器
寻找一个分类超平面,不仅能正确地分类所有训练样本,而且要使得每一类样本中距离超平面最近的样本到超平面的距离尽可能远。通过核函数,SVM将向量非线性的映射到高维空间,使其更可能线性可分。实现的时候通过拉格朗日对偶转化为对偶问题求解,采用了高效的SMO算法(分治法)。

朴素贝叶斯

基于贝叶斯定理与特征条件独立假设的分类方法。分类原理是通过某对象的先验概率,利用贝叶斯计算其后验概率,即为该对象的概率,选择具有最大后验概率的类最为该对象所属的类。

Logistic回归

核心:从样本向量预测出它属于正负样本的概率。
属于二分类问题,先对向量做线性映射,再用logistic函数进行映射,得到它属于正样本的概率。模型的参数通过最大似然估计确定。Logistic是一种线性判别模型。是分类算法而不是回归算法。

随机森林:

核心:有放回的抽取样本训练多颗决策树,训练决策树的每个节点也只用了随机抽取的部分特征,预测时对这些树的预测的结果进行投票。
随机森林是一种集成学习算法,由多颗决策树组成,是一种线性判别模型,即支持分类也支持回归问题。

AdaBoost算法

核心:用多颗决策树的加权和进行预测,训练时重点关注错分的样本,准确率高的弱分类器权重大。
是一种集成学习算法,用多个弱分类器的线性加权组合构造强分类器。训练时,样本带有权重值,算法依次训练每个弱分类器,确定它们的权重。被错分的训练样本增大权重,准确率高的弱分类器权重大,否则减小权重。标注的AdaBoost算法是一种非线性判别模型,只支持二分类问题。

K均值

核心:把样本分配到离它最近的类中心对应的类中,类中心由属于这个类的所有样本确定
是一种无监督算法,是聚类算法。随机生成类中心,每次迭代时将样本分配到离它最近的类中心对应的类中, 再根据分配好的结果更新类中心,反复迭代直至收敛

均值漂移聚类

基于滑动窗口的算法,它试图找到数据点的密集区域。中心点的候选点更新为滑动窗口内的均值,在后处理阶段对这些候选窗口进行过滤以消除近似重复。

EM算法

基于模型的聚类算法,是在概率模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量。E步估计隐含变量,M步估计其他参数,交替将极值推向最大。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,133评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,682评论 3 390
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,784评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,508评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,603评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,607评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,604评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,359评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,805评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,121评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,280评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,959评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,588评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,206评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,442评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,193评论 2 367
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,144评论 2 352

推荐阅读更多精彩内容