本篇笔记为MOOC《多元统计分析及R语言建模》的第8章“主成分分析及R使用”的第一讲“主成分的直观解释” 主成分分析的概念 主成分分析的提出主成分分析(Principal C...
本篇笔记为MOOC《多元统计分析及R语言建模》的第8章“主成分分析及R使用”的第一讲“主成分的直观解释” 主成分分析的概念 主成分分析的提出主成分分析(Principal C...
系统聚类法受方法限制不适合应用于量较大的数据,而现在我们实际分析的数据往往都是大数据,这一节讲的快速聚类法kmeans则是可应用于大数据的一种聚类方法。 算法原理 kmean...
这篇笔记是MOOC《多元统计分析及R使用》课程的第7章第三节。 系统剧类法的基本思想 先将个样品分成类,每个样品自成一类,然后每次将具有最小距离的两类合并,合并后重新计算类与...
基本概念聚类分析法(Cluster Analysis)是研物以类聚的一种现代统计分析方法,在众多的领域中,都需要采用聚类分析作分类研究。 分析方法聚类分析方法分为两大类,一类...
先回顾下贝叶斯定理: 表示事件A出现的概率. 是条件概率的符号,表示事件A发生的条件下,事件B发生的概率,也被称为似然度 也是条件概率的符号,表示事件B发生的条件下,事件A发...
这部分笔记是MOOC课程《多元统计分析及R语言建模》第6章第二讲“距离判别分析”。在判别分析及R使用-Part1中提到,确定性判别可用Fisher判别法,除此之外还可以用距离...
本章为MOOC课程《多元统计分析及R语言建模》课程第六章,前5章笔记均已发布过,想看的可以去我的主页巴拉巴拉。 6.1 判别分析的概念 概念判别分析(Discriminat ...
最近手头上的工作较少,逛完收藏的多个论坛依旧是兴趣缺缺之际,突然想起来我的简书好久好久没有打开了,久到我已经记不起最后一次更新在什么时候了,想当初做下的学习计划早也不了了之了...
这个例子是广义的,因为不是直接用的Y,是转换过啦
广义线性混合模型(GLMM)知识背景 广义线性混合模型可以看做是广义线性模型(GLM)以及线性混合模型(LMM)的扩展,为了更好地理解GLMM,肯定要对普通线性模型、广义线性模型以及线性混合模型有个理解...
在最近的项目中经常会做到线性回归方面的分析,跟客户解释相关结果时,用比较学术的统计词汇阐述结果常常令人不知所云。我常常想,只有能用最简单的话跟别人解释清楚才真的证明是你懂了。...
知识背景 广义线性混合模型可以看做是广义线性模型(GLM)以及线性混合模型(LMM)的扩展,为了更好地理解GLMM,肯定要对普通线性模型、广义线性模型以及线性混合模型有个理解...
比较检验 书接上文,我们先使用某种实验评估方法测得学习器的某个性能度量结果,然后对这个结果进行比较,但怎么来做这个比较呢?下面为大家介绍几种常用的机器学习性能比较的方法。为便...
性能度量 对模型泛化能力的评价标准就是性能度量,在预测任务中,要评估学习器的性能,就是要把学习器预测结果与真实标记进行比较。 回归任务最常用的性能度量是均方误差(公式略),本...
经验误差与过拟合 在学习过程中,我们希望得到一个在新样本上能表现得很好的学习器,为了达到这个目的,应该从训练样本中尽可能的学出适用于所有潜在样本的普遍规律,然而,当学习器把训...
基本概念 从数据中学得模型的过程称为学习[learning]或训练[training],这个过程通过执行某个学习算法来完成。训练过程中使用的数据称为训练数据[training...
最近的工作需要用到机器学习,虽然多少对机器学习有一定了解,但还是决定系统的学习一下相关知识,在google上搜了半天,找到了前辈整理的一套学习资源(机器学习资源Machine...
我发现我都记不得我在简书上写了啥东西了......真的是人老了,记性也跟着差了么......捡起来捡起来(试图催眠自己)......
系统发育学概念 系统发生(或种系发生、系统发育,phylogeny)是指生物形成或进化的历史。系统发生学(phylogenetics)研究物种之间的进化关系,其基本思想是比较...