python数据分析-判别分析(转载)

判别分析是多元分析中用于判别样本所属类型的一种统计分析方法,即在已知研究对象用某种方法已经分成若干类的情况下,确定新的样本属于哪一类。

[if !supportLineBreakNewLine]

[endif]

一、距离判别

距离判别的基本思想是按就近原则进行归类。首先根据已知分类的数据分别计算各类的中心,即各类的均值,若任一新样本的观测值都与第i类的中心距离最近,就认为它属于第i类。用统计语言表述:已知总体G1,G2,…,Gk,先从每个总体中分别抽取n1,n2,…,nk个样本,每个样本皆测量p个指标,对新样本x=(x1,x2,…,xp)计算x到G1,G2,…,Gk的距离,记为d(x,G1),d(x,G2),…,d(x,Gn),然后按距离最近准则判别归类。


(获取更多知识,前往前往我的wx ————公z号 (程式解说)

原文来自https://mp.weixin.qq.com/s/Ix8e3bHt3t5SYeaeRH9Wbg

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容