揭秘:最大方差旋转法数学公式推导

今天也是准备因子分析的一天,今天主要解决的问题是——目标函数:最大方差旋转法是如何用公式表示的。

背景:为什么需要因子旋转?

简单来讲,当因子的命名解释含糊不清的时候。比如图1。

图1:方差旋转前因子载荷矩阵

由图1知,

7个变量在第1个因子上的载荷都很高,意味着它们与第1个因子的相关程度很高,第1个因子很重要。同时也可以这样理解,因为因子载荷a_{ij} 的绝对值在第1列的多个行上都有较大的数值,均大于0.77,这个值已经很高了,表明因子f_{1} 能够同时解释许多变量的信息,因子f_{1} 不是任何一个原始变量x_{i} 的典型代表。 

第2个因子与原始变量的相关性均很小,它对原始变量的解释作用不显著。另外可以看到这两个因子的实际含义比较模糊。

因此,需要一种方法,让因子载荷矩阵因子解释有代表性,所以最大方差旋转法应运而生。正交旋转的方法很多,比如还有四次方最大法和等量最大法等。这里我们只解释最大方差旋转法。

图2为使用最大方差旋转法后的因子载荷矩阵。

图2:方差旋转后因子载荷矩阵

解释:如何用数学公式解释最大方差旋转

假设原始变量有7个,因子取了2个。

方差旋转前因子载荷矩阵为A_{7*2} ,参照图1。

方差旋转后因子载荷矩阵为B_{7*2} ,参照图2。B=\left\{ B_{ij}  \right\}

方差基础公式准备:Var=\frac{1}{n} \sum_{i=1}^n (x_{i} -\bar{x} )^2 =\frac{1}{n} (\sum_{i=1}^n x_{i} ^2 -n\bar{x} ^2 )

设因子载荷中第j列的方差为V_{j} ,第j列的均值为\bar{x_{j} }

j列的方差V_{j} =\frac{1}{p} \sum_{i=1}^p (x_{ij}-\tilde{x_{j} }  )^2 =\frac{1}{p} (\sum_{i=1}^px_{ij} ^2-p\bar{x_{j} } ^2   )。其中,x_{ij} =d_{ij} ^2 =(\frac{b_{ij} }{h_{i} } )^2=\frac{b_{ij} ^2 }{h_{i} ^2 } 

\bar{x_{j} } =\frac{1}{p} \sum_{i=1}^pd_{ij} ^2  =\frac{1}{p} \sum_{i=1}^p\frac{b_{ij} ^2 }{h_{i} ^2 }

然后,见下图3。(输公式实在太累了)

这是第j列的方差,在此题目中,我们提取了2个因子,所以我们的目标函数是,使得V_{1} +V_{2} 最大,然后通过求极值的方法求解出参数。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
禁止转载,如需转载请通过简信或评论联系作者。

友情链接更多精彩内容