揭秘：最大方差旋转法数学公式推导

今天也是准备因子分析的一天，今天主要解决的问题是——目标函数：最大方差旋转法是如何用公式表示的。

背景：为什么需要因子旋转？

简单来讲，当因子的命名解释含糊不清的时候。比如图1。

图1：方差旋转前因子载荷矩阵

由图1知，

7个变量在第1个因子上的载荷都很高，意味着它们与第1个因子的相关程度很高，第1个因子很重要。同时也可以这样理解，因为因子载荷 $a_{ij}$ 的绝对值在第1列的多个行上都有较大的数值，均大于0.77，这个值已经很高了，表明因子 $f_{1}$ 能够同时解释许多变量的信息，因子 $f_{1}$ 不是任何一个原始变量 $x_{i}$ 的典型代表。

第2个因子与原始变量的相关性均很小，它对原始变量的解释作用不显著。另外可以看到这两个因子的实际含义比较模糊。

因此，需要一种方法，让因子载荷矩阵因子解释有代表性，所以最大方差旋转法应运而生。正交旋转的方法很多，比如还有四次方最大法和等量最大法等。这里我们只解释最大方差旋转法。

图2为使用最大方差旋转法后的因子载荷矩阵。

图2：方差旋转后因子载荷矩阵

解释：如何用数学公式解释最大方差旋转

假设原始变量有7个，因子取了2个。

方差旋转前因子载荷矩阵为 $A_{7*2}$ ，参照图1。

方差旋转后因子载荷矩阵为 $B_{7*2}$ ，参照图2。 $B=\left\{ B_{ij} \right\}$ 。

方差基础公式准备： $Var=\frac{1}{n} \sum_{i=1}^n (x_{i} -\bar{x} )^2 =\frac{1}{n} (\sum_{i=1}^n x_{i} ^2 -n\bar{x} ^2 )$

设因子载荷中第 $j$ 列的方差为 $V_{j}$ ,第 $j$ 列的均值为 $\bar{x_{j} }$ 。

第 $j$ 列的方差 $V_{j} =\frac{1}{p} \sum_{i=1}^p (x_{ij}-\tilde{x_{j} } )^2 =\frac{1}{p} (\sum_{i=1}^px_{ij} ^2-p\bar{x_{j} } ^2 )$ 。其中， $x_{ij} =d_{ij} ^2 =(\frac{b_{ij} }{h_{i} } )^2=\frac{b_{ij} ^2 }{h_{i} ^2 }$ ，

$\bar{x_{j} } =\frac{1}{p} \sum_{i=1}^pd_{ij} ^2 =\frac{1}{p} \sum_{i=1}^p\frac{b_{ij} ^2 }{h_{i} ^2 }$ 。

然后，见下图3。（输公式实在太累了）

这是第 $j$ 列的方差，在此题目中，我们提取了2个因子，所以我们的目标函数是，使得 $V_{1} +V_{2}$ 最大，然后通过求极值的方法求解出参数。