矩阵求导和迹

1. 迹的定义

矩阵的迹$tr(A)$定义如下: 一个$n \times n$方阵$A$的迹是指:$A$的主对角线上各元素的总和,即
$$tr(A) = \sum_{i=1}^n a_{ii}$$
只有方阵才有迹.

2. 迹的性质

$A \in R^{n\times m}$, $B \in R^{m \times n}$, $AB \in R^{n\times n}$, $BA \in R^{m \times m}$

定理1: $tr(AB)=tr(BA)$
证明: 由于$tr(AB)$迹为矩阵$AB$主对角线的元素和,而矩阵$AB$的第$i$个主对角线元素可表示为: $(AB){ii} = \sum{j=1}^m a_{ij}b_{ji}$. 即$A$的$i$行元素与$B$的$i$列元素的向量积。 因此,由如下结论:
$$tr(AB) = \sum_{i=1}^n (AB){ii} = \sum{i=1}^n \sum_{j=1}^m a_{ij}
b_{ji}$$
$$= \sum_{j=1}^m \sum_{i=1}^n b_{ji}*a_{ij} = \sum_{j=1}^m (BA)_{jj} = tr(BA) $$

定理2: $tr(ABC) = tr(BCA) = tr(CAB)$
证明: $AB$或$BC$当作整体,证明与定理1相同.

定理3: $\frac{\partial tr(AB)}{\partial A} = \frac{\partial tr(BA)}{\partial A} = {B'}$
证明: 由于 $tr(AB) =\sum_{i=1}^n \sum_{j=1}^m a_{ij}b_{ji} = \sum_{j=1}^m \sum_{i=1}^n b_{ji}a_{ij} $
那么,$\frac{\partial tr(AB)}{\partial a_{ij}} = b_{ji}$. 因此,$\frac{\partial tr(AB)}{\partial A} = B'$

定理4: $\frac{\partial tr(A'B)}{\partial A} = \frac{\partial tr(B'A)}{\partial A} = {B}$

定理5: $\frac{\partial tr(ABA'C)}{\partial A} = {C'AB'} + {CAB}$
证明: 对于$A$存在多处情况,利用分步求导公式
$\frac{{d{x^2}}}{{dx}} = \frac{{dxx}}{{dx}} = x\frac{{dx}}{{dx}} + x\frac{{dx}}{{dx}} = 2x$
并基于定理1、定理3和4,可得,
$\frac{\partial tr(ABA'C)}{\partial A} = \frac{\partial tr(ABA'C)}{\partial A} + \frac{\partial tr(A'CAB)}{\partial A} = {C'AB'} + {CAB}$

3. 迹与范数的关系

$A \in R^{n \times m}$
定理6: 一个矩阵$A$的$F$范数是$||A||_F^2$ 等价于 $A$的所有元素的平方和 等价于 $tr(A'A)=tr(AA’)$

证明:$||A||F^2 = \sum_i^n \sum_j^m {a{ij}^2}$

而$A′A$的第$i$个主对角线元素为$A′$的第i行与$A$的第$i$列的向量积,因此$(A'A){ii} = \sum_j^m a'{ij}*a_{ji}$,而 $a'{ij} = a{ji}$,因此,$(A'A){ii} = \sum_j^m a^2{ji} $。
进而,$||A||F^2 = \sum_i^n \sum_j^m a^2{ji} = \sum_i^n (A'A){ii} = tr(A'A)$。
又得,$||A||F^2 = \sum_i^n \sum_j^m a^2{ji} = \sum_j^m \sum_i^n a^2
{ij} = \sum_j^m (AA')_{ii} = tr(AA') $。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 文章作者:Tyan博客:noahsnail.com | CSDN | 简书 声明:作者翻译论文仅为学习,如有侵权请...
    SnailTyan阅读 5,139评论 0 8
  • #1996 AHSME ##1996 AHSME Problems/Problem 1 The addition ...
    abigtreenj阅读 1,430评论 0 0
  • 你玩着消消乐; 他看着今日头条; 而更多的似乎是在聊天, 他们用软件聊的, 因为只看见他们低着头按着手机。 ...
    小东记事阅读 168评论 0 1
  • 以我现在所处的情况为例,如果我重新以一个运营人员进入这份工作(社区运营)我会关注什么? 一.数据 1.流量来源 网...
    默沉陌尘阅读 320评论 0 0