数学基础:矩阵求导

本文主要参考B站UP主GRNovmbrain的推导视频,链接如下:
https://www.bilibili.com/video/BV1xk4y1B7RQ/?vd_source=eef9eaf7d8271401f6cbf1b7afa000c0

矩阵求导的本质

矩阵\boldsymbol{A}对矩阵\boldsymbol{B}求导,表示为\frac{d\boldsymbol{A}}{d\boldsymbol{B}},本质是矩阵\boldsymbol{A}中的每个元素对矩阵\boldsymbol{B}中的每个元素求导。

求导后\frac{d\boldsymbol{A}}{d\boldsymbol{B}}中元素的个数:

  • \boldsymbol{A}1*1矩阵,\boldsymbol{B}1*1矩阵,则 \frac{d\boldsymbol{A}}{d\boldsymbol{B}} 中元素个数为1
  • \boldsymbol{A}1*p矩阵,\boldsymbol{B}1*n矩阵,则 \frac{d\boldsymbol{A}}{d\boldsymbol{B}} 中元素个数为p*n
  • \boldsymbol{A}q*p矩阵,\boldsymbol{B}m*n矩阵,则 \frac{d\boldsymbol{A}}{d\boldsymbol{B}} 中元素个数为q*p*m*n

矩阵求导元素布局方法

矩阵\boldsymbol{A}对矩阵\boldsymbol{B}求导,得到的结果为\frac{d\boldsymbol{A}}{d\boldsymbol{B}},本质上就是矩阵\boldsymbol{A}中的每个元素对矩阵\boldsymbol{B}中的每个元素求导;那么,不同的元素布局方式,就能得到不同的求导结果(指不同的结果矩阵)。元素的布局可以分为:1)分母布局2)分子布局,两种布局的关系为:将分母布局得到的结果矩阵进行转置,即可得到分子布局的结果。

本文的例子中采用的是分母布局的形式,也是目前比较主流的机器学习矩阵求导布局形式。有些金融类的教材可能会采用分子布局的形式,两种布局没有优劣之分,为了计算会推导的方便可以采用任意一种布局。需要注意的是:在同一个项目中需保持布局的一致性。

分母布局口诀

  • 标量保持不变,向量需要拉伸;
  • 分子横向拉伸,分母纵向拉伸;

【例1】 f(\boldsymbol{x})为标量,\boldsymbol{x}=[x_1, x_2, ... , x_n]^{T}为列向量,求\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}}

此例中,分子f(\boldsymbol{x})为标量,分母\boldsymbol{x}为向量,求导获得的矩阵共有n个元素。依照布局口诀,分子为标量,保持不变,分母为向量,需将其各元素纵向拉伸。由此,我们可以得到:

\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}} = \left[ \begin{matrix} \frac{\partial f(\boldsymbol{x})}{\partial x_{1}}\\ \frac{\partial f(\boldsymbol{x})}{\partial x_{2}} \\ \vdots \\ \frac{\partial f(\boldsymbol{x})}{\partial x_{n}} \end{matrix} \right]

【例2】 f(x)=[f_1(x), f_2(x), ... , f_n(x)]为向量函数,x为标量,求\frac{df(x)}{dx}

此例中,分子为向量,分母为标量,求导获得的矩阵共有n个元素。依照布局口诀,分子为向量,需将其各元素横向拉伸,分母为标量,保持不变。由此,我们可以得到:

\frac{df(x)}{dx} = \left[ \begin{matrix} \frac{df_{1}(x)}{dx} & \frac{df_{2}(x)}{dx} \cdots & \frac{df_{n}(x)}{dx} \end{matrix} \right]

【例3】 f(\boldsymbol{x})=[f_1(\boldsymbol{x}), f_2(\boldsymbol{x}), ... , f_n(\boldsymbol{x})]为向量函数,\boldsymbol{x}=[x_1, x_2, ... , x_n]^{T}为列向量,求\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}}

此例中,分子为向量,分母为也为向量,求导获得的矩阵共有n^2个元素。依照布局口诀,分子为向量,需将其各元素横向拉伸,分母为向量,需将其各元素纵向拉伸。我们先将分母纵向拉伸,再将分子横向拉伸,可以得到:

\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}} = \left[ \begin{matrix} \frac{\partial f(\boldsymbol{x})}{\partial x_{1}}\\ \frac{\partial f(\boldsymbol{x})}{\partial x_{2}} \\ \vdots \\ \frac{\partial f(\boldsymbol{x})}{\partial x_{n}} \end{matrix} \right]= \left[ \begin{matrix} \frac{\partial f_{1}(\boldsymbol{x})}{\partial x_1} & \frac{\partial f_{2}(\boldsymbol{x})}{\partial x_1} & \cdots & \frac{\partial f_{n}(\boldsymbol{x})}{\partial x_1} \\ \frac{\partial f_{1}(\boldsymbol{x})}{\partial x_2} & \frac{\partial f_{2}(\boldsymbol{x})}{\partial x_2} & \cdots & \frac{\partial f_{n}(\boldsymbol{x})}{\partial x_2} \\ \vdots & \vdots & \cdots & \vdots \\ \frac{\partial f_{1}(\boldsymbol{x})}{\partial x_n} & \frac{\partial f_{2}(\boldsymbol{x})}{\partial x_n} & \cdots & \frac{\partial f_{n}(\boldsymbol{x})}{\partial x_n} \end{matrix} \right]

常用矩阵求导公式

  • \frac{\partial \boldsymbol{a}^{T}\boldsymbol{x}}{\partial \boldsymbol{x}} = \frac{\partial \boldsymbol{x}^{T}\boldsymbol{a}}{\partial \boldsymbol{x}}= \boldsymbol{a}

  • \frac{\partial \boldsymbol{x}^{T}\boldsymbol{A}\boldsymbol{x}}{\partial \boldsymbol{x}} = (\boldsymbol{A} + \boldsymbol{A}^{T})\boldsymbol{x}

符号说明:

  • \boldsymbol{a}, \boldsymbol{x}为列向量;
  • \boldsymbol{A}为矩阵。

推荐书籍

The Matrix Cookbook : http://www2.imm.dtu.dk/pubdb/edoc/imm3274.pdf

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,752评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,100评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,244评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,099评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,210评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,307评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,346评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,133评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,546评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,849评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,019评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,702评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,331评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,030评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,260评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,871评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,898评论 2 351

推荐阅读更多精彩内容

  • 向量、矩阵求导其实就两个内容 分子每个元素对分母每个元素求导 将结果以一定方式布局 对于 1,没什么特别的,就是标...
    找不到工作阅读 244评论 0 0
  • 对一个数求导大家都比较熟悉,那么对向量求导呢?看如下的例子:假设有矩阵和向量: 很容易求出, 现在令,则向量对向量...
    Jarkata阅读 4,066评论 0 2
  • title: 闲话矩阵求导原始文件没有办法把latex公式正常显示,所以一个一个弄出来了,保留了原来的公式。原始文...
    kylinxue阅读 20,157评论 3 21
  • old Table of Contents 1. 布局(Layout) 2. 基本的求导规则(定义) 3. 维度分...
    场景为王阅读 5,848评论 2 1
  • 求导布局: 分子布局(numerator layout): m维列向量对标量求导结果为m维列向量,标量对m*n维矩...
    米斯特芳阅读 1,296评论 0 1