对向量求导和对矩阵求导

对一个数求导大家都比较熟悉,那么对向量求导呢?看如下的例子:
假设有矩阵A和向量\boldsymbol{x}
A= \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots\ & a_{mn} \\ \end{bmatrix}, \vec{x}=\begin{pmatrix} x_1\\ x_2\\ \vdots \\ x_n \end{pmatrix}

很容易求出,
A\cdot \vec x = \begin{pmatrix} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n \\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n \\ \vdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n \\ \end{pmatrix}

现在令\vec{y}=A\vec{x},则向量\vec{y}对向量\vec{x}求偏导的结果为多少?
既然是向量\vec{y}对向量\vec{x}求偏导,则需要让向量\vec{y}中的每一个元素对向量\vec{x}中的每一个元素求偏导。
向量\vec{y}可以写成
\vec{y}= \begin{pmatrix} y_1\\ y_2\\ \vdots\\ y_m \end{pmatrix}
其中y_i=a_{i1}x_1+a_{i2}x_2+...+a_{in}x_n

若采用分母布局,则\frac{\partial{\vec{y}}}{\partial{\vec{x}}}= \begin{bmatrix} \frac{\partial{y_1}}{\partial{x_1}}&\frac{\partial{y_2}}{\partial{x_1}}&\cdots&\frac{\partial{y_m}}{\partial{x_1}} \\ \frac{\partial{y_1}}{\partial{x_2}}&\frac{\partial{y_2}}{\partial{x_2}}&\cdots&\frac{\partial{y_m}}{\partial{x_2}} \\ \vdots&\vdots&\ddots&\vdots \\ \frac{\partial{y_1}}{\partial{x_n}}&\frac{\partial{y_2}}{\partial{x_n}}&\cdots&\frac{\partial{y_m}}{\partial{x_n}} \\ \end{bmatrix}

\frac{\partial{y_j}}{\partial{x_i}}=a_{ji},故\left(\frac{\partial{\vec{y}}}{\partial{\vec{x}}}\right)_{ij}=a_{ji},从而\frac{\partial{\vec{y}}}{\partial{\vec{x}}}=A^T

总结即为:
\frac{\partial{\vec{y}}}{\partial{\vec{x}}}=\frac{\partial{A\vec{x}}}{\partial{\vec{x}}}=\begin{bmatrix} \frac{\partial{y_1}}{\partial{x_1}}&\frac{\partial{y_2}}{\partial{x_1}}&\cdots&\frac{\partial{y_m}}{\partial{x_1}} \\ \frac{\partial{y_1}}{\partial{x_2}}&\frac{\partial{y_2}}{\partial{x_2}}&\cdots&\frac{\partial{y_m}}{\partial{x_2}} \\ \vdots&\vdots&\ddots&\vdots \\ \frac{\partial{y_1}}{\partial{x_n}}&\frac{\partial{y_2}}{\partial{x_n}}&\cdots&\frac{\partial{y_m}}{\partial{x_n}} \\ \end{bmatrix}= \begin{bmatrix} a_{11} & a_{21} & \cdots & a_{n1} \\ a_{12} & a_{22} & \cdots & a_{n2} \\ \vdots & \vdots & \ddots & \vdots \\ a_{1m} & a_{2m} & \cdots\ & a_{nm} \\ \end{bmatrix} =A^T

结论与推广

总结出几个向量偏导公式

向量对向量求导

标量对向量求导

如果y=x^TAx的话,y对向量x求偏导的结果是:


如果这时有A是对称阵,则:

标量对方阵的求导

关于更多矩阵求导的详细概念

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容