求导布局:
分子布局(numerator layout):
m维列向量对标量求导结果为m维列向量,标量对m*n维矩阵求导结果为n*m维,m维列向量对n维列向量求导结果为m*n维(雅克比矩阵)
分母布局(denominator layout):
m维列向量对标量求导结果为m维行向量,标量对m*n维矩阵求导结果为m*n维,m维列向量对n维列向量求导结果为n*m维(梯度矩阵)
一般规则:
向量或矩阵对标量求导一般为分子布局,标量对向量或矩阵求导一般为分母布局,向量对向量求导看具体情况。
定义法求导
标量对向量的求导
sample 1
设
其中x为n维列向量,则y对x的导数为:
sample 2
设
则导数为:
其中,
标量对矩阵的求导
设
其中,a为m维行向量,X为m*n矩阵,b为n维行向量。
则:
故
向量对向量的求导
设A为m*n矩阵,x为n维向量,y为m维向量,y对x的求导结果为m*n矩阵
微分法求导
标量对矩阵的微分
标量对向量的微分也如上式。因为偏导使用分母布局,故需转置后乘以dX。
矩阵微分性质
迹的性质
使用微分法求导上例:
例2,
迹函数对向量矩阵的求导
由定义方法可知:
链式求导法则
向量对向量
标量对多个向量链式求导
直接用链式法则会碰到维度不相容的情况,可以求其转置
假设想,x,y分别为m,n维向量:
标量对多个矩阵链式求导
矩阵对矩阵求导
一般先对矩阵向量化(列向量),使用向量对向量的求导,即
矩阵向量化的运算法则
克罗内克积的运算法则
例如,