医准智能基础知识系列读书讨论班笔记二

医准智能基础知识系列读书讨论班笔记二

线性代数(二)

矩阵的迹(trace)

矩阵的迹指的是一个矩阵(方阵)的主对角线上所有元素的和,用记号 trace() 或者 tr() 表示:
trace(A) = \sum_i A_{ii} \ \ A \in \mathbb{R}^{n \times n}
矩阵的迹,常用于矩阵函数的求导中。

  • 一些常用的性质:
  • \|A\|_F = \sqrt{tr(AA^T)} = \sqrt{tr(A^TA)}
  • tr(A) = tr(A^T)
  • 轮换不变:tr(ABC) = tr(BCA) = tr(CAB),可以推广到一般的 n 个矩阵相乘
  • 常用的关于迹的求导[1]
    • \frac{\partial tr(X)}{\partial X} = I
    • \frac{\partial tr(AX)}{X} = A^T
    • \frac{\partial tr(X^2B)}{\partial X} = (XB+BX)^T
    • \frac{\partial tr(X^TBX)}{\partial X} = BX + B^TX
    • \frac{\partial tr(AXBX^TC)}{\partial X} = A^TC^TXB^T + CAXB

行列式(determinant)

行列式的值为一个方阵所有特征值的乘积,其几何含义为二维有向面积或三维有向体积向一般高维空间的推广。
A = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{bmatrix}

  • 余子式:M_{i,j} 为矩阵 A 除去第 i 行和第 j 列的元素后,剩下的矩阵的行列式的值
  • 代数余子式:A_{i,j} = (-1)^{i+j}M_{i,j}
  • 行列式按行展开:\det(A) = |A|= \sum_j a_{ij}A_{i,j}
  • 行列式按列展开:\det(A) = |A|= \sum_i a_{ij}A_{i,j}
  • \sum_i a_{ij}A_{i^{'},j} = 0, if \quad i \neq i^{'}

主成分分析(PCA)

问题描述:假定我们手中有 mn 维空间中的数据点 x_i\in\mathbb{R}^{n}, i\in[m],希望在一个维数较低为 l(l<n) 的子空间中重建这些点,使得重建后的数据点与原始点的最接近,这个接近指的是丢失最小的关于数据点位置和分布关系的信息。书中将该问题分解为两个子问题:

  1. 任意给定低维子空间 D\in\mathbb{R}^{n \times l},如何确定一个点的坐标

  2. 在知道如何计算每个点在低维空间坐标的基础上,如何寻找一个最优的子空间

对于子问题 1,我们希望在低维子空间中重建的数据点离原数据点尽可能的接近,于是在限制了子空间 D 为一个 列标准正交的矩阵的前提下,该问题表示为如下的优化问题:
c^* = \arg\min_{c} \ \|x-Dc\|_2
其中,c 表示低维子空间 D 中点的坐标,c^* 是我们希望找到的最理想的坐标。容易看出该问题是一个二次函数求极值问题,问题的目标函数是凸函数,所以函数的稳定点即为问题的最优解:
f(c)\triangleq \|x-Dc\|_2
则由 D 列标准正交,可得
\begin{split} \nabla_c f(c) & = \nabla_c\left( tr(x^Tx - 2x^TDc + c^TD^TDc) \right) \\ & = -2D^Tx + 2D^TDc \\ & = -2(D^Tx-c) \end{split}

c^* = D^Tx
直观来看,最优坐标可通过与子空间的正交基的内积来计算。

对于子问题2,我们需要选取最合适的子空间 D 使得对于所有的数据点而言,重建误差的 2-范数 平方和最小。可通过如下的优化问题描述:
\begin{split} \min_{D}& \ \|X-DD^TX\|_F^2 \\ s.t.& \ D^TD = I \end{split}
其中,矩阵X\in\mathbb{R}^{n\times m},每一列为一个原始数据点
\begin{split} &\arg\min_D \ \|X-DD^TX\|_F^2 \\ =&\arg\min_D \ tr[(X-DD^TX)^T(X-DD^TX)] \\ =&\arg\min_D \ tr(X^TX - 2X^TDD^TX + X^TDD^TDD^TX) \\ =&\arg\min_D \ tr(X^TX - X^TDD^TX) \\ =&\arg\max_D \ tr(D^TXX^TD) \end{split}
考虑矩阵 XX^T 的特征分解 XX^T=\sum_i \lambda_iu_iu_i^T,并假设 \lambda_1 > \lambda_2 > \lambda_3 > \cdots > \lambda_n. 当 l=1 时,D 退化为列向量 d,问题变为
\begin{split} \arg\max_d& \ \sum_i\lambda_i|<d, u_i>|^2 \\ s.t.& \ \|d\|_2= 1 \end{split}
容易求得该问题的最优解为 d^* = u_1,即最大特征值所对应的特征方向,对于 l>1 的情况,可以通过数学归纳法得到,所求问题的最优解为前 l 个最大特征值所对应的特征方向。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,591评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,448评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,823评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,204评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,228评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,190评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,078评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,923评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,334评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,550评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,727评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,428评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,022评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,672评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,826评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,734评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,619评论 2 354

推荐阅读更多精彩内容