凸函数

凸函数

一.基本性质和例子

1.定义

  • 定义一:函数f:f : \mathbf{R}^{n} \rightarrow \mathbf{R}是凸的,如果\operatorname{dom} f是凸集,且对于任意的x,y \in domf和任意的0\leqslant \theta \leqslant 1,有f(\theta x+(1-\theta) y) \leqslant \theta f(x)+(1-\theta) f(y)
  • 定义二:函数f是凸函数,当且仅当与其定义域相交的任意函数都是凸函数。或者说,函数f是凸函数,当且仅当对于任意的x \in \operatorname{dom} f和任意向量v,函数g(t)=f(x+t v)是凸函数(其定义域为\{t | x+t v \in \operatorname{dom} f\}
  • 几何意义:上述不等式意味着和(x, f(x)) 和(y, f(y))的线段,即从x到y的弦在图像上方。
  • 严格凸:当x \neq y0<\theta<1时,有f(\theta x+(1-\theta) y) < \theta f(x)+(1-\theta) f(y)总成立。
  • 函数f是凸函数,当-f是凹函数;f是凹函数,当-f是凸函数。

2.拓展值延伸

  • 定义:

    image.png

  • 扩展值延伸的意义:将在函数f定义域外的值定义为无穷大,将函数延伸至全空间R^n上,这种延伸可以简化符号表示,且延伸后凸性不变。对于延伸函数\tilde{f},可以描述为:

    对任意的x,y \in R^n0<\theta<1\tilde{f}(\theta x+(1-\theta) y) \leqslant \theta \tilde{f}(x)+(1-\theta) \tilde{f}(y)。(当\theta=0、1时,总成立)

    • x,y \in \operatorname{dom} f时,\theta x+(1-\theta) y \in dom f,因为f为凸函数,上述不等式成立。
    • 如果x,y任一个在domf外,不等式右面为正无穷,左面\theta x+(1-\theta) y
  • 例子

    • 凸集的示性函数,设C \subseteq \mathbf{R}^{n}是一个凸集,考虑凸函数I_{C},其定义域为C,对于所有x \in C,有I_{C}(x)=0,换言之,此函数在集合C上一直为零。其扩展延伸可以描述如下\tilde{I}_{C}(x)=\left\{\begin{array}{ll}{0} & {x \in C} \\ {\infty} & {x \not \in C}\end{array}\right.。凸函数\tilde{I}_{C}被称为集合C的示性函数。利用示性函数我们更加灵活的定义符号描述:例如求f(x)在C上的极小值,可以描述为求极小化f+\tilde{I}_{C}
    • 延伸函数一定要扩展到无穷,不然无法保持凸性。

3.一阶条件

  • 一阶条件:假设f可微(即其梯度\nabla f在开集domf内处处存在),则函数f是凸函数的充分必要条件是domf是凸集且对于任意的x, y \in \operatorname{dom} f,下式成立f(y) \geqslant f(x)+\nabla f(x)^{T}(y-x)

  • 几何意义:

    • 快照57.png
    • \nabla f(x)^{T}(y-x)是仿射函数y即为函数f在点x附近的Taylor近似,在这里Taylor近似其实是原函数的一个全局下估计

    • 极值点:如果\nabla f(x)=0,那么对于所有的y \in \operatorname{dom} f,存在f(y) \geqslant f(x),所以x是全局最小点

    • 严格凸:函数f严格凸的充分必要条件是

  • 证明:一阶条件是指在任意维凸集中均成立

    • 我们首先在证明在一维的情况下成立:即可微函数f : \mathbf{R} \rightarrow \mathbf{R}是凸函数的充分必要条件是f(y) \geqslant f(x)+\nabla f(x)^{T}(y-x)

      • 必要性:

        首先假设f是凸函数,由凸函数的定义我们可以得到domf是一个凸集

        假设x, y \in \operatorname{dom} f,则对于任意的0<t \leqslant 1,有x+t(y-x) \in \operatorname{dom} f

        由凸函数的定义一可得f(x+t(y-x)) \leqslant(1-t) f(x)+t f(y)

        上式两端同除以t得f(y) \geqslant f(x)+\frac{f(x+t(y-x))-f(x)}{t}

        因为f是可微函数,所以令t \rightarrow 0,可得到f(y) \geqslant f(x)+\nabla f(x)^{T}(y-x)

        (当t=0时显然成立。)

      • 充分性

        假设dom f内的任意x,y在定义域中,满足f(y) \geqslant f(x)+\nabla f(x)^{T}(y-x)

        假设x \neq y, 0 \leqslant \theta \leqslant 1z=\theta x+(1-\theta) y由上述不等式可得:

        f(x) \geqslant f(z)+f^{\prime}(z)(x-z), \quad f(y) \geqslant f(z)+f^{\prime}(z)(y-z)

        将第一个不等式同乘\theta,第二个不等式同乘1-\theta,并将二者相加可得:

        \theta f(x)+(1-\theta) f(y) \geqslant f(z)

        得证

    • 下边利用定义二由一维推理一般情况:

      对于高维空间的函数f:\mathbf{R}^{n} \rightarrow \mathbf{R},假设x, y \in \mathbf{R}^{n},构造一个一维的函数g(t)=f(t y+(1-t) x)

      此函数的导数为g^{\prime}(t)=\nabla f(t y+(1-t ) x )^{T}(y-x)

      • 首先假设f是凸函数,证明f(y) \geqslant f(x)+\nabla f(x)^{T}(y-x)

        因为f是凸函数,由定义二可得g是凸函数。

        由g是一个一维空间的凸函数,由第一步证明可得对于任意的,x,y \in dom g可得:

        g(y) \geqslant g(x)+\nabla g(x)^{T}(y-x),

        y=1,x=0,带入g^{\prime}(t)=\nabla f(t y+(1-t ) x )^{T}(y-x),化简

        g(1)\geqslant g(0)+\nabla g(0)

        f(y) \geqslant f(x)+\nabla f(x)^{T}(y-x)

        得证

      • 其次,假设若对于任意的x,y \in dom f,有f(y) \geqslant f(x)+\nabla f(x)^{T}(y-x)则f是一个凸函数

        因为domf是一个凸集,

        所以对于任意的x,y \in domf,有t y+(1-t) x \in \operatorname{dom} f\tilde{t} y+(1-\tilde{t}) x \in \operatorname{dom} f

        所以有f(t y+(1-t) x) \geqslant f(\tilde{t} y+(1-\tilde{t}) x)+\nabla f(\tilde{t} y+(1-\tilde{t}) x)^{T}(y-x)(t-\tilde{t})

        化简得g(t) \geqslant g(\tilde{t})+g^{\prime}(\tilde{t})(t-\tilde{t})

4.二阶条件

  • 定义:若函数f : \mathbf{R} \rightarrow \mathbf{R^n}二阶可微,则f为凸函数的充分必要条件是:

    1. domf为凸集
    2. \nabla^{2} f(x) \succeq 0,对于任意的x \in domf
  • 几何意义,二阶导数大于零,曲率为正,一阶导数为增函数。为了更好理解,可以局限在一维情况下,参照一下数学分析。

  • 证明:

    书上说让自己证明哦!

    显然可得。

  • 严格凸:对于任意的x \in domf,若\nabla^{2} f(x)>0,则函数f是严格凸函数。

    ​ 若函数f是严格凸函数,那么对于任意的x \in domf\nabla^{2} f(x)>0未必成立。

    ​ 也就是说\nabla^{2} f(x)>0大于零是严格凸的充分不必要条件。

    • 例如:函数f : \mathbf{R} \rightarrow \mathbf{R}f=x^4二阶可导,f''(x)=12x^2 \geqslant0,然而从图像可知此函数还是一个严格凸函数。
  • 例题:特殊情况:二次函数严格凸的充分必要条件是\nabla^{2} f(x)>0

快照58.png
  • 注:关于Hessian矩阵:联想一下二次型就可以理解了,特征值,特征向量。

5.例子

  • 快照69.png

补充:

  • 范数定义:R^n的范数P(x) x \in R^n满足
    1. P(ax)=|a|P(x)
    2. P(x+y)\leqslant P(x)+P(y)
    3. P(x)=0,则x=0
  • 零范数:非零元素的数目||x||_0=非零元素的数目,不是一个凸函数。它也不满足范数定义。

二.保凸运算

1.非负加权和

  • 非负加权和:凸函数集合本身是一个凸锥:凸函数的非负加权和任然是凸函数。若为凸f_1,f_2...f_m为凸,则f(x)=\sum_{i=1}^{m} w_if_{i}(x)为凸函数。其中w_i >=0

    证明:首先domf为所有f_i定义域的交集,所以定义域为凸集。其次,显然。

  • 非负加权和拓展:f(x,y)对任意固定的y \in A,f(x,y)均为关于x凸函数,设w(y)>=0,那么

    g(x)=\int_{y \in A} w(y) f(x, y) d y为关于x的凸函数。

2.复合仿射映射

  • 定义:假设函数f : \mathbf{R}^{n} \rightarrow \mathbf{R}, A \in \mathbf{R}^{n \times m},以及b \in \mathbf{R}^{n},定义g : \mathbf{R}^{m} \rightarrow \mathbf{R}g(x)=f(A x+b),其中\operatorname{dom} g=\{x | A x+b \in \operatorname{dom} f\}。若函数f是凸函数,那么g是凸函数;如果函数f是凹函数,那么函数g是凹函数。

    • 证明:

      1.证明\operatorname{dom} g=\{x | A x+b \in \operatorname{dom} f\}是一个凸集

      对于任意的x,y \in domg,0 \leqslant \theta \leqslant 1,A(\theta x+(1-\theta )y)+b=\theta (Ax+b)+(1- \theta)(Ay+b),

      已知domf是一个凸集且A x+b \in \operatorname{dom} f,A y+b \in \operatorname{dom} f

      由凸集的定义可得\theta (Ax+b)+(1- \theta)(Ay+b) \in domf

      所以\theta x+(1-\theta )y \in domg

      2.证明:g(x)=f(A x+b)是凸函数。

      因为f(x)是凸函数,那么可得f(\theta x+(1-\theta) y) \leqslant \theta f(x)+(1-\theta) f(y)

      g(\theta x+(1-\theta) y) =f(A(\theta x+(1-\theta)) y+b)=f(\theta (Ax+b)+(1-\theta)(Ay+b))

      \leqslant \theta f(Ax+b)+\theta f(Ay+b)=\theta g(x)+ (1-\theta) g(y)

      得证,所以复合仿射映射是一个凸函数。

3.逐点最大和逐点上确界

  • 逐点最大和

    • 定义:如果函数f_1f_2均为凸函数,则二者的逐点最大函数f,f(x)=\max \left\{f_{1}(x), f_{2}(x)\right\},定义域是\operatorname{dom} f=\operatorname{dom} f_{1} \cap \operatorname{dom} f_{2},仍然是个凸函数。

    • 证明:任取0\leqslant \theta \leqslant 1以及x, y \in \operatorname{dom} f,有

      \begin{aligned} f(\theta x+(1-\theta) y) &=\max \left\{f_{1}(\theta x+(1-\theta) y), f_{2}(\theta x+(1-\theta) y)\right\} \\ & \leqslant \max \left\{\theta f_{1}(x)+(1-\theta) f_{1}(y), \theta f_{2}(x)+(1-\theta) f_{2}(y)\right\} \\ & \leqslant \max \left\{\theta f_{1}(x)+\theta f_{2}(x)\right\}+ \max \left\{(1-\theta) f_{1}(y), (1-\theta)f_{2}(y)\right\} \\ & \leqslant \theta \max \left\{f_{1}(x), f_{2}(x)\right\}+(1-\theta) \max \left\{f_{1}(y), f_{2}(y)\right\} \\ &=\theta f(x)+(1-\theta) f(y) \end{aligned}

    • 例题:f(x)=max\{x^2,x\}

    • 推广:如果函数f_{1}, \cdots, f_{m}是凸函数,那么他们的逐点最大和f(x)=\max \left\{f_{1}(x), \cdots, f_{m}(x)\right\}也是凸函数。

  • 最大的r个分量之和:

    • 定义:对任意x \in \mathbf{R}^{n},用x_i表示x中第i大的分量,即将x中分量按照非降序排列得到下式:x_{[1]} \geqslant x_{[2]} \geqslant \cdots \geqslant x_{[n]},对x中前r个大的分量进行求和得到f(x)=\sum_{i=1}^{r} x_{[i]}是一个凸函数。

      此函数可以描述为f(x)=\sum_{i=1}^{r} x_{[i]}=\max \left\{x_{i_{1}}+\cdots+x_{i_{r}} | 1 \leqslant i_{1}<i_{2}<\cdots<i_{r} \leqslant n\right\}

    • 理解:即从x中随机选择r个元素求和可能组合中的最大值,这种取法共有n ! /(r !(n-r) !)可能。将每一种可能看做一个函数,那个最大的r个分量之和相当于对这n ! /(r !(n-r) !)逐点求和。而随机取值求和函数又是关于x的仿射映射,一定是一个凸函数,所以最大的r个分量之和也是凸函数。

    • 推广:w_{1} \geqslant w_{2} \geqslant \cdots \geqslant w_{r} \geqslant 0\sum_{i=1}^{r} w_{i} x_{[i]}也是一个凸函数

    • 推广:无限个凸函数的逐点上确界:如果对任意的y \in \mathcal{A},函数f(x, y)关于x是凸的,则函数g(x)=\sup _{y \in \mathcal{A}} f(x, y)也是凸的,定义域为\operatorname{dom} g=\left\{x |(x, y) \in \operatorname{dom} f \forall y \in \mathcal{A}, \sup _{y \in \mathcal{A}} f(x, y)<\infty\right\}

  • 实对称阵的最大特征值:

    f(X)=\lambda_{max}(X),domf=S^m,y是特征向量,

    Xy=\lambda y

    y^TXy=y^T\lambda y

    \lambda=y^TXy/||y||_2

    时,||y||_2=1时,\lambda_{max}(x)=sup\{y^TXy| ||y||_2=1\}

    由上述定理可知若对于每一个y,是一个凸函数y^TXy是一个凸函数,那么\lambda_{max}(x)=sup\{y^TXy| ||y||_2=1\}是一个凸函数。

三.共轭函数

四.拟凸函数

五.对数-凹函数 和 对数-凸函数

六.关于广义不等式的凸性

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,402评论 6 499
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,377评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,483评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,165评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,176评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,146评论 1 297
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,032评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,896评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,311评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,536评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,696评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,413评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,008评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,659评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,815评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,698评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,592评论 2 353

推荐阅读更多精彩内容