标签(空格分隔): 计算机视觉 深度学习
1、前言
在进入深度学习之前,究竟需要怎样的预备知识才能比较好地入门,在学习过程当中有哪些书籍和资料的推荐等,针对上述的问题我给大家分享一下自己的学习经验。
本人非AI科班出身,靠自己原有计算机专业知识的底子、兴趣、意识能力性和交流来学习机器学习、深度学习、计算机视觉等相关知识。
在这里我就不列举机器学习的基础知识了,先介绍一下图形学与深度学习的关系,下面这幅图能比较好的解释它们之间的关系。
image_1d615v4u68rm1jiu1c4iifg15djm.png-55.3kB
image_1d615vhad1u40ilk15dmb61agu13.png-96.9kB
image_1d615vqnoq251jjeaj11t3obd51g.png-162.1kB
在2017年SIGGRAPH学术报告的一个趋势是深度学习技术在图形学领域开始生根发芽。中国学者论文“Modeling Surface Appearance from a Single Photograph using Self-Augmented Convolutional Neural Networks”。首次尝试利用深度学习技术,仅通过一张未知光照条件下拍摄的平面材质照片,就可以恢复出该材质的表现纹理模型。
image_1d615mbgn1q0e1q3fuc91rmf17me9.png-141.3kB
渲染表面细节:凹凸贴图、法线贴图、视差贴图、浮雕贴图。
渲染实时性、延迟性。
如果想要完全进入深度学习领域的同学,了解并掌握以下知识点是必不可少。
2、激活函数
激活函数既可以是线性或非线性的。
2.1、非线性sigmoid函数
image_1d62m57mq1ci77g4bm41e3p1ba92j.png-1.6kB
Plots:
image_1d62m3fbo15nb182m14jocgq1irn1p.png-7.1kB
极限
image_1d62mvi3q128udu51uiu17h8s3v6g.png-3.8kB
使用泰勒公式展开是
image_1d62moie3bn66lc12mehi82904a.png-0.8kB
=
image_1d62m4h9m20ka0ae7j1tbd167d26.png-2.7kB
,不得不说泰勒的火眼金睛是整个数学界最犀利的眼神,它一眼就能识破各种极限运算。
一阶导数
image_1d62m6pvr1gmtgh0nqrctp1qdp3g.png-4kB
定积分
image_1d62m7k6d1gr4tvichbsbqb1p3t.png-5.5kB
2.2、双曲正切函数tanh:
image_1d62mrg79tsv1oqt11qca9llvv57.png-1.6kB
image_1d62mrq5vrh5tgb1m86irqj4f5k.png-8.2kB
image_1d62n2i2l1vvi10m21i1joih16v28g.png-6.2kB
image_1d62n3jq8nvobv1cok1fhhss98t.png-4.4kB
image_1d62n3sgn1egpd2d5npo61q669a.png-5.9kB
image_1d62n492819qavnjb3g1moc1eee9n.png-4kB
2.3硬限幅函数
image_1d62omui917jq1tjoacmr5g9buct.png-6.3kB
激活函数可以是“硬限幅函数”,这属于信号系统范畴的知识点,可以通俗地理解为对正弦波一部分较大的信号做过滤操作,可以使那些过大的数在不改变原有信号符号位情况下允许在幅度上部分失真。
正弦波
image_1d62oe4jibnliak1jvt716ehc3.png-59.8kB
设定硬限幅的阀值,超过这个阀值的信号就会被过滤掉,硬限幅的正弦波。
image_1d62ofucfuot87n1lg0grv1tbhcg.png-80.1kB
部分信号被高位截取了。
2.4斜面函数
image_1d62onn48h9etm711k91avo801da.png-7.4kB
2.5矩阵运算
2.6导数公式
2.7梯度下降算法
2.8反射传播算法,又分为通用反向传播算法和逐层反向传播算法
2.9通用逼迫定理
2.10内外卷积运算
2.11膨胀卷积运算
2.12上下采样运算
2.13卷积面计算
2.14池化面计算
2.15局部响应归一化
2.16权值偏置初始化
2.17丢失输出
2.18丢失连接
2.19随机梯度下降算法
2.20块归一化
2.21动态规划算法