参考链接:https://datawhalechina.github.io/unusual-deep-learning/#/README
第一部分、深度学习
一、定义
定义:
深度学习一般是指通过训练多层网络结构对未知数据进行分类或回归。
分类:
有监督学习方法——深度前馈网络、卷积神经网络、循环神经网络等;
无监督学习方法——深度信念网、深度玻尔兹曼机,深度自编码器等。
二、主要应用
图像处理、语音识别、自然语言处理、综合应用等。
第二部分、数学基础
一、矩阵论
矩阵是一个二维数组,是二阶张量,三维及以上数组一般称为张量。
矩阵的秩:行秩=列秩=矩阵的秩,通常记作rank(A)。
矩阵的逆:矩阵与矩阵的逆相乘得到单位矩阵。
二、概率统计
2.1 常见的概率分布
伯努利分布
- 伯努利试验:只可能有两种结果的单次随机实验
- 又称0-1分布,单个二值型离散随机变量的分布
- 其概率分布:P(X=1)=p, P(X=0)=1-p。
二项分布
- 重复n次伯努利试验,各试验之间都相互独立
-
如果每次试验时,事件发生的概率为p,不发生的概率为1-p,则n次重复独立试验中事件发生k次的概率为
image.png
均匀分布
均匀分布,又称矩形分布,在给定长度间隔[a,b]内的分布概率是等可能的,均匀分布由参数a,b定义,概率密度函数为:
image.png
高斯分布
高斯分布,又称正态分布(normal),是实数中最常用的分布,由均值μ和标准差σ决定其分布,概率密度函数为:
image.png
指数分布
常用来表示独立随机事件发生的时间间隔。
三、最优化估计
最小二乘估计
最小二乘估计又称最小平方法,是一种数学优化方法。它通过最小化误差的平方和寻找数据的最佳函数匹配。最小二乘法经常应用于回归问题,可以方便地求得未知参数,比如曲线拟合、最小化能量或者最大化熵等问题。
最大似然估计
最大似然估计是将观测的联合密度函数或者联合概率函数看成是未知参数的函数, 称为似然函数,通过最大化似然函数来估计参数。
总结
通过深度学习基础的学习,使得自己更容易理解深度学习并知道哪些场景可以使用,哪个方向可以进一步拓展。数学基础是基石,可以更快的掌握深度学习。