
第6章在泛泛而谈,初学者感觉很难了解到实际性的东西,不过也根据章节结构结合相关资料做下梳理。 6.1 XOR ** 6.2 基于梯度的学习 参考...
归去来兮 小屋窗外微醺夜光 映着年华交叉的光芒 初进天香的白月光 不曾想安然 雪冬里开出的情莲 竟放肆灿烂 花蕊的中间 盛不解的温暖 散淡淡的柔...
1.问题求解: (1)拉格朗日乘子法 定义拉格朗日函数,KKT条件为:求极值,则令得到:代入消去和,得到原问题的对偶问题为由KKT条件得到:对于...
待更新 5.7 监督学习算法 5.7.1 概率监督学习 逻辑回归(logistic regression) 关于逻辑回归,之前在csdn上有总结...
5.1 学习算法 5.1.1 任务,T 常见机器学习任务列举:分类,输入缺失分类,回归,转录,机器翻译,结构化输出,异常检测,合成和采样,缺失值...
4.1 上溢和下溢 下溢 (underflow):当接近零的数被四舍五入为零 时发生下溢。上溢 (overflow):当大量级的数被近似为 ∞ ...
3.9 常用概率分布 3.9.1 Bernoulli 分布 Bernoulli分布 (Bernoulli distribution)是单个二值型...
3.1 为什么要用概率? 几乎所有的活动都需要能够在不确定性存在时进行推理。事实上,除了那些被定义为真的数学陈述,我们很难认定某个命题是千真万确...
2.1 标量、向量、矩阵和张量 标量(scalar):一个数向量(vector):一列数矩阵(matrix):二维数组张量(tensor):多维...
文集作者