作者:流浪的拉多weibo.com/ttarticle/p/show?id=2309404241869646237445 作为前端工程师,有时需要将做到一半的网页发送给 PM...
![240](https://cdn2.jianshu.io/assets/default_avatar/8-a356878e44b45ab268a3b0bbaaadeeb7.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
作者:流浪的拉多weibo.com/ttarticle/p/show?id=2309404241869646237445 作为前端工程师,有时需要将做到一半的网页发送给 PM...
(1)条件概率公式 设A,B是两个事件,且P(B)>0,则在事件B发生的条件下,事件A发生的条件概率(conditional probability)为: ...
Mini-batch 梯度下降 如果训练集较小,直接使用 batch 梯度下降法,样本集较小就没必要使用 mini-batch 梯度下降法,你可以快速处理整个训练集,所以使用...
大数据时代,我们现在的数据量可能是百万级别,那么验证集和测试集占数据总量的比例会趋向于变得更小。因为验证集的目的就是验证不同的算法,检验哪种算法更有效,因此,验证集要足够大才...
为避免隐层神经元的作用完全一样,我们可以随机初始化参数,例如:把𝑊[1] 设为np.random.randn(2,2)(生成高斯分布),通常再乘上一个小的数,比如 0.01,...
为什么relu这种“看似线性”(分段线性)的激活函数所形成的网络,居然能够增加非线性的表达能力。 1、首先什么是线性的网络,如果把线性网络看成一个大的矩阵M。那么输入样本A和...
VS Code中开启笔记本模式,代码前加一行#%%就可以了。 Code Runner中打开Run in terminal设置即可支持conda虚拟环境了。
计算图:TODO Session Where we launch the graph. A Session object is the part of the TensorF...
泛化(generalization) 正则化(regularization): 归一化(normalization):
监督学习指的就是我们给学习算法一个数据集。这个数据集由“正确答案”组 成。 在无监督学习中,我们已知的数据。看上去有点不一样,不同于监督学习的数据的样子, 即无监督学习中没有...
损失函数一般用欧式距离的平方,但某些条件下(例如激活函数的选择),会造成代价函数是非凸的,这不利于我们找到全局最小值,这时我们不得不另做打算,比如上面的逻辑回归问题中损失函数...
Sigmoid将输出映射到(0,1)区间,并将线性数据映射到非线性空间 ReLU将输出映射到(0,♾)范围内,本质上是,为的是剔除不必要的负值数据,相较于Sigmoid函数,...
第一步 配置HTTP代理,这步与抓取HTTP请求是一样的: 选择在8888端口上监听,然后确定。勾选了SOCKS proxy,还能截获到浏览器的http访问请求。 第二步 安...
根据错误信息将对应模块手动下载下来后,放到Homebrew缓存文件夹再重新安装。 具体过程如下: 比如安装python@2时遇如下报错: 拷贝地址https://ftp.gn...
根据Mac OS X操作系统的版本选择以下命令:Mac OS X 12 (Sierra) and later: Mac OS X 11 (El Capitan) and OS...
大家伙来自景德镇航空科技馆