Silence_Dong - 简书

发简信

0
关注
30
粉丝
19
文章
22542

字数
43

收获喜欢
18

总资产

IP属地：澳门

Silence_Dong

确实应该是『编码网络』，感谢指正

详解深度学习中“注意力机制”
1. 前言本文翻译自《Attention?Attention!》博客最近几年，注意力——在深度学习社区中，已然成为最广为流行的概念和实用工具。在这篇博客里，我们将一起回顾...

Silence_Dong
48303 2 29 1
Silence_Dong ·

"早期的研究仅使用解码网络的最后一个状态"应该是“编码网络”

咚咚董dyh 评论自详解深度学习中“注意力机制”

Silence_Dong

详解梯度下降优化算法
1. 文章 An overview of gradient descent optimization algorithms 2. 概要梯度优化算法，作为各大开源库（如Ten...

3989 0 5
Silence_Dong

【可视化】网络Attention层
1. 前言准备中期答辩，补充了一个实验，需要对网络结构中的attention层进行可视化，观察序列输入的哪些词或者词组合是网络比较care的。在小论文中主要研究了关于词性...

4048 0 0
Silence_Dong

详解深度学习中“注意力机制”
1. 前言本文翻译自《Attention?Attention!》博客最近几年，注意力——在深度学习社区中，已然成为最广为流行的概念和实用工具。在这篇博客里，我们将一起回顾...

48303 2 29 1
Silence_Dong

Java核心技术--对象与类
4.5 方法参数方法参数的使用一个方法不能修改一个基本数据类型的参数（即数值型和布尔型）一个方法可以改变一个对象参数的状态一个方法不能让对象参数引用一个新的对象（举个...

265 0 0
Silence_Dong

Java核心技术--接口与内部类
6.1 接口implement 继承接口，即履行“义务” 接口中所有的方法自动属于public，在接口声明中，不必提供关键字public 接口中决不能含有实例域，也不能在接口...

551 0 1

Silence_Dong

机器学习面试006—朴素贝叶斯
1. 怎么理解朴素贝叶斯中的“朴素”？因为它假定所有的特征在数据集中的作用是独立同分布的，但这个假设在现实生活中很不真实，因此很“朴素”。 2. 网页搜索中的拼写检查可以基...

865 0 0
Silence_Dong

算法面试小结
1. 求一个数转化为二进制后，包含1的数量 2. 求平均值解析：x&y是取相同位与，结果是x和y相同位的和的一半；x^y是取x和y的不同位，右移相当于除以2，所以这个函数的...

589 0 0
Silence_Dong

机器学习面试001—支持向量机SVM
1. 关于min和max交换位置满足的 d* <= p* 的条件并不是KKT条件 Ans：这里并非是KKT条件，要让等号成立需要满足strong duality(强对偶)，之...

447 0 1
Silence_Dong

机器学习面试005—决策树
1. 请问（决策树、随机森林，Boosting、Adaboot）GBDT和XGBoost的区别是什么？ Ans：①首先，随机森林是一个包含多个决策树的分类器；AdaBoost...

1423 0 2
Silence_Dong

机器学习面试004—正则化
1. L1范数和L2范数的区别是什么？ Ans：①L1范数——指向量中各个元素的绝对值之和，又叫“稀疏规则算子”(Lasso regularization)。它可以实现特征的...

581 0 0

Silence_Dong

机器学习面试003—逻辑斯蒂回归
1. LR为什么可以用来做CTR预估？ Ans：若把点击的样本作为正例，未点击的样本作为负例，则样本的CTR就是样本为正例的概率，LR可以输出样本为正例的概率，故可以解决此类...

845 0 2
Silence_Dong

数据结构基础
循环列表约瑟夫环问题核心步骤：建立一个具有n个链节点、无头节点的循环链表确定第一个报数人的位置不断地从链表中删除链节点，直到链表为空队列编程实现队列的入队、出队...

490 0 0
Silence_Dong

机器学习面试002—kNN
1. 如何理解kNN中的k的取值？ Ans ：①选取较小的k值时，相当于用较小的领域中的训练实例进行预测，“学习”近似误差会减小，只有与输入实例很相近的样本才会对预测结果起作...

1030 0 0
Silence_Dong

BP神经网络下MNIST字体识别
1. BP神经网络神经网络又称多层感知机，主要包括前馈和反向传播算法，对不同的任务，构建包含不同单元数的隐含层，融合合适的激活函数（Sigmoid、softmax、tan...

3277 1 0
Silence_Dong

NoClassDefFoundError排坑经历
1. 前言实习做NLP任务时，在离线train获得模型bin文件后，在部署到线上之前经常需要测试一下QPS等指标，用Java写了测试流程，用Maven打成jar包之后，上传...

1068 0 1

Silence_Dong

JFastText 挖坑指南
1. 前言之前在做文本分类任务，使用了Facebook开源的Fasttext工具，用其在Unix下编译后得到的fasttext命令训练生成*.bin文件。由于线上需要封装成...

2225 0 0

暂无个人介绍