未成型的工程师 - 简书

发简信

未成型的工程师

0
关注
0
粉丝
6
文章
7294

字数
1

收获喜欢
1

总资产

IP属地：陕西

未成型的工程师

transformer、bert、ViT常见面试题总结
1.Transformer为何使用多头注意力机制？（为什么不使用一个头）答案解析参考这里：为什么Transformer 需要进行 Multi-head Attention？...

加油11dd23
20753 3 21 1
未成型的工程师

Mutihead-Self-Attention in Computer Vision
1.关于attention操作之后为什么要进行scale操作：比较大的输入会使得后续softmax的梯度变得很小，甚至导致梯度消失softmax求导:https://zhua...

975 0 0

未成型的工程师

vqvae
Vq-VAE:向量量化VAE VAE的本质就是通过隐变量的分布+decoder,获取目标数据分布基础VAE的思路：对隐变量进行各向同性标准正态分布的先验假设，训练完模型后我们...

10929 1 1
未成型的工程师

vae
VAE-变分自编码器变分：loss部分有kl divergence,kl散度是一个泛函数，泛函数求极值要用到变分法，VAE 的名字中“变分”，是因为它的推导过程用到了 KL...

3818 0 0
未成型的工程师

训练数据集与TFRecord互相转换的两种方式
TensorFlow使用TFRecord格式来统一存储数据，该格式可以将图像数据、标签信息、图像路径以及宽高等不同类型的信息放在一起进行统一存储，从而方便有效的管理不同的属性...

素娜93
11698 1 5
未成型的工程师

YOLO V4
YOLOV4论文：Yolov4: Optimal Speed and Accuracy of Object Detection[https://arxiv.org/pdf/2...

5127 0 0
未成型的工程师

NMS
获取yolo输出的box和对应的scores: 获取yolo的原始输出t_x,t_y,t_w,t_h，进一步得到b_x,b_y,b_w,b_h: 矫正bbx,并scale至原...

2778 0 0

未成型的工程师

YOLO V3
yolov3论文:Yolov3: An Incremental Improvement[https://arxiv.org/pdf/1804.02767.pdf] yolov...

3880 0 0
未成型的工程师

python PIL 图像处理
Image读出来的是PIL的类型，而skimage.io读出来的数据是numpy格式的输出可以看出Img读图片的大小是图片的(width, height)；而skimage...

jiandanjinxin
97456 2 52
未成型的工程师

暂无个人介绍