缘起:今天想尝试在vs code中使用python,出现了几行warning,大意是conda无法激活。 总结经验: Anaconda可以看作是一个虚拟机,我们的python...
缘起:今天想尝试在vs code中使用python,出现了几行warning,大意是conda无法激活。 总结经验: Anaconda可以看作是一个虚拟机,我们的python...
论文中比较模型的性能时,需要提供模型的大小。 衡量模型大小的指标有:parameters和 [FLOPs, MACs, MAdds] 中三者之一。 1. FLOPs, MAC...
0x00 背景知识 先放上一篇综述文章,对于理解NAS(网络结构搜索)的问题有很大的帮助:https://blog.csdn.net/c9Yv2cf9I06K2A9E/art...
我们在使用tensorflow+pycharm 或者PyTorch写程序的时候,有时候会在控制台终止掉正在运行的程序,但是有时候程序已经结束了,nvidia-smi也看到没有...
程序员这个行业,不管你是大佬还是小弟,代码code review是必不可少的。那么在git上,大家日常交流的缩写语,往往一下就能看出你道行的深浅,至少是入行时间,哈哈,不要露...
1.类图基础属性 2.类与类之间关系 在UML类图中,常见的有以下几种关系: 泛化(Generalization), 实现(Realization),关联(Associati...
【GiantPandaCV导语】上学期快结束的时候参加了华为和CCF组织的零售商品识别的比赛,队伍名称为GiantPandaCV队,比赛大约持续了两个月,期间从开始摸索Min...
【GiantPandaCV导语】通过在Transformer基础上引入Deformable CNN中的可变性能力,在降低模型参数量的同时提升获取大感受野的能力,文内附代码解读...
【GiantPandaCV导语】CoAt=Convolution + Attention,paperwithcode榜单第一名,通过结合卷积与Transformer实现性能上...
【GiantPandaCV导语】来自商汤和南洋理工的工作,也是使用卷积来增强模型提出low-level特征的能力,增强模型获取局部性的能力,核心贡献是LCA模块,可以用于捕获...
最近看到一篇博客,将最新的LookAhead和RAdam优化器结合,产生了一个新的算法——Ranger,获得了比单独使用RAdam要好的效果。后来有人将LARS与Ranger...
1.引言 为什么要并行 近几年,依赖大规模标注数据和大量的可学习参数,深度神经网络才能异军突起,占得机器学习半壁江山。然而,也是因为这两点使得深度学习的训练变得极其困难,尤其...
报错:RuntimeError: one of the variables needed for gradient computation has been modified...
【GiantPandaCV导语】基于Transformer的骨干网络,同时使用卷积与自注意力机制来保持全局性和局部性。模型在ResNet最后三个BottleNeck中使用了M...
【GiantPandaCV导语】与之前BoTNet不同,CvT虽然题目中有卷积的字样,但是实际总体来说依然是以Transformer Block为主的,在Token的处理方面...
A Battle of Network Structures: An Empirical Study of CNN, Transformer, and MLP 【GiantP...