Bug起源 来自于Nvidia 的cub库[https://github.com/NVIDIA/cub]的issue#179[https://g...
在学习CUB库的radix sort时,会出现一系列一开始看起来奇怪的数字。现将其含义解释如下。 出现不同数字代表的含义 这是由于16bit合并...
需求 需求原因起源于cuda调试中,有许多函数的参数也是函数,暂且称之为参数函数。当我想直接进入一个函数而不是参数函数中时,直接用step是不行...
最近在看cub[https://nvlabs.github.io/cub/index.html]代码,记录对于其scan和reduce的算法理解...
5.4. 消除循环的低效率 代码移动:将要执行多次但是计算结果不会改变的计算,移动到到循环外面。image.png 5.5. 减少过程的调用 不...
设置ddd字体 原始的ddd字体丑陋,像素化,需要设置合适的字体大小,点击Edit->Preferences->Fonts。然后看到不同设置。然...
近日感觉线程束洗牌指令还是很重要的,下面就记录一下自己的理解。 __shfl_xor命令 其中,returnValue 是从源线程中那个值返回的...
在看《深入理解计算机系统》时,上面有一个存储器山,自己也制作了一个自用电脑cpu的存储器山。放图如下: 时间局部性视图(步长S为1时) 可以看出...
当不用参数初始化列表进行构造函数时,成员参数会首先进行默认初始化,之前有一段时间自己以为会调用默认构造函数来初始化,后来发现还是有区别的。遂记录...