240 发简信
IP属地:上海
  • Resize,w 360,h 240
    cub库 非2的次幂时warp redcue 时出现的bug修复

    Bug起源 来自于Nvidia 的cub库[https://github.com/NVIDIA/cub]的issue#179[https://g...

  • Resize,w 360,h 240
    CUB中radix sort数字代表含义说明

    在学习CUB库的radix sort时,会出现一系列一开始看起来奇怪的数字。现将其含义解释如下。 出现不同数字代表的含义 这是由于16bit合并...

  • Resize,w 360,h 240
    调试函数参数为函数的程序-如何略过函数参数

    需求 需求原因起源于cuda调试中,有许多函数的参数也是函数,暂且称之为参数函数。当我想直接进入一个函数而不是参数函数中时,直接用step是不行...

  • Resize,w 360,h 240
    CUB 中的warp_reduce_shfl,warp_scan_shfl的实现图解

    最近在看cub[https://nvlabs.github.io/cub/index.html]代码,记录对于其scan和reduce的算法理解...

  • Resize,w 360,h 240
    csappE3 Chapter5笔记

    5.4. 消除循环的低效率 代码移动:将要执行多次但是计算结果不会改变的计算,移动到到循环外面。image.png 5.5. 减少过程的调用 不...

  • Resize,w 360,h 240
    ddd 调试器使用

    设置ddd字体 原始的ddd字体丑陋,像素化,需要设置合适的字体大小,点击Edit->Preferences->Fonts。然后看到不同设置。然...

  • CUDA中的线程束洗牌指令之--------__shfl_xor

    近日感觉线程束洗牌指令还是很重要的,下面就记录一下自己的理解。 __shfl_xor命令 其中,returnValue 是从源线程中那个值返回的...

  • Resize,w 360,h 240
    i7-10700K的存储器山

    在看《深入理解计算机系统》时,上面有一个存储器山,自己也制作了一个自用电脑cpu的存储器山。放图如下: 时间局部性视图(步长S为1时) 可以看出...

  • 当有参构造函数进行非初始化列表构造时,是先执行成员默认初始化而非先执行默认构造函数

    当不用参数初始化列表进行构造函数时,成员参数会首先进行默认初始化,之前有一段时间自己以为会调用默认构造函数来初始化,后来发现还是有区别的。遂记录...