240 发简信
IP属地:四川
  • Full Stack Optimization of Transformer Inference: a Survey

    摘要 分析和研究现有transformer架构中的瓶颈及其与以往卷积模型的异同; transformer架构对硬件的影响,包括非线性操作、Sof...

  • xgboost保存读取模型

    模型实质 xgboost是专注于树模型的梯度提升库,因此xgboost内部有两个不同的部分: 由trees组成的模型 用来建立模型的超参数和配置...

  • FLOAT POINT

    FLOAT POINT Computers represent real values in a form similar to that of...

  • C++常用

    extern的用法 引用同一文件中的变量(引用在定义之前) 引用另一个文件中的变量(另一文件定义的变量必须为全局变量) 引用另一文件中的函数(e...

  • pickle版本问题

    python 3.8及以上版本存的pickle,python3.8以下的版本pickle打不开。查阅pickle函数参数后发现,是自己函数参数使...

  • BatchNormalization、LayerNormalization、InstanceNorm、GroupNorm、SwitchableNorm总结

    1、 综述 1.1 论文链接 1、 Batch Normalization https://arxiv.org/pdf/1502.03167....

  • BN

    1 提出背景 在深度学习中,由于问题的复杂性,我们往往会使用较深层数的网络进行训练,尤其是对深层神经网络的训练调参更是困难且复杂。在这个过程中,...

  • Resize,w 360,h 240
    Relu

    优点 ReLU是神经网络中最常用的激活函数,尤其是在CNN中。如果您不确定要在网络中使用哪种激活功能,通常最好选择ReLU。 对于所有正值,Re...