240 发简信
IP属地:贵州
  • Resize,w 360,h 240
    大模型的工作原理:分布式训练入门

    我有个同事的签名是"大模型是真的大",大模型(如GPT、LLaMA)之所以被称为“大”,不仅因为它们的参数量高达数十亿甚至上万亿,更因为它们需要...

  • 大模型如何理解自然语言:分词器的入门指南

    在自然语言处理(NLP)的领域中,"大模型"如同一位精通语言的大师,能够理解并生成各种文本。这些模型并非生来就具备这种能力,而是依赖于大量的训练...

  • Resize,w 360,h 240
    Mermaid-程序员画图汇报利器

    引言 在技术文档和博客中,图表是传达复杂信息的有力工具。然而,传统的图表创建方法往往耗时且需要特定的设计技能。Mermaid 作为一款创新的基于...

  • Resize,w 360,h 240
    一碗云吞面

    上一次吃这么好吃的云吞面,还是在香港的旺角。那时还在读书,没什么钱,在一个破破小小的街边小店,看白发苍苍的老爷子穿着西裤衬衫给把面端上来。点之前...

  • Resize,w 360,h 240
    并行计算如何加速计算前缀和(cumsum)

    前缀和(Prefix Sum) 前缀和是一种常用的算法技巧,它可以快速地求出一个数组的某个区间的和。前缀和的思想是,对于一个数组a,我们可以预先...

  • 为什么float16类型累加1结果为2048

    什么是float16类型 float16类型是一种二进制浮点数格式,占用16位(两个字节)的内存空间。它是为了在一些对精度要求不高的应用中,节省...

  • 如何查看cuda源码的汇编程序

    CUDA 是 NVIDIA 开发的一种通用并行计算平台和编程模型,可以利用 GPU 的强大计算能力来加速各种应用程序。本文将介绍如何使用 CUD...

  • 软件诊断学-存泄漏与内存管理问题

    内存泄漏是指程序中已动态分配的堆内存由于某种原因未释放或者无法释放,造成的内存浪费,导致程序运行速度减慢甚至系统崩溃等严重后果。内存泄漏是C/C...

  • 软件诊断学-静态分析与动态分析

    软件诊断学是一门研究软件故障、缺陷和异常的科学,它需要运用不同的分析方法来发现和解决软件问题。软件诊断学中常用的两种分析方法是静态分析和动态分析...