240 发简信
IP属地:湖北
  • Resize,w 360,h 240
    2025记忆

    工作电脑 lenovo 昭阳 K14 上班的路上,在接近西山的北清路上,月亮挂在山尖。 为我的小黄蜂自行车开发了一个模型,预测下一次的保养时间,...

  • Resize,w 360,h 240
    Spring AI Alibaba

    一、 什么是 Spring AI Alibaba Spring AI Alibaba 开源项目基于 Spring AI 构建,是阿里云通义系列模...

  • Resize,w 360,h 240
    将PyTorch模型迁移至昇腾设备上训练(三、PyTorch迁移性能调优)

    零、性能指标 昇腾模型性能调试中的基本性能指标,包括吞吐率、线性度和算力利用率等。 在计算性能指标中,优先级排序为:吞吐率 > 单步迭代时间 >...

  • Resize,w 360,h 240
    将PyTorch模型迁移至昇腾设备上训练(二、模型精度对齐)

    一、精度问题概述 随着ChatGPT的推出,大模型迅速成为AI界热点。大模型训练需要强大的算力支撑,涉及数据、模型、框架、算子、硬件等诸多环节。...

  • Resize,w 360,h 240
    将PyTorch模型迁移至昇腾设备上训练、模型精度对齐以及性能调优(一)

    训练代码迁移 前提条件 要迁移的训练任务代码在GPU上多次训练稳定可收敛。训练业务代码和数据,应该确保在GPU环境中能够运行,并且训练任务有稳定...

  • 人工智能算子

    在人工智能领域,算子(Operator)是指用于执行特定计算任务的基本单元,是构建和优化神经网络模型的核心组件。人工智能算子(AI Operat...

  • 大模型训练TP/DP/PP/EP概念

    在大模型训练中,TP(张量并行)、DP(数据并行)、PP(流水线并行)和 EP(专家并行)是常见的并行计算策略,用于解决模型规模增长带来的显存不...

  • 大模型概念白话版

    一、训练和推理 训练(通过输入x和输出y反推权重w和偏置b)的过程在数学中被称为拟合,即训练。模型需要先进行训练,找到尽量符合要求的w和b,之后...

  • RAG VS. Finetune

    RAG类比开卷考试,Finetune类似专业课程学习。 特点对比检索增强生成 (RAG)微调 (FT)知识更新RAG直接更新检索知识库,保持信息...

个人介绍
骑行侠,顺便搞点技术。