240 发简信
IP属地:山西
  • Resize,w 360,h 240
    2025记忆

    工作电脑 lenovo 昭阳 K14 上班的路上,在接近西山的北清路上,月亮挂在山尖。 为我的小黄蜂自行车开发了一个模型,预测下一次的保养时间,...

  • Resize,w 360,h 240
    Higress AI 网关

    完整实现步骤 1. 环境准备 安装完成后访问控制台http://localhost:8001,完成初始化配置。[http://localhost...

  • Resize,w 360,h 240
    训练属于你的VL多模态大模型——详解Qwen3-VL-4B的LoRA微调实战

    引言 在人工智能的星辰大海中,多模态大模型(Vision-Language Models, VLMs)正以前所未有的速度重塑我们与机器交互的方式...

  • 4卡分布式进行VL模型训练——完整原因分析与解决方案总结

    🔍 根本原因 在使用 DeepSpeed ZeRO-3 多卡训练 Qwen3-VL-8B 多模态大模型 时,出现了以下两个关键问题: 1. 多进...

  • Resize,w 360,h 240
    将自有数据集和模型接入训推平台

    一、将自有模型接入训推平台 由于我们的自有模型基于 Qwen 训练得到,因此需在 qwen.py 文件中注册该模型,以便将其纳入训推平台的模型列...

  • 大模型安全

    https://www.sgpjbg.com/baogao/724903.html[https://www.sgpjbg.com/baogao/...

  • 基于 qz 工具的 LLM 模型评估实践指南

    在大语言模型(Large Language Model, LLM)研发与部署流程中,模型评估是验证模型性能、指导迭代优化的关键环节。本文将围绕 ...

  • Resize,w 360,h 240
    使用 qz 工具实现 Qwen3-0.6B 的 4-bit 量化与高效推理

    随着大语言模型(LLM)参数规模不断增长,如何在资源受限的设备(如消费级 GPU 或笔记本电脑)上高效部署模型成为关键挑战。模型量化作为一种主流...

  • PaddleSpeech安装部署与快速上手指南

    PaddleSpeech安装部署与快速上手指南 这篇文章比官方的指南系统。原文链接:https://blog.csdn.net/gitblog_...

个人介绍
骑行侠,顺便搞点技术。