240 发简信
IP属地:上海
  • Resize,w 360,h 240
    2025记忆

    工作电脑 lenovo 昭阳 K14 上班的路上,在接近西山的北清路上,月亮挂在山尖。 为我的小黄蜂自行车开发了一个模型,预测下一次的保养时间,...

  • 规模参数模型对应的硬件配置

    不同模型的参数精度不同,以下仅为参考。以下是不同参数规模模型对应的硬件配置对比表格,包含关键指标和适用场景: 参数规模显存需求推荐显卡(NVID...

  • 微调教程——LoRA 轻量微调

    一、LoRA核心技术:大模型的「高效笔记法」(用1%的力气,拿99%的效果) 1. LoRA原理:从「全量抄书」到「划重点」的逆袭 核心逻辑:预...

  • 微调教程——有监督微调SFT

    一、大模型训练核心概念:从预训练到微调(大模型的 “养成记”:从识字到刷题) 1. 预训练:模型的九年义务教育(识字阶段) 定义:想象让模型参加...

  • 微调教程——概述

    一. 引言 欢迎来到这篇 对 Qwen2.5-0.5B-Instruct 模型进行监督微调 (Supervised Fine-Tuning, S...

  • 使用 LoRA 对 DeepSeek R1 进行微调

    在使用LoRA对DeepSeek R1进行微调时,LoraConfig中的参数设置对模型性能和训练效率有重要影响。下面详细解释各参数含义及调整策...

  • Resize,w 360,h 240
    自定义帮助文档

    一、基础知识 Sphinx,这是一个非常流行的文档生成工具,主要用于为 Python 项目、开源库、技术文档等生成美观的 HTML、PDF、EP...

  • 多节点部署LLM推理服务(方式二k8s)

    多节点部署LLM推理服务(方式一Docker Compose )[https://www.jianshu.com/p/c67e1521f387]...

  • 多节点部署LLM推理服务(方式一Docker Compose )

    多节点部署LLM推理服务(方式二k8s)[https://www.jianshu.com/p/afc67aa05908?v=1752381786...

个人介绍
骑行侠,顺便搞点技术。