工作电脑 lenovo 昭阳 K14 上班的路上,在接近西山的北清路上,月亮挂在山尖。 为我的小黄蜂自行车开发了一个模型,预测下一次的保养时间,...
不同模型的参数精度不同,以下仅为参考。以下是不同参数规模模型对应的硬件配置对比表格,包含关键指标和适用场景: 参数规模显存需求推荐显卡(NVID...
一、LoRA核心技术:大模型的「高效笔记法」(用1%的力气,拿99%的效果) 1. LoRA原理:从「全量抄书」到「划重点」的逆袭 核心逻辑:预...
一、大模型训练核心概念:从预训练到微调(大模型的 “养成记”:从识字到刷题) 1. 预训练:模型的九年义务教育(识字阶段) 定义:想象让模型参加...
一. 引言 欢迎来到这篇 对 Qwen2.5-0.5B-Instruct 模型进行监督微调 (Supervised Fine-Tuning, S...
在使用LoRA对DeepSeek R1进行微调时,LoraConfig中的参数设置对模型性能和训练效率有重要影响。下面详细解释各参数含义及调整策...
一、基础知识 Sphinx,这是一个非常流行的文档生成工具,主要用于为 Python 项目、开源库、技术文档等生成美观的 HTML、PDF、EP...
多节点部署LLM推理服务(方式一Docker Compose )[https://www.jianshu.com/p/c67e1521f387]...
多节点部署LLM推理服务(方式二k8s)[https://www.jianshu.com/p/afc67aa05908?v=1752381786...