登录注册写文章

大模型微调部署全流程

大模型微调部署全流程

pipeline

数据标注 doccano/labelstudio
lora微调 ms-swift
模型部署

vllm
llama.cpp
ollama
安装更新参考：https://github.com/ollama/ollama/blob/main/docs/linux.md
- 已支持的模型架构，直接import safetensor模型
- 未支持的模型架构，需要用llama.cpp转成gguf格式
  llama.cpp安装可以用homebrew参考https://github.com/ggml-org/llama.cpp/blob/master/docs/install.md
  convert_hf_to_gguf.py直接下载llama.cpp代码库zip包

mv llama.cpp-master llama.cpp
cd llama.cpp
python convert_hf_to_gguf.py /data/tsliu/checkpoint/cpms-trade-tag/cpms-trade-tag-sft-250901-mexico-2-8B-100/v0-20250911-175818/checkpoint-26200-merged/ --outfile /data/tsliu/checkpoint/cpms-trade-tag/cpms-trade-tag-sft-250901-mexico-2-8B-100/v0-20250911-175818/qwen3-8b-trade-tag.gguf

ollama

gathering model components 
copying file sha256:37cd7996c99bcb361d3d048eb7116b1b19a54dafef26cd87152a4d25292826da 100% 
parsing GGUF 
using existing layer sha256:37cd7996c99bcb361d3d048eb7116b1b19a54dafef26cd87152a4d25292826da 
writing manifest 
success

ollama modelfile配置
需要配置的地方比较多，参考：https://github.com/ollama/ollama/blob/main/docs/modelfile.md

最后编辑于：2025.10.14 18:09:12

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

本地部署大语言模型技术实践：以 Ollama 为例
本地部署大语言模型技术实践：以Ollama为例一、大语言模型本地部署概述随着ChatGPT等大语言模型的兴起，...
Allenlll阅读 1,531评论 0赞 0
私有化部署 Llama3 大模型, 支持 API 访问
私有化部署 Llama3 大模型, 支持 API 访问视频 https://youtu.be/L--XLpc45...
独立开发者猫哥阅读 4,556评论 0赞 0

大模型（含deepseek r1）本地部署利器ollama的API操作指南
ollama介绍： Ollama 是一个开源的大型语言模型（LLM）平台，旨在让用户能够轻松地在本地运行、管理和与...
kovli阅读 4,149评论 0赞 0
AI大模型本地部署教程
简化版教程 1. 通过联网计算机下载【预训练模型文件】（Ollma）： 1). 选择模型：https://olla...
idengwei阅读 2,994评论 0赞 0
汇总本地部署DeepSeek的N种方法
1.概述想象一下这样的场景：你在咖啡店用笔记本电脑写代码时，AI助手能直接调用本地模型帮你补全代码；医生在问诊时...
机智工坊阅读 3,328评论 0赞 0

友情链接更多精彩内容

赞1赞

赞赏

手机看全文