- 租用 Autodl/恒源云/智星云 服务器
- 选择 100 80G/A800 80G 务器租用(2卡或以上),使用pytorch 1.11.0 python3.8版本镜像
- 下载02_llm_code.zip
- 解压后创建虚拟环境modelscope_env,pip install modelscope
- 安装完成后激活modelscope_env(source activate modelscope_env)
- 执行模型下载 llm_download/baichuan2_7B_base_download.py
- 下载完成,创建虚拟环境 llm_env
- 在 llm_env 中安装requirements.txt(pip install -r requirements.txt)
- 安装完成,在training_config/baichuan2_config.json 里面去修改训练参数(例如模型路径)
- 根据租用的GPU数量修改train_ft.sh里面的GPU配置
- 执行 nohup bash train_ft.sh > 1125.log &
- 查看显存利用情况 nvidia-smi
- 持续查看显存变化 watch -n -1 nvidia-smi
baichuan2全参数微调流程
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
相关阅读更多精彩内容
- 众所周知,大模型的训练需要大量的显存资源,单卡很容易就爆了,于是就有了单机多卡、多机多卡的训练方案。本文主要是介绍...
- 作者/编辑/配图 | 橘子 来源 | 橘子AI笔记(ID:datawitch) 如果从现在开始决定学习深度学习,写...
- 为了让后来的汉子不踩坑,本人此处打的是情怀牌,尽量会写详细点~ 有借鉴文章Ubuntu下安装TensorFlow的...
- 1. 运行快捷键 Ctrl + Enter,运行当前cell;Shift + Enter,运行当前cell,且转到...