CosyVoice2-0.5B：本地详细部署教程（Windows）

前言：项目介绍请参考官网CosyVoice2-0.5B，本文仅讲解部署实践内容

1. 克隆项目

确保你的设备上安装了Git Git - Downloads

git clone --recursive https://github.com/FunAudioLLM/CosyVoice.git
cd CosyVoice
git submodule update --init --recursive

安装 Conda / MiniConda: 请参阅 Download Now | Anaconda

安装后在Win开始菜单中找到 Anaconda Prompt 并打开，此时你的终端应该是 :

conda create -n cosyvoice python=3.10
conda activate cosyvoice
conda install -y -c conda-forge pynini==2.1.5

注意在执行 conda activate cosyvoice 后，确保你的终端（base）变成（cosyvoice）再执行下一步安装，否则会安装在系统Python中。

直接安装就行了，如果出现缺少了哪个库就手动安装一下。比如（Cython）

pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com

image.png

如果部署 CosyVoice2 - 0.5B，只用下载第一个模型就可以了。

注：Webui支持4种不同的推理模式：预训练音色、3s极速复刻、跨语种复刻、自然语言控制。

官方原文档给的是CosyVoice1.0的使用方法，我们先以启动WebUI为例。

打开webui.py的源码，可以看到默认加载的就是CosyVoice2的模型。直接运行python webui.py 即可。

image.png

运行页面如下：

image.png

注意事项：

1. 确保下载的模型存放路径正确：

pretrained_models/CosyVoice2-0.5B

2.预训练音色为空的情况：

根据上面的issus，需要手动下载spk2info.pt文件粘贴到pretrained_models/CosyVoice2-0.5B中，随后重新运行webui.py就能看到预训练模型：