FastChat
FastChat是一个开源推理库,侧重于模型的分布式部署实现,并提供了OpenAI样式的RESTFul API。
pip3 install "fschat[model_worker,webui]"
python3 -m fastchat.serve.controller
在新的terminal中启动:
FASTCHAT_USE_MODELSCOPE=true python3 -m fastchat.serve.model_worker --model-path qwen/Qwen-1_8B-Chat --revision v1.0.0
之后在新的terminal中可以运行界面进行推理:
python3 -m fastchat.serve.gradio_web_server
参考文档:
https://blog.csdn.net/lovechris00/article/details/140489689