1、下载LMStudio
官网路径如下:
https://lmstudio.ai/
2、安装LMStudio
下载版本为LM Studio 0.4.8,安装路径避免中文或特殊字符,根据window向导安装LLM

安装LMStudio
3、启动LMStudio,合适的下载大模型
官方模型库有为:https://huggingface.co ,下载速度如下

下载速度
如果觉得下载比较慢,可以更换下载地址为
# 在LM Studio设置中添加镜像源
https://hf-mirror.com
或者先到魔搭社区下好大模型, 本地加载
魔搭社区地址
https://www.modelscope.cn/models

下载对应的大模型
4、启动大模型,通过LMStudio前台访问
加载启动大模型,并用询问大模型问题

启动大模型
通过window的任务管理器可以查看GPU的使用情况

GPU使用情况
5、启动大模型,作为本地服务提供API
启动服务指定端口
lms server start --bind 0.0.0.0 --port 1234
通过如下命令查看是否启动成功
curl http://127.0.0.1:1234/v1/models
设置模型空闲就关闭
lms load <model> --ttl 1800
其他配置
LMStudio相关调优设置
线程数:设置为CPU物理核心数的70-80%
批处理大小:GPU用户可尝试32-128之间的值
上下文长度:从2048开始测试,每增加一倍需要约2倍显存
温度(Temperature):创造性任务用0.7-1.0,事实性回答用0.1-0.3
对接OpenCode的时候配置opencode.json
{
"$schema": "https://opencode.ai/config.json",
"disabled_providers": [
"lm_studio_local"
],
"provider": {
"lm_studio": {
"name": "lm studio",
"npm": "@ai-sdk/openai-compatible",
"models": {
"qwen3.5-14b-a3b-claude-4.6-opus-reasoning-distilled-reap": {
"name": "qwen3.5-14b-a3b-claude-4.6-opus-reasoning-distilled-reap"
}
},
"options": {
"baseURL": "http://localhost:1234/v1"
}
}
}
}
解决cmd无法启动watch -n 1 nvidia-smi ,找到本地环境的nvidia的驱动安装路径命令
dir /s C:\nvidia-smi.exe
并将找到的路径加到环境变量path中
另外,window的显卡查看命令和linux不一样
do {
nvidia-smi
sleep 5
} while ($true)
或
nvidia-smi -l 1