Window上通过LMStudio本地部署大模型

1、下载LMStudio

官网路径如下:

https://lmstudio.ai/

2、安装LMStudio

下载版本为LM Studio 0.4.8,安装路径避免中文或特殊字符,根据window向导安装LLM


安装LMStudio

3、启动LMStudio,合适的下载大模型

官方模型库有为:https://huggingface.co ,下载速度如下

下载速度

如果觉得下载比较慢,可以更换下载地址为

# 在LM Studio设置中添加镜像源
https://hf-mirror.com

或者先到魔搭社区下好大模型, 本地加载
魔搭社区地址

https://www.modelscope.cn/models
下载对应的大模型

4、启动大模型,通过LMStudio前台访问

加载启动大模型,并用询问大模型问题


启动大模型

通过window的任务管理器可以查看GPU的使用情况


GPU使用情况

5、启动大模型,作为本地服务提供API

启动服务指定端口

lms server start --bind 0.0.0.0 --port 1234

通过如下命令查看是否启动成功

curl http://127.0.0.1:1234/v1/models

设置模型空闲就关闭

lms load <model> --ttl 1800

其他配置

LMStudio相关调优设置
线程数:设置为CPU物理核心数的70-80%
批处理大小:GPU用户可尝试32-128之间的值
上下文长度:从2048开始测试,每增加一倍需要约2倍显存
温度(Temperature):创造性任务用0.7-1.0,事实性回答用0.1-0.3

对接OpenCode的时候配置opencode.json

{
  "$schema": "https://opencode.ai/config.json",
  "disabled_providers": [
    "lm_studio_local"
  ],
  "provider": {
    "lm_studio": {
      "name": "lm studio",
      "npm": "@ai-sdk/openai-compatible",
      "models": {
        "qwen3.5-14b-a3b-claude-4.6-opus-reasoning-distilled-reap": {
          "name": "qwen3.5-14b-a3b-claude-4.6-opus-reasoning-distilled-reap"
        }
      },
      "options": {
        "baseURL": "http://localhost:1234/v1"
      }
    }
  }
}

解决cmd无法启动watch -n 1 nvidia-smi ,找到本地环境的nvidia的驱动安装路径命令

dir /s C:\nvidia-smi.exe

并将找到的路径加到环境变量path中
另外,window的显卡查看命令和linux不一样

do {
    nvidia-smi
    sleep 5
} while ($true)

 nvidia-smi -l 1
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容