在智能音箱的个性化改造领域,将小爱音箱接入强大的 DeepSeek 大模型,能为用户带来前所未有的智能交互体验。我们就来详细介绍如何完成这一操作,让你的小爱音箱瞬间升级为超级智能助手。
一、前期准备
(一)注册 DeepSeek 账号
1.访问 DeepSeek 官网:打开你的浏览器,输入 DeepSeek 官网地址https://platform.deepseek.com/ ,进入官网首页。
2.点击注册:在首页找到 “注册” 按钮,点击进入注册页面。
3.填写信息:按照页面提示,填写有效的邮箱地址、设置登录密码,并完成验证码验证。确保信息准确无误,避免注册失败。
4.激活账号:注册成功后,前往你填写的邮箱,查看 DeepSeek 发送的激活邮件。点击邮件中的激活链接,完成账号激活。
(二)获取 DeepSeek API 密钥
1.登录账号:激活账号后,返回DeepSeek 官网,点击 “登录” 按钮,使用注册的邮箱和密码登录。
2.进入 API 密钥管理页面:登录成功后,在个人中心或相关设置选项中,找到 “API 密钥” 或类似的入口,点击进入 API 密钥管理页面。
3.创建 API 密钥:在 API 密钥管理页面,点击 “创建 API 密钥” 按钮。系统会生成一串专属的 API 密钥,这是连接小爱音箱与 DeepSeek 大模型的关键凭证,务必妥善保管,不要泄露给他人。
(三)准备小爱音箱及相关设备
1.确保小爱音箱正常联网:将小爱音箱连接到稳定的 Wi-Fi 网络,确保音箱能够正常访问互联网。你可以通过小爱音箱 APP 进行网络设置。
2.准备一台电脑:用于后续的配置文件修改和相关操作。电脑需具备网络连接功能,且安装有文本编辑器(如 Notepad++、Sublime Text 等)。
二、接入步骤
(一)安装必要软件
1.安装 Docker:
1.Windows 系统:访问 Docker 官方网站https://www.docker.com/products/docker-desktop/ ,下载适用于 Windows 的 Docker 安装包。下载完成后,运行安装包,按照安装向导的提示完成安装。安装过程中,可能需要重启计算机。
2.Linux 系统:不同的 Linux 发行版安装方式略有不同。以 Ubuntu为例,打开终端,输入以下命令:
sudo apt-get update
sudo apt-get install docker.io
安装完成后,输入docker --version检查是否安装成功。
2.MacOS 系统:在 Docker 官网下载针对 MacOS 的安装程序,下载后双击安装包,按照提示完成安装。安装完成后,在终端中输入docker version验证安装情况。
1.下载 migpt 镜像:打开命令行工具(Windows 下为命令提示符或 PowerShell,Linux 和 MacOS 为终端),输入以下命令下载 migpt 镜像:
docker pull idootop/mi-gpt:latest
下载过程中,请耐心等待,期间可能会显示下载进度。
(二)修改配置文件
1.migpt.js 配置:
1.找到 migpt.js 文件:在你下载的 migpt 相关文件目录中,找到 migpt.js 文件。
2.打开文件:使用文本编辑器打开migpt.js 文件。
3.设置基本信息:
1.userId:填写你在小米「个人信息」-「小米 ID」中查到的 ID,注意不要填写手机号或邮箱。
2.password:填写小爱音箱 DID 或在米家中设置的名称。
3.did:填写正确的小爱音箱名称,注意大小写和空格。
4.定制唤醒词与提示语:
1.在callAIKeywords中添加触发 AI 回复的关键词,如 “请”“你”“智能助手” 等。
2.在wakeUpKeywords中设置进入 AI 唤醒状态的关键词,如 “打开”“召唤”“启动” 等。
3.在exitKeywords中设置退出 AI 唤醒状态的关键词,如 “关闭”“退出”“再见” 等。
4.自定义进入、退出 AI 模式以及 AI 回答过程中的提示语,例如设置进入 AI 模式的提示语为 “欢迎使用智能问答功能”。
5.配置 MIoT 设备指令与 TTs 指令:
1.常见型号的配置参数可查阅https://qithub.com/idootop/mi-qpt/issues/92 ,根据小爱音箱的具体型号查找对应的配置参数。
2.TTs 指令需前往https://home.miot-spec.com查询具体内容,并按照查询结果进行正确配置。
1.env.js 配置:
1.找到 env.js 文件:在 migpt 相关文件目录中找到 env.js 文件。
2.打开文件:使用文本编辑器打开env.js 文件。
3.设置模型与接口:
1.将OPENAI_MODEL设置为deepseek-chat,以调用 DeepSeek-V3 模型;若想使用最新的推理模型DeepSeek-R1,将其配置成deepseek-reasoner。
2.填写正确的OPENAI_API_KEY,即之前获取的 DeepSeek API 密钥。
3.将OPENAI_BASE_URL设置为https://api.deepseek.com/v1。
4.可选配置:根据需求配置提示音效,如设置AUDIO_SILENT(静音音频链接)、AUDIO_BEEP(默认提示音链接)等。若想调用第三方 TTS 服务,填写TTS_BASE_URL。
(三)启动 migpt
1.打开命令行工具:根据你的操作系统,打开相应的命令行工具。
2.输入启动命令:在命令行中输入以下启动命令:
docker run -d --env-file $(pwd)/.env -v $(pwd)/.migpt.js:/app/.migpt.js idootop/mi-gpt:latest
如果是在 Windows 系统下,由于$(pwd)可能无法正确解析路径,需要将其替换为绝对路径,例如:
docker run -d --env-file D:\docker\mi-gpt-main\.env -v D:\docker\mi-gpt-main\.migpt.js:/app/.migpt.js idootop/mi-gpt:latest
3.等待启动完成:启动命令执行后,等待片刻,直到看到小爱音箱相关的设备信息及服务启动提示,表示启动成功。若启动过程中遇到问题,仔细查看错误提示信息,根据提示进行排查和解决。
三、使用技巧
(一)设置系统 Prompt
1.英语翻译和改进:设定提示词 “我希望你能担任英语翻译、拼写校对和修辞改进的角色。我会用任何语言和你交流,你会识别语言,将其翻译并用更为优美和精炼的英语回答我。” 例如,当你说 “我喜欢中国美食”,小爱音箱接入的 DeepSeek 模型会翻译为 “I have a great passion for Chinese cuisine”。
2.论文润色:输入 “请你充当一名论文编辑专家,从论文评审的角度去修改论文摘要部分,使其更加流畅、优美。要求能让读者快速获得文章的要点,字数限制在 300 字以下。下文是论文的摘要部分,请你修改它:”,然后提供论文摘要,模型会进行专业润色。
3.AI 面试官:以 “我想让你担任 Java 开发工程师面试官。我将成为候选人,您将向我询问 Java 开发工程师职位的面试问题。” 为提示,小爱音箱就能模拟面试场景,提出专业问题。
(二)多元玩法拓展
A.基础版:语音问答快速上手:对于普通用户,无需复杂编程,利用手机和小爱音箱的联动就能实现简单的语音问答。操作步骤如下:
1.双设备连接:打开手机上的 DeepSeek 官网或者 APP,确保网络连接正常。然后通过蓝牙功能,将手机与小爱音箱进行配对连接。
2.语音功能设置:对小爱音箱说 “打开蓝牙媒体音频”,确保音频传输正常。接着在手机端进行设置,进入手机的 “设置” 选项,找到 “辅助功能”,在其中开启「自动朗读」功能。这样,当你在手机上向 DeepSeek 提问后,回答内容就能通过小爱音箱播放出来。
B.进阶版:定制专属 AI 管家:适合有技术热情的创作者,通过小米开放平台打造个性化的智能工作流:
1.注册小米开发者账号:访问小米开放平台https://open.mi.com/ ,点击注册按钮,按照提示填写相关信息完成账号注册。
2.获取 DeepSeek API 密钥:如前文所述,在 DeepSeek 平台获取 API 密钥。
3.创建语音技能:登录小米开放平台后,找到 “创建技能” 选项,新建一个名为「智能创作助手」的语音技能,按照平台要求填写技能的基本信息。
4.意图训练:添加 10 组核心指令,比如 “写微博文案”“生成活动策划方案” 等,用于训练小爱音箱对不同需求的理解和响应。
5.API 对接:在技能的服务配置中,准确填入 DeepSeek 的接口地址及密钥,确保两者能够正常通信。
6.场景测试:模拟唤醒词,如 “小爱同学,召唤 AI 秘书”,测试技能是否能够正常响应,检查生成的内容是否符合预期。
7.发布技能:经过测试无误后,提交技能进行审核,审核通过后,将家庭账号同步绑定,即可在家庭环境中使用这个专属的 AI 管家。
C.苹果用户专属:一键唤醒秘技:苹果用户可以利用快捷指令实现一键唤醒 DeepSeek 功能:
1.创建快捷指令:在手机上打开 “快捷指令” 应用,点击 “创建快捷指令”,新建一个名为「AI 智库」的快捷指令。
2.添加触发词:在小爱训练计划中添加触发词,如 “开启智慧大脑” 。
3.配置自动化流程:设置语音指令触发后,调用 DeepSeek API 获取回答,并将回答转化为语音。例如,当你说出 “开启智慧大脑,帮我写个工作总结”,快捷指令就会按照设定的流程,调用 DeepSeek 生成工作总结内容,并通过语音播报出来。这个方法还支持方言识别,方便不同地区的用户使用,并且支持声纹加密,家庭成员唤醒时可以自动切换专属知识库。
四、注意事项
1.交互顺序:使用时,必须先唤醒小爱同学,再召唤自定义的 AI 名称,才能顺利与 DeepSeek 大模型交互。
2.费用管理:由于 DeepSeek API 的使用涉及费用,在操作过程中留意费用消耗,合理规划使用。可以定期查看 DeepSeek 平台上的费用明细,了解 token 的消耗情况。
3.网络与设备:确保网络环境稳定,推荐使用 5GHz WiFi,以保证数据传输的快速和稳定。部分旧款音箱需升级固件,2021 年后生产的设备兼容性最佳,可在小米官方网站或小爱音箱APP 中查看是否有可用的固件升级,并及时进行更新。