DeepSeek使用教程
建议
提示词的本质就是表达。
-
详情补充
- 在提问结尾加上:在回复前如果有任何问题都可以问我。
ds不需要提示词技巧。
-
必要背景信息
- 干什么
- 给谁干
- 要什么
- 不要什么
-
乔哈里视窗与AI沟通,组合人与AI是否知道来进行沟通
- 简单说
- 提问题
- 喂模式
- 开放聊
给模型目标,不需要指定思考步骤。(不需要微操)
万能提示模板:你是谁+(背景信息)+你的目标
不要定义过程
-
明确受众
- 说人话
- 我是小白,小学生等等
- 写给小白,高中生的演讲稿等等。
-
风格明确
- 用###的风格,写一篇演讲稿,要求###
联网搜索(时事类开启,不需要联网的不建议开启)
-
上下文记忆与清楚记忆
- 默认64k记忆长度,约3-4万字
- 输出长度4-8k,约2-4k中文字符。
- 开启新的会话,或者要求忽略之前所有的对话。
-
反馈与迭代优化
- 对回答进一步追问,优化。
- 辩证地思考、多角度考虑、从反面考虑
- 反复斟酌
复杂问题,分布拆解
避免超过200字的提示词,否则可能导致焦点偏移,有需要可以分布询问
-
避免复杂句式和模糊词语。
- 少出现不要###句式,增加理解成本
避免过度角色扮演,提示学科,不需要提示专家身份。
有用的不是提示词技巧,而是思考和表达。
-
优秀表现
- 数学
- 代码
- 写作&文案
- 文本摘要总结梗概
-
指定输出格式(如果有需要补充的信息,可以向我提问)
- 生成mermaid流程图
- 生成mermaid甘特图
- 以xmind可识别的markdown文本输出
- ppt(结合kimi的ppt工具(ppt助手))
- 生成10页雷军汽车发布会内容ppt,以文本形式给出ppt的详细内容。
- 如果生成的流程图语法有错,可以让deepseek检查并修改输出正常的流程图代码
简历生成和优化
-
模拟面试
- 结合相关技术栈向我提问
- 回答后评价回答如何,并给出建议或者答案。
- 继续提问。
- 针对这份简历的相关技术栈和项目内容,进行模拟面试,你作为一个java面试官向我提问,我面试的岗位是资深java工程师,在我回答后给出相应评价和建议,然后你再问下一个问题,可以开始了吗。
指令模型VS推理模型
部署
- 一百万token相当于70-80w的汉字
客户端调用api
- cherry studio
- deepseek github上有各种客户端推荐
第三方平台
本地部署
- 瓶颈:显存+内存
- 32B以下的都不能发挥R1特性
- ollama进行部署
- 使用cherry studio作为客户端与本地部署模型进行交互。
#70亿参数的下载命令:
ollama run deepseek-r1:7b
#下载后命令行打开:也是这个命令
ollama run deepseek-r1:7b
#可以使用ctrl+c中断下载,再执行命令就可以继续下载
#获取帮助
/?
#退出模型
/bye
#显示目前下载的模型列表
ollama list
服务器部署
- ollama下载r1满血模型,需要404GB硬盘大小。
- 与本地部署一样,下载ollama,下载对应模型,使用客户端访问。
创新
- 强化学习 RL
- 语言一致性奖励机制
- 监督微调 SFT
要点
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png