背景
基于医疗产品场景的售前售后智能客服问答产品, 辅助人工客服进行问题分析和答案生成, 提升答案精准度, 减少客诉率, 提升客服工作效率
方案设计
架构
image.png
流程
image.png
RAG & 大模型选型
火山方舟
•模型推荐: Doubao 系列, DeepSeek-V3
阿里百炼
•模型推荐: Qwen 2.5系列
人力&费用评估
工时(天) 7
成本(人/天) 2000
总计 1.4w
Doubao token 费用
lite-32k模型:每百万token的输入价格为 0.3
元,输出价格为 0.6
元;
pro-32k模型:每百万token的输入价格为 0.8
元,输出价格为 2
元;
Doubao 私有化部署服务器租赁价格参考范围:
基础部署(单台 4卡 A100 服务器 + 中等并发):月租约 8万~15万元。
企业级部署(多节点集群 + 高并发支持):月租约 20万~50万元。
DeepSeek-V3 token 费用
输入:在缓存命中时为每百万 0.5
元,缓存未命中时为每百万 2
元;
输出:每百万 8
元;
DeepSeek-V3 私有化部署服务器租赁价格参考范围:
入门级部署(小型模型,如 7B 参数 + 单卡 A100):月租约 1.5万~3万元。
中等规模(13B-70B 参数 + 多卡服务器):月租约 5万~15万元。
企业级部署(大规模集群 + 高并发支持):月租可能超过 20万元。
结合客服近期工作量以及自建知识库,保守估计每月 token 使用量在五百万以下。随着知识库的逐渐完善后续费用将呈现下降趋势;
image.png