- 文档内容增加-文件名称在切分段内容中。
- word文档按格式切分,无格式按语义切分。
- 文档中表格优化,按json格式保存,保证内容完整连贯。
- pdf文档按语义切分。
- 文档构建QA对结构优化,保证对模型无压力。
- 文档构建时创建摘要索引,保证召回率。
- 区分RAG回答与大模型兜底。
- 增加问答效果评分。召回评分。
- 去掉dify版本校验逻辑,保证本地部署时访问不卡顿。
- 在自然段因超长被切断时,块上下文增加标识,在召回某块时增加上下块合并召回。
- 增加召回时图片的联代召回。
- 多知识库时利用bert模型实现路由加速器,快速指定到特定知识库召回。提升召回速度10倍。
2024-03-05 dify二次开发记录
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- rs_driver 是RoboSense雷达的基本驱动程序。本文是rs_driver的源代码解析文档,原文地址在:...
- ThreadPoolExecutor 是java线程池的默认实现。本文从源代码的角度来解析线程池,后续会出一个系列...