- 文档内容增加-文件名称在切分段内容中。
- word文档按格式切分,无格式按语义切分。
- 文档中表格优化,按json格式保存,保证内容完整连贯。
- pdf文档按语义切分。
- 文档构建QA对结构优化,保证对模型无压力。
- 文档构建时创建摘要索引,保证召回率。
- 区分RAG回答与大模型兜底。
- 增加问答效果评分。召回评分。
- 去掉dify版本校验逻辑,保证本地部署时访问不卡顿。
- 在自然段因超长被切断时,块上下文增加标识,在召回某块时增加上下块合并召回。
- 增加召回时图片的联代召回。
- 多知识库时利用bert模型实现路由加速器,快速指定到特定知识库召回。提升召回速度10倍。
2024-03-05 dify二次开发记录
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- rs_driver 是RoboSense雷达的基本驱动程序。本文是rs_driver的源代码解析文档,原文地址在:...
- ThreadPoolExecutor 是java线程池的默认实现。本文从源代码的角度来解析线程池,后续会出一个系列...