Elasticsearch实战 使用相关性进行搜索

一、Elasticsearch的打分机制

Elasticsearch使用了被搜索词条的频率以及他有多常见来影响得分。简单的解释是,一个词条出现在某个文档中的次数越多,它就越相关,但是如果该词条出现在不同文档的次数越多,它就越不想关。这一点被成为TF-IDF。TF=term frequency,IDF=iverse document frequency

Lucene评分公式

给定查询q和文档d,其得分是查询中每个词条t的得分总和,而每个词条的纷纷是该词在文档d中的词频的平方根,乘以该词逆文档频率的平方和,乘以该文档字段的归一化因子,乘以该词的提升权重

综上所属,词条的词频越高,得分越高;相似的,索引中词条越罕见,逆文档频率越高。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容