elasticsearch实践-提升搜索准确度

索引相关度

相关度评分背后的理论

  • 词频:词在文档出现频度越高,权重越高
    因此:减少非关键词的出现次数

  • 逆向文档频率:词在全部文档出现频率越高,权重越低
    因此:标题或者概要、问法要独有

  • 字段长度归一值:字段越短,字段的权重越高
    因此,标题或者概要、问法要精短

  • 提炼业务,不盲目增加关键词,否则会造成误召回

搜索

GET /_search
{
  "query": {
    "bool": {
      "should": [
        {
          "match": {
            "title": {
              "query": "quick brown fox",
              "boost": 2 
            }
          }
        },
        {
          "match": { 
            "content": "quick brown fox"
          }
        }
      ]
    }
  }
}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容