搜索-Elasticsearch-进阶1

outline

一.function_score
二.搜索字段的权重控制

一.function_score

functions是一个数组,存放加强函数列表

1.加强_score的计算函数

(1) weight
设置一个简单而不被规范化的权重提升值
new_score = old_score * weight

(2) field_value_factor
将某个字段的值乘上old_score

(3) random_score :
为每个用户都使用一个不同的随机评分对结果排序,但对某一具体用户来说,看到的顺序始终是一致的

2.辅助参数

(1) boost_mode : 决定 old_score 和 加强score 如何合并
(2) score_mode:先合并functions中的函数,然后使用加强score和old_score合并(boost_mode)
(3) max_boost

3.衰减函数

以某个字段的值为基准,距离某个值越近得分越高
linear : 线性函数是条直线,一旦直线与横轴0香蕉,所有其他值的评分都是0
exp : 指数函数是先剧烈衰减然后变缓
guass(最常用) : 高斯函数则是钟形的,他的衰减速率是先缓慢,然后变快,最后又放缓

4.script_score

当需求超出以上范围时,可以用自定义脚本完全控制评分计算,不过因为还要额外维护脚本不好维护,因此尽量使用ES提供的评分函数,需求真的无法满足再使用script_score

weight-example:

<pre><code class="shell">
GET 127.0.0.1/mytest/doc/_search
{
"query": {
"function_score": {
"query": {
"match_all": {} //match_all查出来的所有文档的_score都是1
},
"functions": [
//第一个filter(使用weight加强函数),如果language是java,加强score就是2
{
"filter": {
"term": {
"language": "java"
}
},
"weight": 2
},
//第二个filter(使用weight加强函数),如果language是go,加强score就是3
{
"filter": {
"term": {
"language": "go"
}
},
"weight": 3
},
//第三个filter(使用weight加强函数),如果like数大于等于10,加强score就是5
{
"filter": {
"range": {
"like": {
"gte": 10
}
}
},
"weight": 5
},
//field_value_factor加强函数,会应用到所有文档上,加强score就是like值
{
"field_value_factor": {
"field": "like"
}
}
],
"score_mode": "multiply", //设置functions裡面的加强score们怎麽合併成一个总加强score
"boost_mode": "multiply" //设置old_score怎麽和总加强score合併
}
}
}
</code></pre>

按受欢迎度提升权重/field_value_factor

<pre><code class="shell">
GET /forum/article/_search
{
"query": {
"function_score": {
"query": {
"multi_match": {
"query": "java spark",
"fields": ["tile", "content"]
}
},
"field_value_factor": {
"field": "follower_num",
"modifier": "log1p",
"factor": 0.5
},
"boost_mode": "sum",
"max_boost": 2
}
}
}
</code></pre>

field_value_factor中如果只有field,那么会将每个doc的分数都乘以follower_num,如果有的doc follower是0,那么分数就会变为0,效果很不好。因此一般会加个log1p函数,公式会变为,new_score = old_score * log(1 + number_of_votes),这样出来的分数会比较合理
factor的作用:new_score = old_score * log(1 + factor * number_of_votes)
boost_mode:可以决定分数与指定字段的值如何计算,multiply,sum,min,max,replace
max_boost,限制计算出来的分数不要超过max_boost指定的值

new_score的函数曲线

image

二.搜索字段的权重控制

在多个field中搜索,field的权重不同/增加某个term的权重
(1)
<pre><code class="shell">
{
"multi_match" : {
"query" : "天龙八部",
"type" : "best_fields",
"tie_breaker" : 0.3,
"fields" : [ "title^1.5", "body" ],
"minimun_should_match" : "30%"
}
}
</code></pre>
(2)
<pre><code class="shell">
GET /_search
{
"query": {
"bool": {
"should": [
{
"match": {
"title": {
"query": "quick brown fox",
"boost": 2
}
}
},
{
"match": {
"content": "quick brown fox"
}
}
]
}
}
}
</code></pre>

Not Quite Not

<pre><code class="shell">
GET /_search
{
"query": {
"bool": {
"must": {
"match": {
"text": "apple"
}
},
"must_not": {
"match": {
"text": "pie tart fruit crumble tree"
}
}
}
}
}
</code></pre>

negative boost

<pre><code class="shell">
GET /forum/article/_search
{
"query": {
"boosting": {
"positive": {
"match": {
"content": "java"
}
},
"negative": {
"match": {
"content": "spark"
}
},
"negative_boost": 0.2
}
}
</code></pre>

elasticsearch笔记
elasticsearch控制度相关
ElasticSearch - function_score 简介

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 记录一下,elasticsearch/lucene关于文档与query之间相关性的计算方式,目录如下, Lucen...
    chenfh5阅读 10,290评论 1 7
  • 作者:潘子彧 我们也许是天上的星星 或者说天上有属于自己唯一的星星 我们对于世界就如同星星对于我们 它知道自己有多...
    天道酬勤人定胜天阅读 1,677评论 0 0
  • 给2018,上半年的自己一个交待: 这几天莫名的冲动要写点什么,看看日历,原来是6月底了,时间真的好快啊:...
    野燕1024阅读 3,828评论 4 5
  • 李德·哈特(英国著名军事思想家)——从实践的角度来说,为了挫败敌人,任何计划都必须考虑对方的实力。克服这类...
    一点就通报阅读 4,678评论 0 1
  • 我想我最幸运的事,就是能拥有我的妈妈做妈妈,在她身上我看到女人所有的美好与善良。 最近发生了很多事情,刚好此时此刻...
    解意阅读 1,891评论 0 4