搜索-Elasticsearch-进阶1

outline

一.function_score
二.搜索字段的权重控制

一.function_score

functions是一个数组,存放加强函数列表

1.加强_score的计算函数

(1) weight
设置一个简单而不被规范化的权重提升值
new_score = old_score * weight

(2) field_value_factor
将某个字段的值乘上old_score

(3) random_score :
为每个用户都使用一个不同的随机评分对结果排序,但对某一具体用户来说,看到的顺序始终是一致的

2.辅助参数

(1) boost_mode : 决定 old_score 和 加强score 如何合并
(2) score_mode:先合并functions中的函数,然后使用加强score和old_score合并(boost_mode)
(3) max_boost

3.衰减函数

以某个字段的值为基准,距离某个值越近得分越高
linear : 线性函数是条直线,一旦直线与横轴0香蕉,所有其他值的评分都是0
exp : 指数函数是先剧烈衰减然后变缓
guass(最常用) : 高斯函数则是钟形的,他的衰减速率是先缓慢,然后变快,最后又放缓

4.script_score

当需求超出以上范围时,可以用自定义脚本完全控制评分计算,不过因为还要额外维护脚本不好维护,因此尽量使用ES提供的评分函数,需求真的无法满足再使用script_score

weight-example:

<pre><code class="shell">
GET 127.0.0.1/mytest/doc/_search
{
"query": {
"function_score": {
"query": {
"match_all": {} //match_all查出来的所有文档的_score都是1
},
"functions": [
//第一个filter(使用weight加强函数),如果language是java,加强score就是2
{
"filter": {
"term": {
"language": "java"
}
},
"weight": 2
},
//第二个filter(使用weight加强函数),如果language是go,加强score就是3
{
"filter": {
"term": {
"language": "go"
}
},
"weight": 3
},
//第三个filter(使用weight加强函数),如果like数大于等于10,加强score就是5
{
"filter": {
"range": {
"like": {
"gte": 10
}
}
},
"weight": 5
},
//field_value_factor加强函数,会应用到所有文档上,加强score就是like值
{
"field_value_factor": {
"field": "like"
}
}
],
"score_mode": "multiply", //设置functions裡面的加强score们怎麽合併成一个总加强score
"boost_mode": "multiply" //设置old_score怎麽和总加强score合併
}
}
}
</code></pre>

按受欢迎度提升权重/field_value_factor

<pre><code class="shell">
GET /forum/article/_search
{
"query": {
"function_score": {
"query": {
"multi_match": {
"query": "java spark",
"fields": ["tile", "content"]
}
},
"field_value_factor": {
"field": "follower_num",
"modifier": "log1p",
"factor": 0.5
},
"boost_mode": "sum",
"max_boost": 2
}
}
}
</code></pre>

field_value_factor中如果只有field,那么会将每个doc的分数都乘以follower_num,如果有的doc follower是0,那么分数就会变为0,效果很不好。因此一般会加个log1p函数,公式会变为,new_score = old_score * log(1 + number_of_votes),这样出来的分数会比较合理
factor的作用:new_score = old_score * log(1 + factor * number_of_votes)
boost_mode:可以决定分数与指定字段的值如何计算,multiply,sum,min,max,replace
max_boost,限制计算出来的分数不要超过max_boost指定的值

new_score的函数曲线

image

二.搜索字段的权重控制

在多个field中搜索,field的权重不同/增加某个term的权重
(1)
<pre><code class="shell">
{
"multi_match" : {
"query" : "天龙八部",
"type" : "best_fields",
"tie_breaker" : 0.3,
"fields" : [ "title^1.5", "body" ],
"minimun_should_match" : "30%"
}
}
</code></pre>
(2)
<pre><code class="shell">
GET /_search
{
"query": {
"bool": {
"should": [
{
"match": {
"title": {
"query": "quick brown fox",
"boost": 2
}
}
},
{
"match": {
"content": "quick brown fox"
}
}
]
}
}
}
</code></pre>

Not Quite Not

<pre><code class="shell">
GET /_search
{
"query": {
"bool": {
"must": {
"match": {
"text": "apple"
}
},
"must_not": {
"match": {
"text": "pie tart fruit crumble tree"
}
}
}
}
}
</code></pre>

negative boost

<pre><code class="shell">
GET /forum/article/_search
{
"query": {
"boosting": {
"positive": {
"match": {
"content": "java"
}
},
"negative": {
"match": {
"content": "spark"
}
},
"negative_boost": 0.2
}
}
</code></pre>

elasticsearch笔记
elasticsearch控制度相关
ElasticSearch - function_score 简介

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,847评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,208评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,587评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,942评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,332评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,587评论 1 218
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,853评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,568评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,273评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,542评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,033评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,373评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,031评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,073评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,830评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,628评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,537评论 2 269

推荐阅读更多精彩内容

  • 记录一下,elasticsearch/lucene关于文档与query之间相关性的计算方式,目录如下, Lucen...
    chenfh5阅读 4,579评论 1 7
  • 作者:潘子彧 我们也许是天上的星星 或者说天上有属于自己唯一的星星 我们对于世界就如同星星对于我们 它知道自己有多...
    天道酬勤人定胜天阅读 193评论 0 0
  • 给2018,上半年的自己一个交待: 这几天莫名的冲动要写点什么,看看日历,原来是6月底了,时间真的好快啊:...
    野燕1024阅读 545评论 4 5
  • 李德·哈特(英国著名军事思想家)——从实践的角度来说,为了挫败敌人,任何计划都必须考虑对方的实力。克服这类...
    一点就通报阅读 927评论 0 1
  • 我想我最幸运的事,就是能拥有我的妈妈做妈妈,在她身上我看到女人所有的美好与善良。 最近发生了很多事情,刚好此时此刻...
    解意阅读 253评论 0 4