Theory Behind Relevance Scoring

Lucene(Elasticsearch使用了lucene的打分机制)使用布尔模型来找到匹配的文档,并使用一个称为实际评分函数的公式来计算相关性。 该公式从term频率/逆文档频率和向量空间模型中借用概念,但增加了更多特征,如协调因子、域长度归一化和term/query条件的boost。

Boolean Model

The Boolean model simply applies the AND, OR, and NOT conditions expressed in the query to find all the documents that match. A query for
布尔模型,通过在query中使用 AND OR NOT 等条件表达式,来查找匹配的文档,一个queyrfull AND text AND search AND (elasticsearch OR lucene)will include only documents that contain all of the terms full, text, and search, and either elasticsearch or lucene.
将包含

Term frequency

Inverse document frequency

Field-length norm

Putting it together

Vector Space Model

推荐阅读更多精彩内容

  • 今天刚接上班,管事的就找我说给下一个班的拿橡胶线,我就纳闷了,你亲家又不是和我一个班,他怎么不知道我拿橡胶线?或者...
    你好Man大叔阅读 114评论 0 0
  • 三岁半 家中盖东屋,我坐在奶奶的怀里,奶奶手持剪刀将烟盒的红灯笼图案剪下,串在一条白绳上。 六岁 小学幼稚班第一天...
    野生博子菌阅读 452评论 0 2
  • 看易词斋主人词作,有述杭州者,感其词工而上佳,评而留迹,因试作小词一片,查词牌,有天净沙一目,较为合用,改而填之。...
    懦愚阅读 110评论 1 9