搜索Query分析改写

搜索意图识别:

Query分析:
  • 分词:切词,pinyin分词
  • 查询类目预测:
Query改写:

Query改写本质上是要找到和原始Query相似的候选Query,候选Query来自用户搜索query日志清洗过滤得到。如何找相似Query呢?

  • 基于Query内容:
    • 1.基于文本相似度,基于编辑距离(字或词),基于拼音
    • 2.基于同义词
  • Co-Click基于用户点击行为:
    • query-doc协同过滤
    • 基于随机游走的方法,simrank,simrank++
  • Co-Session基于用户同一个时间段的连续操作:
    • 基于session embedding

参考:
http://xudongyang.coding.me/query-rewrite/
https://zhuanlan.zhihu.com/p/27850493
https://blog.csdn.net/madman188/article/details/51853947
https://www.cnblogs.com/a-du/p/9709171.html
https://tech.youzan.com/you_zan_searchengine2/