ES学习

  1. ES的架构


    image.png

    从物理上看,ES有多个节点,构成集群,每个节点上存储分片,分片以索引为组织单位,一个索引包含一个或者多个分片,每个分片又有多个副本。从逻辑上看索引类似于数据库的库,类型可以看作是表,文档等价于表的行数据。

  2. 索引文档的过程?搜索的过程?
    索引文档过程先是通过哈希散列到分片,然后转发到副本分片上,等到副本分片写完之后就可以返回了。
    搜索的过程是从请求的节点获取包含所有数据的分片,然后通过轮询选择主分片或者是副本分片,然后再聚合所有结果,然后返回。
  3. 倒排索引原理,FST数据结构,字典树的作用
    https://www.cnblogs.com/cjsblog/p/10327673.html
    https://blog.csdn.net/zteny/article/details/82857080
  4. 分析器的作用。
    分词器是专门处理分词的组件,Analyzer 由三部分组成
    Character Filters (针对原始文本处理,例如去除 html)
    Tokenizer(按照规则切分为单词)
    Token Filter (将切分的单词进行加工,小写,删除 stopwords,增加同义语)
    2.es写数据原理,数据实时么,为什么不实时,会丢数据么,segment,cache,buffer,translog关系
    3.es深度分页,优化

推荐阅读更多精彩内容

  • 一、目的 一个搜索引擎使用的时候必定需要排序这个模块,一般情况下在不选择按照某一字段排序的情况下,都是按照打分的高...
    pcqlegend阅读 1,532评论 0 1
  • 学习地址为极客时间《Elasticsearch核心技术与实战》,这只是我做的笔记,仅供参考; 三、Elastics...
    RickYinG阅读 124评论 0 1
  • 默认相关得分算法 TF-IDF 词频:所查找单词出现次数越多,得分越高逆文档词频:如果查找词再所有文档中都比较少见...
    鼻涕不停的小眼睛阅读 60评论 0 0
  • 一、开场白 1、哪些人需要学习ES 开发 测试 运维 利用数据来分析和查询的人 作为一个非关系型数据库,有着和my...
    天草二十六_简村人阅读 891评论 1 1
  • @author Gandalf 介绍 ES是什么 Elasticsearch实时的分布式全文搜索分析引擎,内部使用...
    Gandalf_z阅读 168评论 0 6