Elasticsearch总结

1 基本概念

  • cluster 类比成数据库
  • index 类比成表
  • document 类比成表中一行数据
  • field 类比成表中字段,字段是包含数据的键值对

2 ES 是如何实现分布式的?

image.png
  • 一个索引其实会被分片成多个shard放在不同机器上,每个shard只有索引的部分数据。
  • 每个shard可有多个replica shard 放在其他机器。primary shard负责读写,写完后会同步到replica shard上。replica shard负责分担读请求,并防止其primary shard节点故障导致数据丢失。索引创建完成后,primary shard的数量就确定了不可更改,但replica shard的数量可以随时调整。
  • cluster中有多个node, 会自动选举出一个node为master节点,负责维护索引元数据,负责集群中primary shard和replica shard的身份切换。

比如上图,index分成p0 p1 两个primary shard, 分别存储在node3 和 node 1上,他们的replica shard各自都有两份,比如p0的replica shard是r0, 在node1 和 node2 上。
cluster选举了node1作为master节点。

primary shard的默认数量是5,replica默认是1,也就是说默认5个primary shard,5个replica shard

3 ES写入数据的工作原理是什么?

image.png

插入、删除和索引都是写入操作。写入操作的主要过程如下:

  1. 客户端请求到任意节点,比如node1
  2. node1根据文档_id参数,hash计算出分片位置在node3节点的p0上,于是转发请求到p0
  3. node3的p0分片执行写请求,完毕后转发给自己的两个分片r0。
  4. 等待两个复制分片写入成功,node3报告写入成功给node1节点,node1节点再告诉客户端写入成功。

其中“执行写请求”的底层原理如下。

image.png

3.1 refresh

在ES中,buffer每隔1秒(或者满了),打开一个新segemnt并写入的过程,叫做refresh。

默认情况下,每个分片每秒自动刷新一次。这就是为什么说Elasticsearch是近实时的搜索了:
文档的改动在refresh之前,是搜索不出来的。

3.2 flush

在ES中,进行一次提交并删除事务日志的操作叫做 flush 。分片每30分钟,或事务日志过大,都会进行一次flush操作。

3.3 translog

为了数据安全es默认每隔5秒钟会把translog刷新(fsync)到磁盘中,也就是说最多会丢失5秒钟的数据,如果你对数据安全比较敏感,可以把这个间隔减小,但是会占用更多资源

flush和fsync的区别:

  • flush是把内存中的数据(包括translog和segments)都刷到磁盘
  • fsync只是把translog刷新到磁盘(确保数据不丢失)。

3.4 merge

通过每隔1秒自动刷新创建新的段,用不了多久段的数量就爆炸了。

每个段文件都会消费句柄、内存、cpu资源。更重要的是,每次搜索请求都需要依次检查每个段。段越多,查询越慢。

ES通过后台merge段解决这个问题。小段被合并成大段,再合并成更大的段。

image.png
image.png

3.5 删除数据

如果删除,其实是把数据写到磁盘上的.del文件,然后在segemnt搜索到数据后,会在.del文件看是否有删除标记。

在merge后会物理删除。

4 ES搜索数据的工作原理是什么?

4.1 根据doc id 进行GET

  • 协调节点根据id进行hash计算确认在哪个分片上
  • 采用负载均衡的方式在primary shard和replica shard里查找数据

4.2 全文检索

image.png
  1. 客户端发送请求到协调节点node3
  2. node3向每个分片广播,比如图中广播给了r0和p1
  3. 每个分片在本地执行搜索并且建立了匹配document的优先队列(priority queue),返回document的ID和它优先队列里的所有document的排序值给协调节点 Node 3 。
  4. Node3 把这些值合并到自己的优先队列里产生全局排序结果。

5 在几十亿数据量级的场景下如何优化查询性能?

5.1 filesystem cache

es的数据是存在磁盘上,第1次读的时候如果没在操作系统的filesystem cache上找到,就会先去磁盘把数据放到filesystem cache里再返回给node。所以filesystem cache要足够大容纳尽可能多的index和segment file数据,这样就请求直接走内存,速度就快了。

另外,不必要的数据就别存在es里了,只把搜索用的字段数据放es。其他不用于检索的数据,可以放在hbase或者mysql数据库里。

走磁盘速度基本上都要上秒级,走内存基本上就是毫秒级了。

5.2 缓存预热

对于热点数据,每隔一段时间提前预热到filesystem cache里。

5.3 冷热分离

大量访问很少,频率很低的数据,单独写一个索引,热数据在另一个索引中。确保filesystem cache里的热数据不被频繁刷掉。

5.4 document 模型设计

es里复杂的关联语法join/nested等尽量别用,性能很低。写入es系统之前就完成关联,然后设计好document,添加一些field。

5.5 分页性能优化

es的分页性能比较差。es是分布式的,比如每页10条数据,你要查第100页的数据,实际上每个shard都会把自己的几千条数据发给协调节点,然后汇总,再从汇总结果查询到第100页的数据。

也就是说,翻页越深,各个shard拿到的数据越多,汇总的数据量也越多,性能越差。

1)不允许深度分页
2)使用es的scroll api , 游标查询会取某个时间点的快照数据。 查询初始化之后索引上的任何变化会被它忽略。 但是没法随意跳到任何一页

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 160,504评论 4 365
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,898评论 1 300
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 110,218评论 0 248
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,322评论 0 214
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,693评论 3 290
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,812评论 1 223
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,010评论 2 315
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,747评论 0 204
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,476评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,700评论 2 251
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,190评论 1 262
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,541评论 3 258
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,206评论 3 240
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,129评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,903评论 0 199
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,894评论 2 283
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,748评论 2 274