Druid--Druid的基础集群配置优化

基于apache-druid-0.17

概述

本文是基于官网的一些建议进行的

与进程类相关的配置建议

Historical 进程

Heap 大小（堆大小）

Historicals进程中heap的主要贡献为：
- 来自Segment的部分未合并查询结果；
- 存储Lookup的值；
调整Historicals进程的heap大小的一般经验法则是(0.5GB * CPU内核的数量)，上限为~24GB。
这个经验法则使用CPU内核的数量作为硬件大小和并发级别的方便代理(注意:这个公式并不是确定历史堆大小的硬性规则)。
heap太大可能会导致GC收集暂停过长，为了避免这种情况，设置了~24GB上限。
Historicals进程如果允许缓存，缓存是存储在heap上。大小有参数druid.cache.sizeInBytes决定。
在Historicals进程上耗尽堆可能表明配置错误或使用模式导致集群超载。

lookups功能

如果正在使用lookup功能，请计算正在加载的lookup映射的总大小。
Druid在更新lookup映射时执行原子交换(在交换期间旧映射和新映射都存在于堆中)，所以lookup映射的最大潜在堆使用量将是(2 *所有加载查找的总大小)。
除了(0.5GB * CPU核心数量)准则外，请确保将(2 *所有加载查找的总大小)添加到堆大小中。

处理线程和缓冲区

Historicals进程中：
- druid.processing.numThreads:通常应设置为(内核数量- 1):较小的值会导致CPU利用率不足，而超过内核数量则会导致不必要的CPU争用。
- druid.processing.buffer.sizeBytes:可以设置为500M;
- druid.processing.numMergeBuffers:对于一般使用来说，合并缓冲区与处理线程的比例为1:4是一个合理的选择。

Direct Memory Sizing

上面描述的处理缓冲区和合并缓冲区是直接内存缓冲区。
当Historicals处理查询时，它必须打开一组Segment以供读取。这也需要一些直接的内存空间，如segment decompression buffers.
估计直接内存使用的公式如下:
(druid.processing.numThreads + druid.processing.numMergeBuffers + 1) * druid.processing.buffer.sizeBytes
+1因子是一个模糊的估计，用于解释Segment解压缩缓冲区。

Connection pool sizing

对于Historicals进程，druid.server.http.numThreads的值应该比集群中所有Broker的参数值druid.broker.http.numConnections的和要大一些。
优化集群，使每个Historicals可以接受50个查询和10个非查询，这是一个合理的起点。

segment缓存大小

druid.server.maxSize: Coordinator可以分配给Historicals的段数据的总大小。
druid.segmentCache.locations：指定Segment数据可以存储在Historicals中的位置。这些位置上可用磁盘空间的总和应该相等druid.server.maxSize。
Segment由Historicals使用任何可用的空闲系统内存。
因此druid.server.maxSize应该被指定，这样就不会为Historicals分配过多的Segment数据。free system memory / druid.server.maxSize的值增加，更大比例的Segment可以保存在内存中，从而实现更好的查询性能。

Historicals的数量

集群中Historicals的数量取决于集群的数据量大小。为了获得良好的性能，您需要足够的Historicals，以便每个Historicals具有良好的(free system memory / druid.server.maxSize)比率，和上文segment缓存部分所讲一样。
只要您对用例有足够的容错能力，使用少量的大型服务器通常比使用大量的小型服务器要好。

SSD存储

我们建议使用Historicals节点使用SSD磁盘，因为它们处理存储在磁盘上的Segment数据。

总内存使用

要估计在这些准则下的Historicals总内存使用量:
- Heap: (0.5GB * number of CPU cores) + (2 * total size of lookup maps) + druid.cache.sizeInBytes
- Direct Memory: (druid.processing.numThreads + druid.processing.numMergeBuffers + 1) * druid.processing.buffer.sizeBytes
Historicals将使用任何可用的空闲系统内存(即Historicals中JVM和堆/直接内存缓冲区或系统上的其他进程没有使用的内存)，用于磁盘上Segment的内存映射。为了获得更好的查询性能，您需要确保一个良好的(free system memory / druid.server.maxSize)比率，以便在内存中保留更大比例的Segment数据。

segment大小问题

请务必检查segment size optimization
，以帮助优化Historicals获得最大的性能。

Broker

heap大小

Broker中heap的最大贡献是：
- 来自Historicals和Task的部分未合并查询结果；
- Segment时间轴:这包括当前所有可用Segment的位置信息(which Historical/Task is serving a segment)。
- 缓存的Segment元数据:这包括当前所有可用Segment的元数据，例如每个Segment的schema。
- Broker 的heap 需求根据集群中的Segment数量和Segment的总数据大小进行伸缩。
堆大小将根据数据大小和使用模式而变化，但是4G到8G对于小型或中型集群(~15个或更少的服务器)是一个很好的起点。对于高端内存需求的粗略估计，大约有100个节点的非常大的集群可能需要30GB-60GB的Beoker heap大小。
如果在代理上启用了缓存，那么缓存将存储在堆上，大小由druid.cache.sizeInBytes决定。

Direct memory sizing

Broker需要多少直接内存取决于配置了多少合并缓冲区(用于合并GroupBys)。Broker通常不需要处理线程或处理缓冲区，因为查询结果是在HTTP连接线程的堆上合并的。
- druid.processing.buffer.sizeBytes可以设置为500M；
- druid.processing.numThreads设置为1，（允许最小值）。
- druid.processing.numMergeBuffers：将该值设置为与Historicals值相同或稍高。
有一个例外，Broker不需要处理线程和处理缓冲区:
- 如果在查询上下文中设置了已废弃的chunkPeriod属性，则GroupBy V1查询将在Broker上使用处理线程和处理缓冲区。

连接池大小

General Connection Pool Guidelines
Broker中，请确保所有节点的druid.broker.http.numConnections的和要低于Historicals and Tasks的druid.server.http.numThreads。
Broker中druid.server.http.numThreads的值要略高于druid.broker.http.numConnections。
优化集群，使每个历史记录可以接受50个查询和10个非查询，并相应地调整Broker，这是一个合理的起点。

Broker 背压

当检索查询结果从Historical or Tasks,Broker可以选择指定最大缓冲区大小排队,未读数据和施加反压力的通道达到Historical or Tasks时限制。
缓冲大小由druid.broker.http.maxQueuedBytes参数配置。
这个限制是根据查询所命中的Historical or Tasks的数量来划分的:假设我有一个druid.broker.http.maxQueuedBytes设置为5MB，Broker接收一个需要扩展为两个Historical的查询。在本例中，每个Historical将获得2.5MB的缓冲区。
您通常可以将这个值设置为大约2MB *Historical数量。当您的集群使用更多的Historical和Task进行扩展时，请考虑增加缓冲区大小并相应地增加Broker heap。
- 如果缓冲区太小，这可能会导致效率低下的查询，因为缓冲区很快就会填满并使通道陷入停顿
- 如果缓冲区太大，这将给代理带来更多的内存压力，因为HTTP通道中有更多的结果数据在排队。

brokers的数量

A 1:15 ratio of Brokers to Historicals is a reasonable starting point (this is not a hard rule).
If you need Broker HA, you can deploy 2 initially and then use the 1:15 ratio guideline for additional Brokers.

总内存使用

要根据这些准则估计Broker的总内存使用量:
- Heap: allocated heap size
- Direct Memory: (druid.processing.numThreads + druid.processing.numMergeBuffers + 1) * druid.processing.buffer.sizeBytes

MiddleManager

MiddleManager是一个轻量级的任务控制器/管理器，它启动执行数据抽取工作的任务进程。

MiddleManager堆大小

MiddleManager本身不需要太多的资源，一般可以将堆设置为~128MB。

SSD存储

建议MiddleManager角色节点采用SSD磁盘，因为MiddleManager发起的任务处理存储在磁盘上的Segment数据。

任务数量

MiddleManager可以进行的任务数量由参数druid.worker.capacity。
集群中需要的MiddleManager数量取决于您需要为用例运行多少个并发摄取任务。可以在给定机器上启动的worker的数量取决于每个worker分配的资源大小和可用的系统资源。
您可以为集群分配更多的MiddleManager机器来增加任务容量。

Task配置文件

task heap大小

A 1GB heap is usually enough for Tasks.

lookups功能

两倍于 lookups的大小内存。

Task processing threads and buffers

任务处理线程和缓冲区
对于任务，1个或2个处理线程通常就足够了，因为任务中可查询的数据往往比Historical进程少得多。
- druid.indexer.fork.property.druid.processing.numThreads: set this to 1 or 2
- druid.indexer.fork.property.druid.processing.numMergeBuffers: set this to 2
- druid.indexer.fork.property.druid.processing.buffer.sizeBytes: can be set to 100MB

直接内存大小

上面描述的处理缓冲区和合并缓冲区是直接内存缓冲区。
当一个任务处理一个查询时，它必须打开一组Segment以供读取。这也需要一些直接的内存空间，如 segment decompression buffers所示。

连接池大小

druid.server.http.numThreads的值大于集群中所有Broker的druid.broker.http.numConnections的和。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 158,425评论 4赞 361
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 67,058评论 1赞 291
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 108,186评论 0赞 243
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 43,848评论 0赞 204
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 52,249评论 3赞 286
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,554评论 1赞 216
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,830评论 2赞 312
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,536评论 0赞 197
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,239评论 1赞 241
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,505评论 2赞 244
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 32,004评论 1赞 258
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,346评论 2赞 253
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 32,999评论 3赞 235
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 26,060评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,821评论 0赞 194
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,574评论 2赞 271
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,480评论 2赞 267

Druid--Druid的基础集群配置优化

概述

与进程类相关的配置建议

Historical 进程

Heap 大小（堆大小）

lookups功能

处理线程和缓冲区

Direct Memory Sizing

Connection pool sizing

segment缓存大小

Historicals的数量

SSD存储

总内存使用

segment大小问题

Broker

heap大小

Direct memory sizing

连接池大小

Broker 背压

brokers的数量

总内存使用

MiddleManager

MiddleManager堆大小

SSD存储

任务数量

Task配置文件

task heap大小

lookups功能

Task processing threads and buffers

直接内存大小

连接池大小

推荐阅读更多精彩内容