Learning Apache Kafka 2nd Edition读书笔记

Chap 1 Kafka简介

1.Apache Kafka是一款开源的,分布式的,基于分区、日志提交和订阅推送的消息系统。设计用于:

  • 持久化消息到硬盘,TB级别
  • 高吞吐量,每秒数百M读写
  • 分布式,支持弹性伸缩
  • 实时性

Chap 2 搭建Kafka集群

1.Kafka集群支持

  • 单节点,单broker
  • 单节点,多broker
  • 多节点,多broker

2.Kafka组成

  • Topic:消息目录名,类似于数据库表名Topic是可以分区的,消息在Topic中有唯一的序列号:offset。
  • Broker:运行的一个kafka server进程。Topic在Broker处理进程中创建。
  • ZK:充当broker和消费者之间的协调器,记录状态/配置/标记信息等。
  • Producers:产生Tpoic中的消息
  • Consumers:消费Producers产生的消息

3.一些操作说明

  • 创建topic时,replication-factor指定副本数,partitions指定分区数目。
  • 创建生产者时,使用broker-list指定broker列表并指定topic。
  • 创建消费者时,使用from-beginning指定从头读取并需要指定topic

Chap 3 Kafka设计

1.Kafka设计准则

  • topic是逻辑的概念,可以分为多个partition。partition是物理的概念,对应于有序/不可修改的日志文件。新消息写入topic,日志文件会新增记录,并在消息达到配置数量或者超时时写入硬盘。需要注意的是,flushed的消息才能被消费者读取到。
  • 分区中的消息使用offset唯一记录自己,每个分区可以设置副本用以容错
  • 分区至少有一个leader负责数据读写,其副本称之为follower。主副本信息存储在ZK中。主本出现问题后,副本会选举变成leader。
  • 消费者通过消费者组进行管理,对于消费者组订阅的主题,组内的消费者只能有一个消费者进行消费。消费者顺序消费消息并设置当前消息的offset。
  • Kafka定义基于时间的消息保存策略,超期后会自动清除消息。
  • 为了让生产者知道消息是否写入成功,提供获取回执和等待时间的配置。
  • 消费者读取消息然后记录处理位置offset,如果读取消息进行处理后,写入位置信息前消费者出现错误,下一个消费者会重复消费该消息。

2.日志压缩:相同key的消息,只保存最新的value,删除key相同的旧数据。Kafka支持的保存策略有:基于时间、基于文件大小和基于日志压缩。基于日志压缩的保存策略:

  • 消息的排序始终不变
  • 消息有序偏移,offset保持不变
  • 从0偏移开始遍历消息,能读取所有key的最新值

3.与其它消息系统不同,消费消息的元数据由consumer发起(保存在ZK中)而不是server。这可能导致:丢失消息和重复消费。所有的broker地位相同,没有master,broker的元数据保存在ZK。生产者发送消息支持同步和异步模式。

4.支持消息压缩,可以将一批消息压缩发送给broker,可以减少网络消耗。0.7版本之前,这批压缩消息会被同一个consumer消费,0.8之后的版本可以根据offset拆分访问。支持的压缩协议:GZIP和Snappy。

5.消息分区策略由生产者决定,broker按照消息到达的顺序存储消息,有几个分区由broker决定。

6.通过复制策略提供容灾,分为leader和fffollower,leader保存follower的列表:ISR(in-sync replicas)。支持的复制策略有:

  • 同步复制:生产者从ZK获取leader并写入消息,然后leader将消息写到follower并获取回执,全部回执成功后leader提交写入log并给生产者返回响应。此时,消费者便能拉去新写入的消息。
  • 异步复制:不等待follower回执就写入log,可能由于broker错误而不能保证消息的有效投递。

7.当有follpwer失效时,leader将从ISR列表中将其删除。当follower又回来时,首先重置日志到上次的checkpoint,然后从leader同步数据,同步完成后,leader将其写入到ISR列表中。

当leader出现错误(写入分区日志或者发送回执到生产者之前),消息会重新发送到新leader。优先选择早注册的follower成为leader,然后将其offset设置为集群的offset。其他follower通过注册在ZK的监听器察觉此动作,重置日志到上次checkpoint并向新leader开始同步数据。新leader在等待超时或者所有follower完成同步后将ISR列表写入ZK并承接读写工作。

Chap 4消费者

1.生产者连接任意节点,获取关于当前分区leader的元数据信息,然后将消息写入当前分区。写入时可以通过key并进行hash操作确定写入哪个分区。为了提高效率,支持按照时间或者条数进行批量异步写入,并提供回调函数处理写入错误,用以防止数据丢失。
2.通过实现Partitioner接口来实现分区计算。

Chap 5消费者

1.消费者连接任意节点获取leader分区信息。每个分区只能由订阅该topic的一个消费者消费,消费后会更新offset,然后根据offset由另一个消费者消费其他分区。

2.消费者API分为顶层API和底层API:

  • 顶层API:只读取数据,不与broker交互,不需要用户处理offset。内部自动从ZK读取offset并存储最终的offset,offset是基于消费者组进行存储的。同一消费者组,已经有运行的消费者进程,新增消费者进程,会进行reblance,可能造成消息的不确定性,因此,必须停已经运行的消费者进程。
  • 底层API:无状态,需要进行broker与消费者进行交互。

PS:六七章待读。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,015评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,262评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,727评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,986评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,363评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,610评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,871评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,582评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,297评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,551评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,053评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,385评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,035评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,079评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,841评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,648评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,550评论 2 270

推荐阅读更多精彩内容