kafka监听mysql实时数据变更

在做报表数据统计时,我们用的是mysql + kafka + Spark Streaming方案,
kafka监听mysql订单表中订单状态,然后发送到spark streaming中进行分析统计。
这里记录一下kafka监听mysql中数据变更方案

1、Kafka connect

  • 1.简介
    kafka connect 是一个可扩展的、可靠的在kafka和其他系统之间流传输的数据工具。简而言之就是他可以通过Connector(连接器)简单、快速的将大集合数据导入和导出kafka。可以接收整个数据库或收集来自所有的应用程序的消息到kafka的topic中

    Kafka connect是Confluent公司(当时开发出Apache Kafka的核心团队成员出来创立的新公司)开发的confluent platform的核心功能.大家都知道现在数据的ETL过程经常会选择kafka作为消息中间件应用在离线和实时的使用场景中,而kafka的数据上游和下游一直没有一个无缝衔接的pipeline来实现统一,比如会选择flume或者logstash采集数据到kafka,然后kafka又通过其他方式pull或者push数据到目标存储.
    而kafka connect旨在围绕kafka构建一个可伸缩的,可靠的数据流通道,通过kafka connect可以快速实现大量数据进出kafka从而和其他源数据源或者目标数据源进行交互构造一个低延迟的数据pipeline。

image.png

具体官网文档www.confluent.io/.
https://docs.confluent.io/2.0.0/connect/connect-jdbc/docs/index.html#examples

  • 2.安装

    • kafka安装
    • 下载kafka-connect-jdbc
      下载成功后,从confluentinc-kafka-connect-jdbc-4.1.2.zip libs中获取到kafka-connect-jdbc-4.1.2.jar,并把其放到kafka安装目录下libs文件夹中
    • 下载mysql-connector-java-5.1.47.jar,并把其放到kafka安装目录下libs文件夹中
  • 3.使用

    • 1.启动kafka sh kafkaStart.sh
    • 2.创建kafka topic
    ./bin/kafka-run-class.sh  kafka.admin.TopicCommand --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic mysql-kafka-comments
    
    • 3.新建source/sink配置文件,并放置在kafka config目录下
    vim quickstart-mysql.properties
    
    name=mysql-b-source-comments
    connector.class=io.confluent.connect.jdbc.JdbcSourceConnector
    tasks.max=1
    connection.url=jdbc:mysql://127.0.0.1:3306/android_service?user=xxx&password=xxxx
    # timestamp+incrementing 时间戳自增混合模式
    mode=timestamp+incrementing
    # 时间戳 commenttime
    timestamp.column.name=commenttime
    # 自增字段  id
    incrementing.column.name=id
    # 白名单表  comments
    table.whitelist=comments
    # topic前缀   mysql-kafka-
    topic.prefix=mysql-kafka-
    
    
    vim quickstart-mysql-sink.properties
    
    name=mysql-b-sink-comments
    connector.class=io.confluent.connect.jdbc.JdbcSinkConnector
    tasks.max=1
    #kafka的topic名称
    topics=mysql-kafka-comments
    # 配置JDBC链接
    connection.url=jdbc:mysql://127.0.0.1:3306/android_service?user=xxx&password=xxxx
    # 不自动创建表,如果为true,会自动创建表,表名为topic名称
    auto.create=false
    # upsert model更新和插入
    insert.mode=upsert
    # 下面两个参数配置了以pid为主键更新
    pk.mode = record_value
    pk.fields = id
    #表名为kafkatable
    table.name.format=kafkacomments
    
    
    
    
    • 4.启动kafka connect
    ./bin/connect-standalone.sh  ./config/connect-standalone.properties  ./config/quickstart-mysql.properties  ./config/quickstart-mysql-sink.properties
    

    启动过程中有报8083端口已经被占用,在config目录下,修改connect-standalone文件,在最后一样添加,用于修改监听REST API的默认端口

    #用于监听REST API的端口
    rest.port=8003
    
      1. 插入数据
        在comments表中插入数据后,可以看到在kafkacomments表中也同步插入了数据
    image.png
    image.png

    在comments表中更新数据后,可以看到在kafkacomments表中也同步更新了数据

    image.png
    image.png
    • 6.查看kafka topic中数据
    bin/kafka-console-consumer.sh  --bootstrap-server localhost:9092   --topic mysql-kafka-comments  --from-beginning
    
    image.png

2、canal

canal是阿里开源的中间件,纯Java开发,基于数据库增量日志解析,提供增量数据订阅&消费,目前主要支持了MySQL(也支持mariaDB),主要用于同步mysql数据库变更,是一个非常成熟的数据库同步方案。
https://github.com/alibaba/canal/

canal是通过模拟成为mysql 的slave的方式,监听mysql 的binlog日志来获取数据,binlog设置为row模式以后,不仅能获取到执行的每一个增删改的脚本,同时还能获取到修改前和修改后的数据,基于这个特性,canal就能高性能的获取到mysql数据数据的变更。

canal的部署主要分为server端和client端。
server端部署好以后,可以直接监听mysql binlog,因为server端是把自己模拟成了mysql slave,所以,只能接受数据,没有进行任何逻辑的处理,具体的逻辑处理,需要client端进行处理。
client端一般是需要大家进行简单的开发。https://github.com/alibaba/canal/wiki/ClientAPI 有一个简单的示例,很容易理解。

canal 1.1.1版本之后, 默认支持将canal server接收到的binlog数据直接投递到MQ(kafka,RocketMQ)
https://github.com/alibaba/canal/wiki/Canal-Kafka-RocketMQ-QuickStart

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,015评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,262评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,727评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,986评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,363评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,610评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,871评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,582评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,297评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,551评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,053评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,385评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,035评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,079评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,841评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,648评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,550评论 2 270

推荐阅读更多精彩内容