storm架构和安装

storm技术的引入

对于一些要求进行实时数据分析的,并以秒级、甚至毫秒级就要反馈结果的场景(交通部门监控超速车辆、互联网监测网络攻击等)。这时候Hadoop的mapreduce计算框架已经不能满足需求,这个时候就需要使用实时计算框架Storm或Spark Streaming。

实时数据处理的两种形式

  1. Continuous Streaming 持续流式计算:单独处理每条记录,并在记录出现时立即处理。Storm采用这种计算模式
  2. 微批量计算:将多个记录组合(可以按照记录的数量或者时间分割出来)为一个单位,然后进行计算处理。Spark Streaming计算框架采用这种模式。

storm的几个重要特性

  1. 是开源的分布式实时计算系统
  2. 编程模型简单,可以支持多种编程语言
  3. 低延迟,可以达到秒级。
  4. 易扩展(增加计算节点),有容错机制。

storm架构体系

  1. 整体架构图


    Image.png
  2. 各组件功能和特性
  • Nimbus:
    1. 作为主节点,本身是无状态的,状态信息是由zookeeper存储(实现了高可用,当nimbus挂掉,可以找另外一个节点启动nimbus进程,状态信息从zookeeper获得)。
    2. 在nimbus进程失败后,可以快速重启恢复正常工作,不需要很长的时间来进行初始化和状态恢复。
    3. 接受客户端任务Topology的提交,然后把代码发布到zookeeper上,由supervisor到zookeeper上领取任务。
    4. 当nimbus从zookeeper得知有supervisor节点挂掉,可以将该节点的任务重新分配给其他子节点。
  • Supervisor
    1. 作为从节点
    2. 从zookeeper上获取nimbus分配的任务,负责启动和停止worker工作进程
    3. 自己的状态信息汇报到zookeeper上,然后由nimbus监控
  • worker:负责启动和停止executor线程
  • executor:真正执行任务task的线程。
  • zookeeper:存储nimbus和supervisor的状态信息,这样使storm集群保持无状态,具有高可用性。


    Image.png
  • logviewer:负责storm集群中日志收集的进程,需要在每个supervisor节点上启动

Storm的安装部署

  1. 将安装包解压到指定目录
    $ tar zxvf apache-storm-0.9.6.tar.gz -C /opt/modules/
    Image.png
  2. 在./conf/storm_env.ini中配置JAVA_HOME


    Image.png
  3. 对./conf/storm.yaml进行配置(格式一定要注意,不要用tab)
    storm.zookeeper.servers:指定zookeeper集群节点
    nimbus.host:指定nimbus节点
    storm.local.dir:这个指定的本地系统的地址用来保存任务提交的jar包
    supervisor.slots.ports:指定supervisor启动的工作进程work的默认端口号,若超过指定的个数,将随机分配


    Image.png
  4. 启动zookeeper(提前安装部署成功),然后启动主节点nimbus和从节点supervisor以及logviewer。在刚启用主节点、从节点、logviewer的时候,用jps查看,进程名会显示config_value,这是因为这时正在加载配置文件。
    $ bin/zkServer.sh start
    $ nohup bin/storm nimbus >/dev/null 2>&1 &
    $ nohup bin/storm supervisor >/dev/null 2>&1 &
    $ nohup bin/storm logviewer>/dev/null 2>&1 &
    所有进程启动成功后用jps查看
    Paste_Image.png
  5. 启动ui进程
    $ nohup bin/storm ui >/dev/null 2>&1 &
    Paste_Image.png

    Paste_Image.png
  6. 测试运行自带的单词统计示例(注意:任务会一直运行)
$ bin/storm jar examples/storm-starter/storm-starter-topologies-0.9.6.jar storm.starter.WordCountTopology wordcount
Paste_Image.png

Paste_Image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,847评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,208评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,587评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,942评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,332评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,587评论 1 218
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,853评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,568评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,273评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,542评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,033评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,373评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,031评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,073评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,830评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,628评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,537评论 2 269

推荐阅读更多精彩内容

  • 背景 OpenShift是目前比较主流的基于Kubernetes的容器云解决方案,OpenShift在kubern...
    小白_18M阅读 1,156评论 0 5
  • storm启停脚本的编写: 第一步:在master节点创建start-supervisor.sh脚本,然后分发到各...
    夙夜M阅读 639评论 0 0
  • Strom集群结构是有一个主节点(nimbus)和多个工作节点(supervisor)组成的主从结构,主节点通过配...
    看山远兮阅读 2,731评论 0 7
  • 目录 场景假设 调优步骤和方法 Storm 的部分特性 Storm 并行度 Storm 消息机制 Storm UI...
    mtide阅读 16,901评论 30 60
  • 刚来深圳的时候,找的第一份工作上班时间是9:30,每天上班7个小时,宿舍离公司步行5分钟。当时选择这份工作的原...
    米多姐姐阅读 548评论 0 1