240 发简信
IP属地:四川
  • 十七.Hadoop部分问题思考

    1.关于切片的时候保证数据完整性的问题 MapReduce在进行切片的时候有几个参数,一个是最小切片大小(mapred.min.split.si...

  • Resize,w 360,h 240
    关于IDEA配置文件和代码的路径

    Sources Root:告诉idea这个文件夹及其子文件夹中包含源代码,是需要编译构建的一部分 Test Sources Root:测试源文件...

  • Resize,w 360,h 240
    三.Flink集群搭建

    Flink可以选择的部署方式有: Local、Standalone(资源利用率低)、Yarn、Mesos、Docker、Kubernetes、A...

  • 二.Flink基本架构

    2.0 JobManager与TaskManager Flink运行时包含了两种类型的处理器: JobManager处理器:也称之为Master...

  • Resize,w 360,h 240
    一.Flink概述

    1.1 技术演变 流处理语义 At most once(最多一次):每条数据记录最多被处理一次,潜台词也表明数据会有丢失(没被处理掉)的可能 A...

  • 六.Kibana

    Kibana是一个开源的分析和可视化平台,设计用于和Elasticsearch一起工作。 你用Kibana来搜索,查看,并和存储在Elastic...

  • Resize,w 360,h 240
    五.Logstash

    5.1 Logstash简介 Logstash is a tool for managing events and logs. You can ...

  • 四.IK分词器

    针对词条查询(TermQuery),查看默认中文分词器的效果: [itstar@hadoop105 elasticsearch]$ curl -...

  • 三.Java API操作

    Elasticsearch的Java客户端非常强大;它可以建立一个嵌入式实例并在必要时运行管理任务。 运行一个Java应用程序和Elastics...