240 发简信
  • Flink 状态管理 (Working with State)

    说到状态管理, 必须要提一下 checkpoint, Flink 中每个函数和算子都可以是有状态的, 有状态的函数需要存储每个事件的处理过程数据...

  • 有趣的Scala

    First Steps to Scala,Scala 入门教程。 A Scala Tutorial,一篇面向 Java 程序员的 Scala 教...

  • Flink编程<二> Windowing

    对于非清洗数据类的任务, 时间窗口的使用是很有必要的. 和spark不同, 需要时刻谨记, 这是一个流, 这是一个流, 这是一个流.

  • Flink编程<三> 坑

    1 注意import的StreamExecutionEnvironment // java 的头是 import org.apache.flin...

  • 120
    Flink编程<一> 概念, Setup

    首先需要编程应用的四层抽象: 最底下的一层对用户是不可见的, 通过ProcessFunction集成到DataStream API. 我们的编程...

  • 决策树

    Decision Tree (决策树/判定树)是监督学习中的分类算法, 通常预测和分类算法的评估主要体现在: 准确率:预测的准确与否是本算法的核...

  • 120
    Flink计算架构简析

    在谈Flink之前, 我们在一个更高的层面上来理解一下数据的处理, 包括数据类型和处理模型两个大的方面. 首先, 是数据的类型 我们把数据处理分...

  • 120
    ES - 中文分词及高亮搜索

    包括内容: IK分词组件的添加和配置 索引建立及高亮搜索示例 添加自定义分词的测试 版本: ES - 2.4.5, IK - 1.10.5ps:...

  • ES - 集群点滴

    这里主要记录一下集群使用用碰到过的要点, 以及对性能优化比较有意义的知识点. 会逐渐完善拆解 内存: 首先应该记住, 必须给予Elasticse...