240 发简信
IP属地:广西
  • Resize,w 360,h 240
    ChromeDriver设置有密码的代理(Java版本)

    最近在在使用selenium爬取数据的时候,需要用到代理和JS渲染,使用PhantomJS渲染的效果无法解析部分数据,所以用了chrome渲染,...

  • Flink 有状态的流的工作(Working with state)

    有状态的函数和操作在处理各个元素或者事件时存储数据,使得state称为任何类型的复杂操作的关键构建部件,例如:当一个应用程序搜索某些特定的事件模...

  • Flink 的Window 操作

    Flink的 Window 操作 Window是无限数据流处理的核心,Window将一个无限的stream拆分成有限大小的”buckets”桶,...

    3.5 55368 4 55 1
  • Flink的Apache Kafka连接器

    这个连接器提供了对由Apache Kafka提供的事件流的访问。 Flink 提供了特殊的Kafka Connectors来从Kafka top...

  • Flink的Side Output(侧输出)

    除了从DataStream操作的结果中获取主数据流之外,你还可以产生任意数量额外的侧输出结果流。侧输出结果流的数据类型不需要与主数据流的类型一致...

  • Flink Table API&SQL的概念和通用API

    Table API和SQL通过join API集成在一起,这个join API的核心概念是Table,Table可以作为查询的输入和输出。这篇文...

    0.4 16697 0 15 1
  • Flink生成Timestamp和Watermark

    本章节是关于在event time上执行的程序的。想获取更多关于event time,processing time和ingestion tim...

  • Impala性能优化总结

    Impala性能优化要点: 1. 为数据存储选择合适的文件格式(如:Parquet)   通常对于大数据量来说,Parquet文件格式是最佳的 ...

  • Flink 基本的API概念

    原文链接:https://ci.apache.org/projects/flink/flink-docs-release-1.3/dev/api...