JobScheduler有两个重要成员,一是上文介绍的 ReceiverTracker,负责分发 receivers 及源源不断地接收数据;二是...
扩展阅读: Apache Kylin 查询流程源码剖析 - 简书[https://www.jianshu.com/p/21df8303d2ae]...
扩展阅读: Apache Kylin 概览 - 简书 可能是全网最深度的 Apache Kylin 查询剖析 - 简书 一、Overview 1...
本文基于 incubator-livy 0.4.0-incubating 从Livy Rest Api[https://github.com/c...
一、trait Source Source 必须不断地到达数据以进行流式查询。 Source 必须具有单调递增的进度概念,用 offset 表示...
based on spark-1.5.1 standalone mode 在Spark Application Web UI的 Stages t...
Delta Lake is an open-source storage layer that brings ACID transactions...
欢迎关注我的微信公众号:FunnyBigData 作为打着 “内存计算” 旗号出道的 Spark,内存管理是其非常重要的模块。作为使用者,搞清楚...
Spark 1.3及其前的版本 你的一个 spark streaming application 已经好好运行了一段时间了,这个时候你因为某种原...