BIGUFO - 简书

BIGUFO

IP属地：四川

基于SparkSQL实现的一套即席查询服务
IQL (项目地址：https://github.com/teeyog/IQL) English | 简体中文基于SparkSQL实现了一套即...

4.0 7034 7 23
Spark Streaming管理Kafka偏移量
前言为了让Spark Streaming消费kafka的数据不丢数据，可以创建Kafka Direct DStream，由Spark Stre...

3516 1 17

spark任务之Task失败监控
需求 spark应用程序中，只要task失败就发送邮件，并携带错误原因。背景在spark程序中，task有失败重试机制（根据 spark.t...

0.3 7681 4 12
Spark整合HBase（自定义HBase DataSource）
背景 Spark支持多种数据源，但是Spark对HBase 的读写都没有相对优雅的api，但spark和HBase整合的场景又比较多，故通过sp...

3664 0 12
[spark] Shuffle Write解析 (Sort Based Shuffle)
本文基于 Spark 2.1 进行解析前言从 Spark 2.0 开始移除了Hash Based Shuffle，想要了解可参考Shuffl...

0.5 3119 1 12
[Spark SQL] 源码解析之Analyzer
前言由前面博客我们知道了SparkSql整个解析流程如下： sqlText 经过 SqlParser 解析成 Unresolved Logic...

0.7 1939 0 11
Elasticsearch5.6搭建及拼音中文混合搜索实现
功能分布式的搜索引擎和数据分析引擎全文检索，结构化检索，数据分析对海量数据进行近实时的处理环境搭建从官网下载压缩包 elasticse...

0.2 2072 0 11

[spark] Shuffle Read解析 (Sort Based Shuffle)
Shuffle Write 请看 Shuffle Write解析。本文将讲解shuffle Reduce部分，shuffle的下游Stage的...

0.3 2820 0 10
[Spark SQL] 源码解析之Parser
前言由上篇博客我们知道了SparkSql整个解析流程如下： sqlText 经过 SqlParser 解析成 Unresolved Logic...

0.7 3891 0 9