• SparkStreaming源码之JobGenerator

    SparkStreaming源码之JobGenerator篇 JobGenerator概述 主要作用就是生成SparkStreaming Job 并且驱动checkpoint...

  • 120
    单身女生独居简陋公寓引万人围观:一个人住,真的会上瘾

    今天是精读君陪伴你终身成长的第2127天 1 在日本,有一个单身女生Mai,她无车无房,却在租来的...

  • 120
    Kafka系列之(5)——Kafka Producer源码解析

    KafkaProducer源码解析 KafkaProducer使用示例 (1)、KafkaProducer的send方法 (2)、Partition方法 下图是kafka-m...

  • Spark核心理念-弹性分布式数据集 简介

    Resilient Distribute DataSet RDD是Spark最核心的理念, 要掌握Spark, 首先要把RDD这个概念搞明白. 下面我将尝试去解释一下RDD的...

  • 120
    机器学习(三)基本的统计工具

    同步更新在个人网站:http://www.wangpengcufe.com/machinelearning/ml-ml3/ 给定一个数据集,数据分析师一般会先观察一下数据集的...