240 发简信
  • 120
    千万别说你懂买房

    最近几天把这个本书——《千万别说你懂买房》 看完了,这个本书的作者呢?是一位在房产纠纷领域经验非常丰富的律师,他过去一二十年的职业生涯中,遇到了...

  • 12 Beam 之 pipeline

    这篇总结来自极客时间专栏《大规模数据处理实践》的 26-29 节。 这几篇文章都是了解性质、偏基础的文章,并没有太多的深度,而且内容其实跟 Fl...

  • 11 Beam 之 PCollection 和 Transform

    这篇总结来自极客时间专栏《大规模数据处理实践》的 24-25 节。 PCollection:Beam 的 数据封装 这里先来看下 为什么 Bea...

  • 120
    10 Apache Beam 简介

    这篇总结来自极客时间专栏《大规模数据处理实践》的 22-23 节。 Apache Beam 的今生前世 这里先总结下第 22 章的内容,这节主要...

  • 120
    09 Spark 与 Flink 对比

    这篇总结来自极客时间专栏《大规模数据处理实践》的 21 节。 19-20 节的内容比较简单,是大数据处理常见的应用案例,这里不再介绍,总结一下 ...

  • 120
    08 Spark 之 Spark Streaming 和 Structured Streaming

    这篇总结来自极客时间专栏《大规模数据处理实践》的 16-17 节。 这篇主要看下 Spark 流计算这块的能力,过去 Spark 主推的是 Sp...

    0.5 89 0 3
  • 120
    07 Spark 之 Spark SQL

    这篇总结来自极客时间专栏《大规模数据处理实践》的 15 节。 记得 15 年的时候,那时还在研一,当时北京每个月都会有 Spark Meetup...

  • 120
    06 Spark 之 RDD

    这篇总结来自极客时间专栏《大规模数据处理实践》的 13-14 节。 Spark 中最基本的数据抽象是 RDD(Resilient Distrib...

  • 120
    05 Spark:为什么选择 Spark

    这篇总结来自极客时间专栏《大规模数据处理实践》的 12 节。 Apache Spark 是 2009 年由加州大学伯克利 AMP 实验室开发的,...

个人介绍
与一些有趣的人,做一些有趣的事(技术文章更新在个人网站:matt33.com),个人公众号:柳年思水