240 发简信
IP属地:江西
  • 2018-12-10-Flink(3)——Event Time 与 Watermark

    本文转自个人微信公众号,原文链接。 如 上篇 所述,Flink 里时间包括Event Time、Processing Time 和 Ingest...

  • Resize,w 360,h 240
    2018-11-21-Flink(2)——apache flink 介绍

    本文转自个人微信公众号,原文链接。 Apache Flink is a framework and distributed processing...

  • Resize,w 360,h 240
    2018-11-13-Flink(1)——基于flink sql的流计算平台设计

    本文转自个人微信公众号,原文链接。 接上篇。 使用场景 先说流计算平台应用场景。在我们的业务中,实时平台核心包括几个部分:一是大促看板,比如刚过...

  • Cassandra教程(四):CQL要点整理

    本文不是详细的CQL教程,仅记录下CQL的一些要点。 Keyspace keyspace类似关系型数据库中的database概念,Cassand...

  • Resize,w 360,h 240
    Cassandra教程(三):Cassandra架构(下)

    上篇介绍了Cassandra的架构、数据distribution 与 replication,本文主要介绍Cassandra的内部工作机制,包括...

  • Cassandra教程(二):Cassandra架构(上)

    Cassandra 设计用来处理多节点大型数据工作负载,系统中没有单点,Cassandra 采用peer-to-peer架构,数据在所有节点之间...

  • Resize,w 360,h 240
    Cassandra 教程(一): Cassandra 简介

    Overview Apache Cassandra 是一个大规模可扩展的分布式开源NoSQL数据库,完美适用于跨数据中心/云端的结构化数据、半结...

  • Resize,w 360,h 240
    Spark 介绍

    声明:本文转自我的个人博客,有兴趣的可以查看原文。转发请注明来源。 最近工作开始接触Spark,本系列博客可以作为学习思考的纪录。 如果无特殊说...

  • Resize,w 360,h 240
    airflow 介绍

    声明:本文转自我的个人博客,有兴趣的可以查看原文。转发请注明来源。 最近工作需要,使用airflow搭建了公司的ETL系统,顺带在公司分享了一次...

个人介绍
生在重庆,学在北京,现居杭州,一名普通数据工程师。
个人博客: lxwei.github.io
微信公众号:星爷说事儿