240 发简信
  • 120
    流式计算准确性语义分析

    本篇文章是对Exactly once is NOT exactly the same翻译和分析,对流式计算中衡量准确性的三类语义进行了初步的理解...

  • Hadoop YARN 架构详解

    通过对Hadoop1.0和2.0的架构对比,引出了YARN作为资源调度和管理器的作用。 1、YARN产生的背景 YARN是MRv1基础上演化而来...

  • HDFS单点故障和线性扩展问题

    这篇文章写的很优秀,然后自己稍微整理了下。转自:https://matt33.com/2018/07/15/hdfs-architecture-...

    0.7 37 0 2
  • HDFS的基本概念和体系结构

    1、HDFS的系统结构 2、NameNode NameNode是Apache Hadoop HDFS体系结构中的主节点,用于维护和管理DataN...

    0.6 19 0 2
  • HDFS的读写机制

    本篇博客讲解了HDFS的读机制和写机制,通过一个实例演示了HDFS的文件存储过程,非常通俗易懂。 1、客户端写文件 下图显示了在读取HDFS上的...

  • Spark Shuffle的基本原理分析

    这篇主要根据官网对Shuffle的介绍做了梳理和分析,并参考下面资料中的部分内容加以理解,对英文官网上的每一句话应该细细体味,目前的能力还有欠缺...

    0.2 15 0 1
  • 120
    最新Mac10.14.6安装MySQL5.7教程

    找了一圈的Mac中如何安装mysql的教程,真的还不如官网来的简洁明了。其中包含了安装地址、启动方式、密码、/etc/my.cnf配置文件的介绍...

  • 120
    Python基础数据结构

    回顾一下Python的基础数据结构,接下来工作可能更多用到的是利用Python对数据的ETL的处理以及利用Python进行自动化运维。 1.变量...

  • 120
    如何设计实现一个LRU Cache

    这道题是把操作系统和Java集合类联系起来的一道题目,是非常值得研究的一道题目。(思考点:缓存的算法设计和需要缓存的数据是以什么样的数据格式存放...