240 发简信
IP属地:浙江
  • Resize,w 360,h 240
    Windows下Go语言环境搭建

    软件环境 Windows 7 Git 2.10.1 Go 1.14.2 安装过程 首先安装go1.14.2.windows-amd64.msi,...

  • Resize,w 360,h 240
    Flink文档 - 数据流编程模型

    抽象层级 Flink提供了几个不同的抽象层级来开发流处理/批处理应用程序。 最底层抽象简单的提供了状态流处理。该功能主要封装在DataStrea...

  • Spark文档 - 作业调度

    概述 Spark提供了几个可以在计算过程之间调度资源的工具。首先,每个Spark应用程序(SparkContext实例)都运行在独立的execu...

  • Hadoop文档(2.9.2) - MapReduce指南

    预览 Hadoop MapReduce是一个软件框架,用于编写并行处理海量数据的应用程序,应用程序运行在一个通用硬件组成的,可靠的,容错的大型集...

  • Hadoop文档(2.9.2) - YARN架构

    YARN最基本的想法就是将资源管理的功能和作业调度/监控的功能分隔在不同的进程中。即使用一个全局的资源管理器(RM)和每个应用一个的应用节点(A...

  • Resize,w 360,h 240
    Windows下搭建Spark开发测试环境

    Windows下使用IDEA开发Spark应用程序配置说明(使用sbt构建)。 软件环境 Hadoop 2.7.7 Spark 2.4.0 Sc...

  • Spark文档 - 集群模型预览

    组件 Spark应用程序运行在集群上的独立进程中,由驱动程序中的SparkContext对象调度。 SparkContext可以连接到几种集群管...

  • Resize,w 360,h 240
    Hadoop文档(2.9.2) - HDFS架构

    介绍 Hadoop分布式文件系统(HDFS)是一种运行在通用硬件上的分布式文件系统。它与传统的分布式文件系统有很多相似之处,但是也有显著的不同。...

  • Spark文档 - SQL编程指南

    预览 Spark SQL是Spark用于结构化数据处理的模块。不同于基本的RDD API,Spark SQL API提供了更多有关数据和计算的机...