240 发简信
IP属地:广东
  • Resize,w 360,h 240
    Dr. Elephant 使用文档

    1. 引言 Dr. Elephant 由 LinkedIn 于 2016 年 4 月份开源,是一个 Hadoop 和 Spark 的性能监控和调...

  • Resize,w 360,h 240
    CM和CDH升级操作手册

    前言 因为cdh版本更新频率较快,各个小版本之间变化可能不是很大,但是Cloudera公司的每一次更新带来的都是bug的修复,技术的革新。相较于...

  • Resize,w 360,h 240
    presto升级操作文档

    1、前言 由于presto基于内存计算,相比较与hive(on spark)有更好的交互查询体验,组织决定使用presto作为主要的交互查询工具...

  • clickhouse部署流程

    一、概述 clickhouse是一个数据库管理系统,对于数据的读写、存储、查询、修改、复制、事务、效率等有其独特的方法架构论;另外它是列式存储的...

  • YARN 资源抢占模式参数分析

    ### 基本概念 1. 集群资源定义 YARN的资源抽象比较简单,只有两种资源:内存和CPU。而资源数量是管理员手动设置的,每个NM节点可以...

  • logstash+kafka收集hue日志,分析用户下载数据情况

    1.文档编写目的 主要是为了给大家提供一种监控某个服务运行情况或者是针对该服务日志进行一些其他分析功能的技术选型方式。本篇文档将针对大数据集群的...

  • Resize,w 360,h 240
    Hue中下载CSV数据转化为Excel

    前言 目前的Hue工具,出现了不能下载Excel数据的情况。这是因为Hue有自己的保护机制,当用户使用Hue下载Excel数据时,Hue会将所有...

  • Resize,w 360,h 240
    hue集成sentry后添加用户操作流程

    一、前言 我们都知道hue+sentry可以管理hive的用户以及权限,但是其中有几个概念必须要要弄明白:1、hue的用户以及用户组是独立的,跟...