240 发简信
IP属地:广东
  • 分析hdfs文件变化及监控小文件

    1、文档编写目的 目前各个企业都在利用Hadoop大数据平台,每天都会通过ETL产生大量的文件到hdfs上,如何有效的去监测数据的有效性,防止数...

  • logstash+kafka收集hue日志,分析用户下载数据情况

    1.文档编写目的 主要是为了给大家提供一种监控某个服务运行情况或者是针对该服务日志进行一些其他分析功能的技术选型方式。本篇文档将针对大数据集群的...

  • Resize,w 360,h 240
    CM和CDH升级操作手册

    前言 因为cdh版本更新频率较快,各个小版本之间变化可能不是很大,但是Cloudera公司的每一次更新带来的都是bug的修复,技术的革新。相较于...

  • Resize,w 360,h 240
    presto升级操作文档

    1、前言 由于presto基于内存计算,相比较与hive(on spark)有更好的交互查询体验,组织决定使用presto作为主要的交互查询工具...

  • Resize,w 360,h 240
    Dr. Elephant 使用文档

    1. 引言 Dr. Elephant 由 LinkedIn 于 2016 年 4 月份开源,是一个 Hadoop 和 Spark 的性能监控和调...

  • Resize,w 360,h 240
    Dr-elephant安装说明文档

    Dr-elephant安装说明文档 1. 前言 “大象医生”是LinkedIn推出的一款Hadoop和Spark性能调节工具,它能够自动收集Ha...

  • Resize,w 360,h 240
    Hue中下载CSV数据转化为Excel

    前言 目前的Hue工具,出现了不能下载Excel数据的情况。这是因为Hue有自己的保护机制,当用户使用Hue下载Excel数据时,Hue会将所有...

  • clickhouse部署流程

    一、概述 clickhouse是一个数据库管理系统,对于数据的读写、存储、查询、修改、复制、事务、效率等有其独特的方法架构论;另外它是列式存储的...