240 发简信
IP属地:上海
  • hive分区表

    hive分区表 1 为什么出现分区表? 假设有海量的数据保存在hdfs的某一个hive表明对应的目录下,使用hive进行操作的时候,往往会搜索这...

  • Resize,w 360,h 240
    JAVA线程生命周期

    JAVA线程生命周期 摘要 本文详细总结了java线程的五种基本状态,和状态之间的转换关系;介绍了常见了创建线程的两种方法,一种是通过继承The...

  • Hive分析函数和窗口函数

    Hive分析函数和窗口函数 在Hive 0.11之后支持的,扫描多个输入的行计算每行的结果。通常和OVER,PARTITION BY, ORDE...

  • hive高级聚合grouping sets/rollup/cube

    GROUPING SETS 该关键字可以实现同一数据集的多重group by操作。事实上GROUPING SETS是多个GROUP BY进行UN...

  • HBase扫描操作Scan

    HBase扫描操作Scan 1 介绍 扫描操作的使用和get()方法类似。同样,和其他函数类似,这里也提供了Scan类。但是由于扫描工作方式类似...

  • Resize,w 360,h 240
    Hadoop InputFormat介绍

    Hadoop InputFormat介绍 1 概述 我们在编写MapReduce程序的时候,在设置输入格式的时候,会调用如下代码: 通过上面的代...

  • Resize,w 360,h 240
    flume架构总结

    flume架构总结 介绍flume之前先看一下Hadoop业务的整体流程开发: 从hadoop的业务流程图中可以看出,在大数据的业务逻辑处理过程...

  • HBase CURD之Delete

    HBase CURD之Delete HTable提供了删除方法,同时与之前的方法一样有一个相应的类为Delete。 1 单行删除 delete(...

  • Resize,w 360,h 240
    HBase CURD之Put

    HBase数据插入使用Put对象,Put对象在进行数据插入时,首先会向HBase集群发送一个RPC请求,得到相应之后将Put类中的数据通过序列化...