240 发简信
IP属地:澳门
  • hive高级聚合grouping sets/rollup/cube

    GROUPING SETS 该关键字可以实现同一数据集的多重group by操作。事实上GROUPING SETS是多个GROUP BY进行UN...

  • Hive分析函数和窗口函数

    Hive分析函数和窗口函数 在Hive 0.11之后支持的,扫描多个输入的行计算每行的结果。通常和OVER,PARTITION BY, ORDE...

  • HBase CURD之Get

    下面我们将介绍从客户端API中获取已存数据的方法。HTable类中提供了get()方法,同时还有与之对应的Get类。get方法分为两类:一类是一...

  • sqoop介绍与安装

    sqoop介绍与安装 1 概述 sqoop是Apache旗下的一款“hadoop和关系型数据库服务器之间传送数据”的工具。 导入数据:将关系型结...

  • hadoop序列化和反序列化

    hadoop序列化和反序列化 1 什么是序列化和反序列化 序列化就是将内存中的对象或数据,转换成字节数组,以便于存储(持久化)和网络传输。反序列...

  • JAVA_IO 之BufferedInputStream BufferedOutputStream

    JAVA IO 之BufferedInputStream BufferedOutputStream 有时间整理一下fill方法,并且把Buffe...

  • HBase CURD之Delete

    HBase CURD之Delete HTable提供了删除方法,同时与之前的方法一样有一个相应的类为Delete。 1 单行删除 delete(...

  • MapRedece中的分区Partitioner

    MapRedece中的分区Partitioner 分析 MapReduce中会将map输出的k-v对,按照相同的key进行分组,然后分发给不同的...

  • sqoop数据导入导出应用案例

    sqoop数据导入导出应用案例 1 sqoop导入数据 将RDBMS中的一个表数据导入到hdfs。表中的每一行被视为hdfs的记录。所有记录都存...