• Hive企业级调优表的优化

    小表、大表Join 将key相对分散,并且数据量小的表放在join的左边,这样可以有效减少内存溢出错误发生的几率;再进一步,可以使用map jo...

  • Hive存储和压缩结合

    修改Hadoop集群具有Snappy压缩方式 查看hadoop checknative命令使用 查看hadoop支持的压缩方式 将编译好的支持S...

  • 120
    Hive超详细存储

    文件存储格式 Hive支持的存储数据的格式主要有:TEXTFILE 、SEQUENCEFILE、ORC、PARQUET。 列式存储和行式存储 左...

  • Hive压缩

    Hadoop源码编译支持Snappy压缩 资源准备 CentOS联网 配置CentOS能连接外网。Linux虚拟机ping www.baidu....

  • Hive内置函数自定义函数详解

    系统内置函数 查看系统自带的函数 显示自带的函数的用法 详细显示自带的函数的用法 自定义函数 Hive 自带了一些函数,比如:max/min等,...

  • Hive其他常用查询函数

    空字段赋值 函数说明NVL:给值为NULL的数据赋值,它的格式是NVL( value,default_value)。它的功能是如果value为N...

  • Hive分桶及抽样查询

    分桶表数据存储 分区提供一个隔离数据和优化查询的便利方式。不过,并非所有的数据集都可形成合理的分区。对于一张表或者分区,Hive 可以进一步组织...

  • Hive排序

    全局排序(Order By) Order By:全局排序,只有一个Reducer 使用 ORDER BY 子句排序 ORDER BY 子句在SE...

  • HiveJoin语句

    等值Join Hive支持通常的SQL JOIN语句,但是只支持等值连接,不支持非等值连接。案例实操 根据员工表和部门表中的部门编号相等,查询员...