hive分区表 1 为什么出现分区表? 假设有海量的数据保存在hdfs的某一个hive表明对应的目录下,使用hive进行操作的时候,往往会搜索这...
JAVA线程生命周期 摘要 本文详细总结了java线程的五种基本状态,和状态之间的转换关系;介绍了常见了创建线程的两种方法,一种是通过继承The...
Hive分析函数和窗口函数 在Hive 0.11之后支持的,扫描多个输入的行计算每行的结果。通常和OVER,PARTITION BY, ORDE...
GROUPING SETS 该关键字可以实现同一数据集的多重group by操作。事实上GROUPING SETS是多个GROUP BY进行UN...
HBase扫描操作Scan 1 介绍 扫描操作的使用和get()方法类似。同样,和其他函数类似,这里也提供了Scan类。但是由于扫描工作方式类似...
Hadoop InputFormat介绍 1 概述 我们在编写MapReduce程序的时候,在设置输入格式的时候,会调用如下代码: 通过上面的代...
flume架构总结 介绍flume之前先看一下Hadoop业务的整体流程开发: 从hadoop的业务流程图中可以看出,在大数据的业务逻辑处理过程...
HBase CURD之Delete HTable提供了删除方法,同时与之前的方法一样有一个相应的类为Delete。 1 单行删除 delete(...
HBase数据插入使用Put对象,Put对象在进行数据插入时,首先会向HBase集群发送一个RPC请求,得到相应之后将Put类中的数据通过序列化...