Hive

1.HIve是什么?

-由facebook开源,最初用于解决海量结构化的日志数据统计问题;2008年facebook把hive项目贡献给Apache;ETL(Extraction-Transformation-Loading)数据抽取、加载、处理工具;

-构建在Hadoop上的数据仓库框架,数据计算使用MapReduce,数据存储使用HDFS

-设计目的是让SQL技能良好,但Java技能较弱的分析师可以查询海量数据

-Hive 定义了一种类 SQL 查询语言——HQL(类似SQL,但不完全相同)

通常用于进行离线数据处理(采用MapReduce);

可认为是一个HQL→MR的语言翻译器

推荐阅读更多精彩内容