Hive简介

1.
  • Hive提供了一个被称为hive查询语言的的SQL方言,来查询存储在Hadoop集群中的数据。
  • Hive可以将大多数的查询转换为MapReduce任务,进而在介绍一个令人熟悉的SQL抽象的同时,拓宽Hadoop的可扩展性。
  • Hive最适合于数据仓库应用程序,使用该应用程序进行相关的静态数据分析,不需要快速响应给出结果,而且数据本身不会频繁变化。
  • Hive不支持记录级别的更新、插入或者删除操作,但用户可以通过查询生成新表或者将查询结果导入到文件中。
  • Hadoop面向批处理,MapReduce任务的启动过程需要消耗较长的时间,所以hive查询延时比较严重。
  • Hive不支持事务,不支持OLTP(联机事务处理)所需的关键功能。
  • Hive最适合数据仓库应用程序,可以维护海量数据,而且可以对数据进行挖掘,然后形成意见和报告。

推荐阅读更多精彩内容