Hive3新特性

1.执行引擎变更:TEZ

不用支持缓慢过时的MapReduce了,14年测试时TEZ比MapReduce快100%。

2.鉴权变更:Ranger

Hive默认使用storage-based authorization (SBA) ,HDP使用Ranger,Cloudera使用Sentry,Sentry 到后面感觉复杂又不好用。不知道Hortonworks和Cloudera合并后哪个占优势。

3.HDFS ACLs默认打开

大数据初始没有安全可言,现在都默认标配了。

4.ACID和LLAP支持

ACID用于支持大数据事务,已经成熟,默认打开

LLAP用于支持秒级、毫秒级访问,已经成熟,哪天测试下。

5.Hive 客户端变更

老旧的Hive CLI已经sunset,使用Hive CLI需要打开整个Hive代码库。

Beeline成了标配。

6.Hive Metastore变更

不再支持embedded Metastore,得打开独立服务了。

7.Spark catalog变更

不再和Hive catalog放一块,但可以相互访问

8.查询引擎变更

批处理使用TEZ、实时查询使用LLAP。

推荐阅读更多精彩内容