第一部分 什么是Hive: Hive是基于Hadoop之上的数据仓库,数据存放在HDFS上,它同样可以通过ETL来进行数据的抽取、转换和加载。同...
在遍历Map集合之前首先先定义一个Map对象: 这个地方使用的是LinkedHashMap,主要是为了确保让map中的元素是按照插入的顺序存放的...
当系统遇到一些问题或者异常的时候,我们往往会查看系统日志、JVM堆栈、GC日志,或者查看线程快照、堆转储快照等信息,然后进行一个客观的分析,最后...
从去年8月份进入项目组到现在,一年多了,回顾起来还是挺有味的。 刚开始进入项目组的时候,大家都挤在一个不大的房间里面,里面摆了两排桌子,就是上学...
在JVM的管控下,Java程序员不再需要管理内存的分配与释放,这和在C和C++的世界是完全不一样的。所以,在JVM的帮助下,Java程序员很少会...
Hive 的数据导入: 可以使用Load命令导入,也可以使用Sqoop组件导入数据。 Hive不支持insert插入单条语句 Hive的数据查询...
今天一早8点起床,洗漱完后,她妈妈已经在厨房做好了早饭。我盛了一碗粥,她妈妈给我剥了一个她自己做的茶叶蛋(是的,她真的是非常好的人,搞的我有点不...
分支模型 http://nvie.com/posts/a-successful-git-branching-model/ Git工作流程 服务器...
首先了解一下概念:进程是系统进行资源分配和调度的一个独立单位,进程包含以下3个特征: 独立性:拥有自己的资源与空间 动态性:动态执行的过程 并发...