Hive函数 Hive函数 一、关系运算: 等值比较: = 语法:A=B操作类型:所有基本类型描述:如果表达式A与表达式B相等,则为TRUE;否...
MapReduce执行流程 MapReduce的执行步骤 1、Map任务处理 1.1 读取HDFS中的文件。每一行解析成一个<k,v>。每一个键...
.Azkaban工作流引擎和Flume数据采集 Azkaban介绍 一、Azkaban简介 为什么需要工作流调度系统? 因为一个完整的数据分析系...
Python 八大排序算法速度比较 这篇文章并不是介绍排序算法原理的,纯粹是想比较一下各种排序算法在真实场景下的运行速度。算法由 Python ...
HDFS入门 hadoop架构 Hadoop 1.0中的资源管理方案 Hadoop 1.0指的是版本为Apache Hadoop 0.20.x、...
MapReduce 1.x架构、MapReduce2.x架构 MapReduce1.x架构 MapReduce2.x架构 新的WordCount...
HDFS工作机制 两大角色: DataNode:负责管理用户的文件数据块NameNode:负责管理整个文件系统的元数据 NameNode的工作机...
Hive常用调优使用帮助文档 目录 背景 案例1:使用Tez优化MapJoin 案例2:使用Tez优化Group By 案例3:使用Tez优化J...
Spring Spring是一个生态体系(也可以说是技术体系),是集大成者,它包含了Spring Framework、Spring Boot、S...