240 发简信
  • flume 的source 、channel和sink 多种组合

    flume 有三大组件source 、channel和sink,各个组件之间都可以相互组合使用,各组件间耦合度低。使用灵活,方便。 1.多sin...

  • 为什么Kafka那么快

    网上有很多Kafka的测试文章,测试结果通常都是“吊打”其他MQ。感慨它的牛B之余我觉得必要仔细分析一下它如此快速的原因。这篇文章不同于其他介绍...

  • 120
    MapReduce的原理及执行过程

    MapReduce简介 MapReduce是一种分布式计算模型,是Google提出的,主要用于搜索领域,解决海量数据的计算问题。 MR有两个阶段...

  • Hive高级查询操作

    根据已经存在的表,使用as关键字,创建一个与查询结果字段一致的表,同时将查询结果数据插入到新表 只有student_id,name两个字段的表 ...

  • Hive学习

    us.apache.org/dist/hive/hive-2.1.1/ 官方文档:https://cwiki.apache.org/conflu...

  • Hive学习笔记1

    什么是Hive: Hive是基于Hadoop之上的数据仓库,数据存放在HDFS上,它同样可以通过ETL来进行数据的抽取、转换和加载。同时Hive...

  • Hive高级查询操作

    Hive高级操作 1.使用LIKE、AS创建表,表重命名,添加、修改、删除列 表结构数据复制 根据已存在的表结构,使用like关键字,复制一个表...

  • 6.MySql中的SQL语句(五):多表查询

    多表查询有如下几种: 合并结果集;UNION、UNION ALL 连接查询 内连接[INNER] JOINON 外连接OUTER JOIN ON...

  • @Query注解的用法(Spring Data JPA)

    1. 一个使用@Query注解的简单例子 @Query(value = "select name,author,price from Book ...