240 发简信
IP属地:辽宁
  • Hive优化:map join

    如果不指定MapJoin符合或者不符合MapJoin的条件,那么Hive解析器会将Join操作转换成Common Join,即:

  • kylin的入门使用

    我们kylin环境安装成功之后,我们就可以在hive当中创建数据库以及数据库表,然后通过kylin来实现数据的查询 第一步:创建hive数据库以...

  • Kylin的环境安装

    1)官网地址 http://kylin.apache.org/cn/ 2)官方文档 http://kylin.apache.org/cn/doc...

  • Kylin前置基础知识了解

    1、数据仓库、OLAP 与 BI 数据仓库 数据仓库,英文名称 Data Warehouse,简称 DW。《数据仓库》一书中的定义 为:数据仓库...

  • 使用kylin来分析我们Hbase当中的数据

    前面我们已经通过flink将数据介入到了hbase当中去了,那么我们接下来就可以通过hive整合hbase,将hbase当中的数据映射到hive...

  • Linux命令总结1

    大数据技术之linux第一章:linux系统简介与安装部署1.1发展背景 Linux 内核最初只是由芬兰人林纳斯•托瓦兹(Linus Torva...

  • flink的广播变量,累加器,计数器以及分布式缓存

    1、广播变量广播变量主要分为两种方式:dataStream当中的广播变量以及dataSet当中的广播变量,这两个地方的广播变量还有一定的不一样的...

  • Flink批量处理之DataSet

    flink不仅可以支持实时流式处理,它也可以支持批量处理,其中批量处理也可以看作是实时处理的一个特殊情况 1、 dataSet的内置数据源 基于...

  • Flink的DataStream集成kafka

    对于实时处理当中,我们实际工作当中的数据源一般都是使用kafka,所以我们一起来看看如何通过Flink来集成kafka flink提供了一个特有...