240 发简信
IP属地:青海
  • 漫谈事实表如何设计(三)

    一.周期性快照事实表的特性 1.1用快照采样状态 理解状态,状态可以指一段时间内某个事实的汇总,比如说近一个月用户下单汇总金额,这就是一个状态值...

  • Resize,w 360,h 240
    hive之with cube、with rollup、grouping sets

    一:多维分组聚合背景 企业针对有些指标,希望能够支撑上钻和下钻来进行查看,这样即可以满足精细化分析,又可以满足指标概览,当然现在的一些可视化工具...

  • Resize,w 360,h 240
    基于flink sql构建实时数据仓库

    1、需求背景 根据目前大数据这一块的发展,已经不局限于离线的分析,挖掘数据潜在的价值,数据的时效性最近几年变得刚需,实时处理的框架有storm,...

    7.0 9276 6 39
  • Resize,w 360,h 240
    一文了解数据库和数据仓库

    一:数据库的诞生背景 互联网已经高速发展了很多年,各大企业都根据自己的业务搭建了自己的门户网站,拥有自己的服务器,以及自己的用户。用户在对企业的...

  • Resize,w 360,h 240
    双向链表的原理与实现

    一、双向链表原理 顾名思义,双向链表跟单链表和循环列表最大的差别,就是同时拥有前驱指针和后驱指针,基于这一个特性,查询某结点的前一个结点,时间复...

  • Resize,w 360,h 240
    MapReduce2深入浅析

    一、MapReduce2工作机制 1.1、MapReduce2的架构图 1.2、MapReduce2运作步骤 说在前头的话,上图中有一个Reso...

  • Resize,w 360,h 240
    栈系列之-排序

    一、栈实现排序概述 将一个栈内的元素实现排序,光靠一个栈肯定是不够的,因为无法实现元素的调动,所以需要一个辅助栈,还有变量。实现步骤(创建两个栈...

  • hive一次补跑数据遇到的坑

    1.问题背景 介绍下这次遇到补数问题的背景。补数是数仓从事人员经常会碰到的问题,比如修复了历史错误的逻辑,需要修复历史数据,这种行为称之为补数,...

  • 多事务事实表实践

    一:企业级数仓多事务事实表的重要性 整个企业级的数据仓库,从表的性质来分,有维度表和事实表,事务表又分为多事务事实表,累积快照事实表,周期型快照...

个人介绍
大数据爱好者,专注数据仓库领域发展!