240 发简信
IP属地:上海
  • Resize,w 360,h 240
    2数据仓库生命周期_数据路线(读书笔记)

    数据路径 4.1维度建模 分析收集到的业务访谈需求,画出详细的业务流程图,确定命名约定。 根据业务需求、业务流程图,分析得到业务过程涉及的维度、...

  • Resize,w 360,h 240
    1数据仓库生命周期_技术路线(读书笔记)

    1. 技术路径 3.1技术架构设计 3.1.1后台架构 ETL流程 ETL处理流程主要由4个步骤:从源系统中抽取数据(Extract)、清洗(c...

  • (转)数据仓库之拉链表(原理、设计以及在Hive中的实现)

    作者:木东居士链接:https://www.jianshu.com/p/799252156379来源:简书著作权归作者所有。商业转载请联系作者获...

  • mysql binlog笔记

    概要 在大数据时代,数据研发人员总是想把各类数据采集到我们的数据仓库。最典型的方案是日志收集方案: flume采集文件,转发到kafka,再使用...

  • Resize,w 360,h 240
    ER建模方法

    范式: 一个实体的某个属性保存多个值,将这样的多值属性分离为一个实体。 ER建模遇到的问题: (1)如果存在一个实体与其它实体之间存在两个或更多...

  • MySql GTID记录(转)

    1)什么是GTID GTID(Global Transaction ID)是对于一个已提交事务的编号,并且是一个全局唯一的编号。GTID实际上是...

  • redHat 7.2 安装yum 切阿里源

    redhat 的更新包只对注册的用户生效,所以我们自己手动更改成CentOS 的更新包,CentOS几乎和redhat是一样的,所以无需担心软件...

  • 常用docker命令

    docker ps -a #查看docker进程 docker run -d #后台启动 docker restart #重启exit的...

  • centos安装Docker CDH+kafka

    一.安装jdk Centos的yum源更换为国内的阿里云源 rpm -qa|grep jdk yum -y install java-1.8.0...