240 发简信
IP属地:四川
  • Resize,w 360,h 240
    用mapreduce的方式将csv格式文件格式化处理并写入HBase

    将数据导入HBase的方式有很多,其中之一就是采用mapreduce来批量写入,最近所在的小组有这样的需求,大家又都还属于学习阶段,于是查阅了很...

  • Resize,w 360,h 240
    数据中心建设----数据仓库建设

    元数据: 数据周期:所谓数据周期是指从操作型环境中的数据发生改变起,到这个变化反映到数据仓库中所用的时间。 从操作型环境到数据仓库中要做的有哪些...

  • Resize,w 360,h 240
    数据中心建设----第1天到第n天的现象

    建立数据仓库不是一蹴而就的。相反,数据仓库只能一次一步地进行设计和载入数据,即它是进化性的,而非革命性的。突然建立一个数据仓库的费用、需要的资源...

  • python装饰器中的指针

    下面将给出两段python代码,通过这段代码来解释python装饰器中的指针。在这之前,我们首先要了解的是python中函数的闭包,其实就是一句...

  • Resize,w 360,h 240
    数据中心建设----数据仓库中粒度的确定

    前面已经讲到了数据仓库中的粒度有关概念,但是当我们在具体的实时过程中应该怎样去确定在建数据的粒度呢,书中也给出了一些指导意见: 一、粗略估计将来...

  • Resize,w 360,h 240
    数据中心建设----仓库设计中的过程模型/数据模型

    在数据仓库设计过程中我们有一些可以遵循的设计模型,这里有过程模型和数据模型,其中过程模型仅仅适用于操作性环境,数据模型既适用于操作型环境也适用于...

  • scala中HashMap的map方法

    scala真是一门有趣的语言,虽然编译后的程序跟java一样也运行在JVM之上,但是scala可真不像java那样易于理解,前两天我就遇到了一个...

  • 数据中心建设----粒度和活样本数据库

    粒度 以前一直不能理解粒度是什么意思,当看到《Building the Data Warehouse, 4th Edition》的第二章中的粒度...