240 发简信
IP属地:广东
  • ETL 工作流程

    ETL是英文Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、...

  • Resize,w 360,h 240
    谈谈数据脱敏

    大数据平台通过将所有数据整合起来,充分分析与挖掘数据的内在价值,为业务部门提供数据平台,数据产品与数据服务。大数据平台接入的数据中可能包括很多用...

  • Resize,w 360,h 240
    HotSpot虚拟机在java 1.8中的新实现

    Java HotSpot 虚拟机是 Java SE 平台的一个核心组件。它实现 Java 虚拟机规范,并作为 Java 运行时环境中的一个共享库...

  • 恩,你至少看起来是专业的!

    想到专业,我反正第一个反应就是professional,和这个那些个看不懂摸不着的专业名词,特别是那些关于我们工作中的很多引文词汇,存在便有意义...

  • Resize,w 360,h 240
    今天开始记录自己

    因为最近自己要开始找工作, 想稳定的提高自己, 故准备开始为自己每天的工作学习添加一些记录。 记录生活的细节, 记录学习的点滴, 记录工作的日常...

  • Resize,w 360,h 240
    冰解的破-MapReduce

    MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。 概念"Map(映射)"和"Reduce(归约)",是它们的主要思想...

  • Resize,w 360,h 240
    冰解的破-Redis

    Redis 是一个 Key-Value 存储系统。和 Memcached 类似,它支持存储的 value 类型相对更多,包括 string(字符...

  • Resize,w 360,h 240
    冰解的破-kerberos

    学习整理: 理解kerberos在spark/hadoop体系下的应用: 说道安全,可能是整个大数据体系中最晦涩难懂的一部分了(确实看了很多也不...

  • 冰解的破-hive

    Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析...