240 发简信
  • 120
    冰解的破-MapReduce

    MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。 概念"Map(映射)"和"Reduce(归约)",是它们的主要思想...

    1.1 69 0 3
  • 《术语字典》

    术语又称技术名词、科学术语、科技术语或技术术语,是在特定专业领域中一般概念的词语指称,一个术语表示一个概念。研究术语的学科有术语学。由于文化差异...

  • 120
    HotSpot虚拟机在java 1.8中的新实现

    Java HotSpot 虚拟机是 Java SE 平台的一个核心组件。它实现 Java 虚拟机规范,并作为 Java 运行时环境中的一个共享库...

  • 120
    JVM 内存结构

    JVM(Java Virtual Machine Java 虚拟机)是一种用于计算设备的规范,基于这套规范,许多团队开发了多种不同的虚拟机实现,...

  • ETL 工作流程

    ETL是英文Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、...

    1.1 8319 1 20
  • 120
    谈谈数据脱敏

    大数据平台通过将所有数据整合起来,充分分析与挖掘数据的内在价值,为业务部门提供数据平台,数据产品与数据服务。大数据平台接入的数据中可能包括很多用...

  • 120
    冰解的破-Scrapy

    Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬...

  • 120
    冰解的破-spark

    Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分...

    1.3 1346 0 20
  • 冰解的破-hive

    Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析...