240 发简信
IP属地:广西
  • DFS(深度优先搜索)和BFS(广度优先搜索)

    深度优先搜索算法(Depth-First-Search)深度优先搜索算法(Depth-First-Search),是搜索算法的一种。它沿着树的深...

  • Resize,w 360,h 240
    CDH支持Spark-sql

    之前用CDH5.2进行集群的搭建,现需要将CDH支持spark-sql,具体搭建请见CDH离线安装 一:准备环境 jdk1.7.0_79scal...

  • Resize,w 360,h 240
    Storm的消息保证机制

    Storm提供了三种不同层次的消息保证机制,分别是At Most Once,At Least Once,Exactly Once.消息保证机制依...

  • Resize,w 360,h 240
    Storm介绍之概念

    什么是实时流计算? 主要的处理模式可以分为:流处理,批处理 流处理是直接处理,有时也分为在线,离线,近线(straight-through ...

  • 线性查找法(BFPRT)

    BFPRT算法解决的问题十分经典,即从某n个元素的序列中选出第k大(第k小)的元素,通过巧妙的分 析,BFPRT可以保证在最坏情况下仍为线性时间...

  • Hive Join详解

    Join原理 Hive执行引擎会将HQL“翻译”成为MapReduce任务,如果多张表使用同一列做Join,将被“翻译”成一个MapReduce...

  • Resize,w 360,h 240
    Storm介绍之安装部署及API

    安装:1.下载并解压缩Zookeeper 2.修改zookeeper的配置文件 3.下载并压缩storm 4.修改storm配置文件 5.启动z...

  • Mysql存储引擎

    存储引擎的介绍### 关系型数据库表是用来存储和组织信息的数据结构,可以将表理解为由行和列组成的表格。由于表的类型不同,我们在实际开发过程中,就...

  • Resize,w 360,h 240
    HDFS详解

    认识HDFS HDFS的特点: 高容错性高吞吐量故障的检测和自动快速恢复流式的数据访问大数据集一次写入,多次读写 HDFS不适用的场景 不支持大...