240 发简信
IP属地:广东
  • 面试题3:数组中重复的数字

    题目一.找出数组中重复的数字 在一个长度为n的数组里所有数字都在0~n-1的范围内。数组中某些数字是重复的,但不知道有几个数字重复了,也不知道每...

  • 从源码角度分析MapReduce运作_一.准备阶段

    一.目录 本系列文章对Hadoop知识进行复盘。分为两个阶段,建立连接阶段,提交job阶段。 二.建立连接 客户端提交MR程序后,首先是运行jo...

  • kafka消费者分区分配策略

    有两种种策略,range strategy策略和roundRobin strategy策略,默认是range strategy策略。1.rang...

  • Hadoop调度器

    1.Hadoop调度器分为三类:FIFO、Capacity Scheduler(容量调度器)和Fair Scheduler(公平调度器)。Had...

  • spark join的几种形式

    https://www.2cto.com/net/201612/575696.html1.Broadcast Join在数据库的常见模型中(比如...

  • 面试题12:矩阵中的路径

    题目:请设计一个函数,用来判断在一个矩阵中是否存在一条包含某字符串所有字符的路径。路径可以从矩阵中的任意一格开始,每一步可以在矩阵中向左、右、上...

  • spark提交作业参数

    Spark提交参数说明和常见优化[https://blog.csdn.net/gamer_gyt/article/details/7913511...

  • 列举spark的算子,并简述功能

    transformation算子 1.map(func):返回一个新的RDD,该RDD由每个输入元素进过func函数转化后组成scala是没有m...

  • Hadoop优化

    1.数据输入小文件处理a.合并小文件:对小文件进行归档、自定义inputFormat将小文件存储成sequenceFile文件b.采用Combi...