Avatar notebook default
13篇文章 · 47785字 · 2人关注
  • spark题05

    1.scala中private 与 private[this] 修饰符的区别? private[包名],private[this] 可以放在字段...

  • spark题06

    1.kafka收集数据的原理? 2.讲讲列式存储的 parquet文件底层格式? 3.dataset和dataframe? 4 scala中tr...

  • spark题07

    1、简答说一下hadoop的map-reduce编程模型 首先map task会从本地文件系统读取数据,转换成key-value形式的键值对集合...

  • spark题08

    1、Operation category READ is not supported in state standby是什么原因导致的?org....

  • Resize,w 360,h 240
    spark题09

    1.给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 方案1:可以估计每个文件...

  • 重点关注 ti

    17.reduce后输出的数据量有多大?(重点!!!) 并不是想知道确切的数据量有多大这个,而是想问你,MR的执行机制,开发完程序,有没有认真评...

  • Resize,w 360,h 240
    spark题04

    1.MR V1 有哪些不足? 1)可扩展性差(对于变化的应付能力) a) JobTracker内存中保存用户作业的信息 b) JobTracke...

  • Resize,w 360,h 240
    spark题03

    1.Spark使用parquet文件存储格式能带来哪些好处? 使用 parquet 主要是对 Spark SQL 查询进行优化,parquet使...

文集作者