13篇文章 · 47785字 · 2人关注
1.scala中private 与 private[this] 修饰符的区别? private[包名],private[this] 可以放在字段...
1.kafka收集数据的原理? 2.讲讲列式存储的 parquet文件底层格式? 3.dataset和dataframe? 4 scala中tr...
1、简答说一下hadoop的map-reduce编程模型 首先map task会从本地文件系统读取数据,转换成key-value形式的键值对集合...
1、Operation category READ is not supported in state standby是什么原因导致的?org....
1.给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 方案1:可以估计每个文件...
17.reduce后输出的数据量有多大?(重点!!!) 并不是想知道确切的数据量有多大这个,而是想问你,MR的执行机制,开发完程序,有没有认真评...
1.MR V1 有哪些不足? 1)可扩展性差(对于变化的应付能力) a) JobTracker内存中保存用户作业的信息 b) JobTracke...
1.Spark使用parquet文件存储格式能带来哪些好处? 使用 parquet 主要是对 Spark SQL 查询进行优化,parquet使...
文集作者