定义一个简单的类 getter与setter 定义不带private的var field,此时scala生成的面向JVM的类时,会定义为priv...
问题引入 最近经常碰到这样的问题,每天每个城市播放最多的10首歌,某月每支股票连续下跌/上涨的最大天数,用户连续活跃的最大天数,初步看起来都和分...
用了一段时间的PyCharm,内存占用有点大,略卡,尝试了一下Eclipse+PyDev,这篇文章是在使用过程中个性化配置的记录。 PyDev的...
应用背景 有时想看看大数据平台上Hive表的结构和数据字典,或者对数据进行简单查询、核验,可以装一个SQL开发工具访问CDH集群中的Hive。 ...
Hive目录及配置文件 当cm界面里执行部署客户端配置时,如上两个conf目录都会覆盖。 JDBC方式访问Hive 基于HiveServer2服...
TaskScheduler的初始化机制 TaskScheduler,如何注册Application,executor如何反向注册? create...
问题引入 数据生产者的分组策略? 如何保证数据的完全生产? partition数量和broker数量关系? 每个partition的数据如何保存...
macOS搭建Python的cx_Oracle开发环境的过程总结。 环境与版本, OS: macOS High Sierra 10.13.6 O...
CDH Hadoop系列目录: Hadoop实战(3)_虚拟机搭建CDH的全分布模式 Hadoop实战(4)_Hadoop的集群管理和资源分配 ...