IP属地:浙江
1 配置内存 操作场景 Flink是依赖内存计算,计算过程中内存不够对Flink的执行效率影响很大。可以通过监控GC(Garbage Colle...
HIVE 优化?【常考题】 如果union all的部分个数大于2,或者union部分数据量大,应拆分成多个insert into语句。 1.参...
任何内容RDD都可以保存到Elasticsearch,在实践中,这意味着RDD类型是Map(Scala或Java的)类型,JavaBeanSca...
Flink8种分区策略有哪几种? 源码解读: ShufflePartitioner: DataStream => DataStream Reba...
6本汉语书,3本英语书
df -hsda:第一个磁盘(sda1是第一个主分区,sda2第二个,sdb:第二个磁盘 查看机器所挂硬盘个数及分区情况 sudo fdisk ...
工作中常用的 hive 参数调优,整理如下。原则:• 最少数据• 最少字段• 最少Job数• 最少读取次数• 避免数据倾斜• 整体最优而不是局部...
Flink 实时计算在微博的应用https://zhuanlan.zhihu.com/p/375032985[https://zhuanlan....
flink 1.12.2hudi 0.9.0 一、组件下载 1.1、flink1.12.2编译包下载: https://mirrors.tuna...