240 发简信
IP属地:浙江
  • Flink性能调优(一)

    1 配置内存 操作场景 Flink是依赖内存计算,计算过程中内存不够对Flink的执行效率影响很大。可以通过监控GC(Garbage Colle...

  • HIVE优化(四)-union all

    HIVE 优化?【常考题】 如果union all的部分个数大于2,或者union部分数据量大,应拆分成多个insert into语句。 1.参...

  • spark将数据写入es

    任何内容RDD都可以保存到Elasticsearch,在实践中,这意味着RDD类型是Map(Scala或Java的)类型,JavaBeanSca...

  • Resize,w 360,h 240
    07. Flink8种分区策略及源码解读

    Flink8种分区策略有哪几种? 源码解读: ShufflePartitioner: DataStream => DataStream Reba...

  • flink书籍推荐

    6本汉语书,3本英语书

  • Resize,w 360,h 240
    df -h 和fdisk -l区别

    df -hsda:第一个磁盘(sda1是第一个主分区,sda2第二个,sdb:第二个磁盘 查看机器所挂硬盘个数及分区情况 sudo fdisk ...

  • Resize,w 360,h 240
    Hive调优参数篇

    工作中常用的 hive 参数调优,整理如下。原则:• 最少数据• 最少字段• 最少Job数• 最少读取次数• 避免数据倾斜• 整体最优而不是局部...

    6.0 3101 3 10
  • Flink 实时计算在微博的应用

    Flink 实时计算在微博的应用https://zhuanlan.zhihu.com/p/375032985[https://zhuanlan....

  • Resize,w 360,h 240
    flink集成hudi

    flink 1.12.2hudi 0.9.0 一、组件下载 1.1、flink1.12.2编译包下载: https://mirrors.tuna...

个人介绍
好在历史是公正的,
好在时间是公平的。