240 发简信
IP属地:西藏
  • Resize,w 360,h 240
    Flink--Checkpoint机制原理

    基于flink-1.8.1 本文转载自一文搞懂Flink内部的Exactly Once和At Least Once 如何理解flink中stat...

  • Resize,w 360,h 240
    数仓--Theory--对数据中台的理解

    本文从概念和理论上进行整理学习 数据中台是什么 主流概念上讲 数据中台是指通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径...

    5.1 3295 0 31
  • Resize,w 360,h 240
    数仓--Theory--数仓数据质量监控

    暂时定义为数仓的质量管理,完全可以定义为数据中台的质量管理 数据质量的理解 数据质量的高低代表了该数据满足数据消费者期望的程度,这种程度基于他们...

    4.0 5962 4 30
  • Java-面试--对比Vector、ArrayList、LinkedList有何区别

    Vector、ArrayList、LinkedList均为线型的数据结构; 底层实现方式 ArrayList内部用数组来实现; LinkedLi...

    9.3 896 0 24
  • 数仓--Hive-面试之Hive数据倾斜的原因及主要解决方法

    对于参数命令的记忆,需要固定在 数据倾斜产生的原因 数据倾斜的原因很大部分是join倾斜和聚合倾斜两大类 Hive倾斜之group by聚合倾斜...

    3.9 9781 0 22
  • Resize,w 360,h 240
    Spark--数据倾斜解决方案

    数据倾斜分为两大类:聚合倾斜和join倾斜,针对不同的倾斜类型采用不同解决方案 数据倾斜解决方案上分为:缓解数据倾斜和彻底解决数据倾斜 1.数据...

    1.8 1453 0 20
  • 数仓--Hive--面试题准备

    数仓--Hive-面试之Hive与HBase的区别数仓--Hive-面试之Hive架构原理数仓--Hive-面试之Hive的数据模型及各模块的应...

  • 数仓--Theory--数仓元数据及管理

    需要进行对比学习,弄清楚是hive元数据还是数仓元数据,两者有很大的区别,存储位置也是不一样的 Hive元数据 元数据包括:表名、表所属的数据库...

    1.9 5934 1 16
  • Python--MultiIndex多层次索引学习

    Python3 pandas.MultiIndex 概述 层次化索引(hierarchical indexing)在一个轴上拥有多个(两个以上)...

个人介绍
李小李可不能落后呀