基于flink-1.8.1 本文转载自一文搞懂Flink内部的Exactly Once和At Least Once 如何理解flink中stat...
本文从概念和理论上进行整理学习 数据中台是什么 主流概念上讲 数据中台是指通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径...
暂时定义为数仓的质量管理,完全可以定义为数据中台的质量管理 数据质量的理解 数据质量的高低代表了该数据满足数据消费者期望的程度,这种程度基于他们...
Vector、ArrayList、LinkedList均为线型的数据结构; 底层实现方式 ArrayList内部用数组来实现; LinkedLi...
对于参数命令的记忆,需要固定在 数据倾斜产生的原因 数据倾斜的原因很大部分是join倾斜和聚合倾斜两大类 Hive倾斜之group by聚合倾斜...
数据倾斜分为两大类:聚合倾斜和join倾斜,针对不同的倾斜类型采用不同解决方案 数据倾斜解决方案上分为:缓解数据倾斜和彻底解决数据倾斜 1.数据...
数仓--Hive-面试之Hive与HBase的区别数仓--Hive-面试之Hive架构原理数仓--Hive-面试之Hive的数据模型及各模块的应...
需要进行对比学习,弄清楚是hive元数据还是数仓元数据,两者有很大的区别,存储位置也是不一样的 Hive元数据 元数据包括:表名、表所属的数据库...
Python3 pandas.MultiIndex 概述 层次化索引(hierarchical indexing)在一个轴上拥有多个(两个以上)...