前言 本文来自 极客时间 Kafka核心技术与实战这段时间有看 极客时间的这个课程,这里仅以分享的角度来做个笔记。那么本文将涉及到以下几个知识点...
什么是水位 kafka中用水位来描述,一个分区中的可见数据的offset。大概你需要知道这几点: hw(水位)你可以理解成是一个全局(所有副本最...
前言 今天 Review 了一下同事的代码,发现其代码中有非常多的 mapPartitions,问其原因,他说性能比 map 更好。我说为什么性...
前言 本文是推荐系统系列的第三篇了,主要来讲一下 LFM 算法,与之前一样,注重原理方面,不会在算术上多做纠结,以方便快速理解该算法 什么是 L...
前言 这是一个简单的 shell 指令 alias 的简单使用有了它,你可以简化很多日常中常用的指令的输入 什么是 alias 顾名思义,就是别...
前言 对于 Spark 开发者来说 Scala 终究是个绕不过去的坎,而 对于 Scala ,隐式转换终究也是一个绕不过去的坎。所以本文就以一种...
RDB RDB是什么? Redis持久化数据的两种方式之一,另外一种是AOF。Redis会定期保存数据快照至一个rbd文件中,并在启动时自动加载...
ROC曲线 定义 在信号检测理论中,接收者操作特征曲线(receiver operating characteristic curve,或者叫R...
前言 本文只想从作者本身的认识来谈谈 kafka 为什么会这么快?我们都知道 kafka 是基于磁盘的,但是他的存储和读取速度确是非常的快的。阅...