240 发简信
IP属地:上海
  • Resize,w 360,h 240
    Kafka 重平衡 全流程解析

    前言 本文来自 极客时间 Kafka核心技术与实战这段时间有看 极客时间的这个课程,这里仅以分享的角度来做个笔记。那么本文将涉及到以下几个知识点...

  • Kafka 水位详解

    什么是水位 kafka中用水位来描述,一个分区中的可见数据的offset。大概你需要知道这几点: hw(水位)你可以理解成是一个全局(所有副本最...

  • Spark系列——关于 mapPartitions的误区

    前言 今天 Review 了一下同事的代码,发现其代码中有非常多的 mapPartitions,问其原因,他说性能比 map 更好。我说为什么性...

    1.4 5287 8 13 1
  • 推荐系统 —— LFM隐语义模型

    前言 本文是推荐系统系列的第三篇了,主要来讲一下 LFM 算法,与之前一样,注重原理方面,不会在算术上多做纠结,以方便快速理解该算法 什么是 L...

  • alias 自定义参数——实现一个删除备份的指令

    前言 这是一个简单的 shell 指令 alias 的简单使用有了它,你可以简化很多日常中常用的指令的输入 什么是 alias 顾名思义,就是别...

  • Scala 隐式转换简明教程

    前言 对于 Spark 开发者来说 Scala 终究是个绕不过去的坎,而 对于 Scala ,隐式转换终究也是一个绕不过去的坎。所以本文就以一种...

  • Redis 持久化方式——RDB

    RDB RDB是什么? Redis持久化数据的两种方式之一,另外一种是AOF。Redis会定期保存数据快照至一个rbd文件中,并在启动时自动加载...

  • Resize,w 360,h 240
    ROC曲线 和 AUC 直白详解

    ROC曲线 定义 在信号检测理论中,接收者操作特征曲线(receiver operating characteristic curve,或者叫R...

  • Resize,w 360,h 240
    Kafka 为什么快?

    前言 本文只想从作者本身的认识来谈谈 kafka 为什么会这么快?我们都知道 kafka 是基于磁盘的,但是他的存储和读取速度确是非常的快的。阅...

个人介绍
实力来自点点滴滴的积累,专注原创,分享大数据技术。