240 发简信
IP属地:海南
  • 基于Spark的分类模型

    之前介绍过Apache Spark的基本概念以及环境准备,本篇以分类算法为入口,主要熟悉下Spark的Python API,重点不在算法,而是A...

  • Resize,w 360,h 240
    ZooKeeper的内部数据模型和Leader选举算法

    之前的一篇文章有介绍ZooKeeper的使用场景,安装及简单的使用过程,本篇主要介绍下ZooKeeper的内部数据模型和Leader选举算法。 ...

  • Mybatis源码浅析(一)

    前言 最近项目中使用到了Mybatis持久层框架,由于从来没有深入的了解过基于Java语言实现的持久层框架,于是有点心血来潮,所以就有了这篇长文...

  • Spark介绍、环境搭建及运行

    Apache Spark 简介 Apache Spark 是什么 Apache Spark是一个分布式计算框架,旨在简化运行于计算机集群上的并行...

  • Resize,w 360,h 240
    浅析Git暂存区

    每一个使用Git进行管理的项目,在其根目录下都会存在一个名为 .git 的目录,其内容如下图,接下来主要介绍下目录中的HEAD、index、ob...

  • Resize,w 360,h 240
    用户画像产品-[毕加索]

    背景 在互联网逐渐步入大数据时代后,不可避免的给企业及消费者行为带来一系列改变与重塑。其中最大的变化莫过于,消费者的一切行为在企业面前似乎都将是...

  • Resize,w 360,h 240
    分布式架构了解篇

    无论你是不是一名合格的码农,你都应该对分布式架构有一定的了解。在了解分布式架构之前,先来了解下集中式架构。自20世纪60年代大型主机被发明出来之...

  • Resize,w 360,h 240
    Kafak源码环境搭建

    开始之前 Kafka源码环境依赖Gradle、Scala和Zookeeper,所以需要提前将这些依赖安装好,由于这三个依赖的安装相对比较简单,所...

  • Resize,w 360,h 240
    R包之wordcloud2

    词云 做过数据分析的应该对词云这个概念不会陌生,词云以云图的方式将词(一般指tag)的频率信息很好的呈现出来。下面是来自百度百科的定义。 “词云...

个人介绍
生活是段美好的旅程,好好享受