Avatar notebook default
28篇文章 · 40324字 · 1人关注
  • Resize,w 360,h 240
    Hbase简介

    1.Hbase起源 HBase是一个开源的非关系型分布式数据库,它参考了谷歌的BigTable建模,实现的编程语言为Java。它是Apache软...

  • Resize,w 360,h 240
    Spark RDD运行原理详解

    弹性分布式数据集RDD表示一个分区数据元素的集合,可以在其上进行并行操作。它是Spark的主要数据抽象概念。它是Spark库中定义的一个抽象类。...

  • Resize,w 360,h 240
    大数据处理框架Spark简介

    Spark是一个基于内存的用于处理、分析大数据的集群计算框架。Spark最初由美国加州大学伯克利分校(UC Berkelely)的AMP(Alg...

  • Resize,w 360,h 240
    分布式文件系统HDFS

    1.HDFS简介 正如其名,HDFS(Hadoop Distribution File System)是一个分布式文件系统,它在商用服务器集群中...

  • Resize,w 360,h 240
    大数据Hadoop框架简介

    Hadoop发展简史 Hadoop最初是由Apache Lucene项目的创始人DougCutting开发的文本搜索库。Hadoop源自始于20...

  • Mybatis分页插件的使用流程

    如果你也在用Mybatis,建议尝试该分页插件,这一定是最方便使用的分页插件。该插件支持任何复杂的单表、多表分页。 1.引入PageHelper...

  • Mybatis动态SQL的使用方法

    Mybatis的强大特性之一便是它的动态SQL。在实际开发中,数据库的查询比较复杂,需要在不同的逻辑中执行不同的SQL语句。我们往往要根据各种不...

  • Resize,w 360,h 240
    Windows上的PyCharm 远程连接调试pyspark

    在实验室配置了一个Spark集群,传统的方法就是在Windows本地开发项目,完了后打包,然后上传到Linux服务器上,最后执行spark-su...

  • Apache Spark之文件读写

    除了对本地文件系统进行读写以外,Spark还支持很多常见的文件格式(文本文件、JSON)和文件系统(HDFS)和数据库(MySQL、Hive、H...

文集作者