240 发简信
IP属地:湖南
  • Tkinter模块找不到,解决方法

    import Tkinter模块在 python 3.x 和 python 2.x 之间的差别: 注意:首字母大写和小写的区别! 安装tk相关的...

  • 2.安装Apache Spark 2.1

    前言: cloudera自带的Spark版本较低,通过Apache Spark官网下载并安装Spark 2.1版本,分为单机和集群两种安装部署方...

  • Linux升级Python至3.4.5

    前言: Python版本比较低(2.6.6),为了使用新版 3.4.5,需要对旧版本进行升级,由于很多基本的命令、软件包都依赖旧版本,比如:yu...

  • 1.Spark前言

    比MapReduce更快速 MapReduce是基于磁盘IO的,无论过程还是结果都要写入磁盘,并且无法迭代。而Spark只是在第一次运行时需要磁...

  • 4.HDFS进阶:数据与元数据之间的关系

    查看NameNode.java源文件 The NameNode controls two critical tables: filename->...

  • 3.HDFS的数据与元数据

    查看HDFS配置文件 找到dfs.namenode.name.dir的位置 读取元数据文件 注意:返回值为0表示上一条指令执行成功 查看fsim...

  • Resize,w 360,h 240
    2.HDFS概述--体系结构

    体系结构 Linux分为:Kernel、System Call、Application&Shell三层Java虚拟机(JVM)运行在Applic...

  • 1.HDFS概述--一脉相承

    前言:简要概述FileSystem、DB、HDFS存取数据的设计思路,并理解其一脉相承的特点 FS的设计思路 最小IO:1kFS通过inode指...

  • cloudera集群搭建3:集群使用前配置

    1.创建当前用户的家目录,例如当前root用户 注意:hdfs是hadoop的超级用户,相当于Linux中的root用户 2.更改权限 3.查看...