240 发简信
IP属地:北京
  • Resize,w 360,h 240
    2019-09-20

    CPU架构分类 从CPU发明到现在,有非常多种架构,从我们熟悉的X86,ARM,到不太熟悉的MIPS,IA64等 X86架构来由 IBM 开始做...

  • HBase的部署

    HBase的部署方式包括: HBase的安装 本文的HBase安装是在Hadoop已经安装好的基础上实现的,所以之前要导出JAVA_HOME、H...

  • kafka基础概述

    概述 官方地址http://kafka.apache.org/快速入门教程:http://kafka.apache.org/quickstart...

  • Hive基本使用

    Hive有三种复杂数据类型ARRAY、MAP 和 STRUCT。ARRAY和MAP与Java中的Array和Map类似,而STRUCT与C语言中...

  • DataFrame常用API操作

    以列的(列名,列的类型。列值)的形式构成的分布式数据集,按照列赋予不同名称,约等于关系数据库的数据表 A DataFrame is a Data...

  • Hadoop序列化

    序列化 把内存中对象转换成字节序列(或其他数据传输协议)以便于存储到磁盘(持久化)和网络传输 反序列化 接收到的字节序列或者其他传输协议或者是磁...

  • Spark MLlib

    概述 机器学习是用数据或以往的经验,并以此来优化程序的性能指标。机器学习本质思想:使用现有的数据,训练出一个模型,然后在用这个模型去拟合其他的数...

  • Resize,w 360,h 240
    Hadoop伪分布式配置

    环境变量配置 环境变量生效 HDFS 测试Hadoop自带的wordcount 修改hadoop-env.sh配置文件。echo $JAVA_H...

  • RDD和DataFrame转换

    利用反射机制推断RDD 在利用反射机制推断RDD模式时,需要首先定义一个case class,因为,只有case class才能被Spark隐式...