Avatar notebook default
8篇文章 · 5591字 · 1人关注
  • Resize,w 360,h 240
    使用mapreduce来分析网站的log日志

    所有网站的服务器上都会保留访问的log日志。这些log日志记录的其他机器访问服务器的ip,时间,http协议,状态码等信息。 比如这样: 大型网...

  • hive 快速入门

    1. 简介 使用mapreduce 这样的计算框架,可以写出像wordcount这样的程序,虽然已经极大的化简了分布式编程的门槛,但是使用map...

  • Resize,w 360,h 240
    一个利用mapreduce思想单词计数的实例

    这里写得是,如果利用mapreduce分布式的计算框架来写一个单词计数的demo。比如说,给出一个文件,然后,输出是统计文件里面所有的单词出现的...

  • Resize,w 360,h 240
    一个简明的Mapreduce 原理分析

    1. mapreduce 简介 mapreduce源自google的一篇文章,将海量数据处理的过程拆分为map和reduce。mapreduce...

  • Resize,w 360,h 240
    hadoop使用Java API 访问hdfs的数据

    使用hadoop dfs的api 来访问访问数据 。 看来一些资料和书,其实代码很简单,就是必须把需要的包,都带上就可以了。另外,要确保hado...

  • Resize,w 360,h 240
    HDFS的理解

    1. hadoop 2.0 以上的版本都是 的默认的快大小是 128 MB 2. 存在dfs上面的文件其实都存放在了linux的文件系统只是,...

  • Resize,w 360,h 240
    HDFS分布式文件系统原理及shell的使用

    1. HDFS简介 Hadoop分布式文件系统(HDFS)被设计成适合运行普通pc上的分布式文件系统。总的设计思想:分而治之——将大文件、大批量...

  • Resize,w 360,h 240
    Hadoop入门—基本原理简介

    现在打算学习一些关于分布式,大数据,和hadoop的知识,创建一个笔记本,作为入门的笔记。 1. 安装hadoop http://www.jia...

文集作者