240 发简信
  • kafka搭建

    Kafka实践 提前准备: 安装Java 安装zookeeper 一、kafka集群安装 分别在h1、h2、h3三台机器上下载解压kafka安装包,然后修改配置文件 1.h1...

  • zookeeper实践

    Zookeeper实践 一、安装搭建: 在h1、h2、h3三台机器上安装搭建Zookeeper 在h1机器上执行以下操作: 将h2上的zookeeper的data目录下的my...

  • 120
    flume实践

    Flume实践 实例一: 单机,监控指定端口,输出到控制台 一、步骤: 1.编辑配置文件 2.启动flume 3.登录指定主机,指定端口,发送数据 4.查看控制台输出 二、过...

  • 模拟sparkstreaming流式实时系统

    参考书籍:《spark最佳实践》 实验步骤:1.Python程序生成访问日志2.通过脚本将日志自动上传至HDFS3.spark streaming程序监控HDFS目录,自动处...

  • 120
    古耿龙门一角——西硙村

    This is my hometown. It's name is xiwei village.I love it! I hope it gets better and be...

  • Python读取两个文件内容,按key进行全局排序

    test.py内容: file01文件内容: file02文件内容: 结果文件file03:

  • 120
    python词频统计实例

    项目概述 通过两个Python文件实现一个简单的词频统计。 本工程共有4个文件: file01:要统计的词频文件。 maptest.py:MapReduce的第一个阶段:ma...

  • 数据库笔记

    一、数据库相关的一些基础概念 数据库系统主要特点:数据结构化;数据共享性好,冗余度小;数据独立性好;数据有DBMS统一管理和控制,从而保证多个用户能并发、安全、可靠地访问,而...

  • 120
    HBase讲解

    1.HBase在Hadoop中的位置 HBase(Hadoop Database)是一个开源的、面向列(Column-Oriented)、适合存储海量非结构化数据或半结构化数...

  • 120
    我的家乡——西硙口村的15年

    文章目录 西硙口村简介 讲述西硙口村村民生活近15年的变化 从西硙口村自身角度出发,谈论如何富起来 一、西硙口村简介 地理位置 河津位于山西省西南部,运城市西北角,吕梁山南部...

  • 120
    kafka简介

    Apache kafka是一个分布式流平台。这到底是什么意思? 我们认为流平台具有三个关键功能: 它允许发布和订阅记录流。在这方面,它类似于消息队列或企业消息传递系统。 它允...

  • 120
    ZooKeeper简介

    原文链接 ZooKeeper:分布式应用的分布式协调服务 ZooKeeper是分布式应用的开源协调服务。它公开了一组简单的原语,分布式应用程序可以在实现更高级别的同步、配置维...

  • C++基础

    1.C++基本语法、注释、数据类型、变量作用域、常量 2.c++存储类 3.运算符 4.循环和判断 5.函数 6.数组 7.字符串 8.指针 9.引用 10.结构体

  • 120
    《MySQL必知必会》学习笔记

    本书所用的表: 第一章:了解SQL 数据库:保存有组织的数据的容器(通常是一个文件或一组文件)。 数据库软件:DBMS(数据库管理系统),如MySQL等。 表:某种特定类型数...

  • Hive简介

    1. Hive提供了一个被称为hive查询语言的的SQL方言,来查询存储在Hadoop集群中的数据。 Hive可以将大多数的查询转换为MapReduce任务,进而在介绍一个令...

  • Java笔试题总结

    1.下列哪一种叙述是正确的(D)A.abstract修饰符可修饰字段、方法和类B.抽象方法的body部分必须用一对大括号()C.声明抽象方法,大括号可有可无D.声明抽象方法不...

  • HDFS

    一、HDFS简介 Hadoop Distributed filesystem:Hadoop分布式文件系统 HDFS以流式数据访问模式来存储超大文件。一次写入、多次读取。能存储...

个人介绍
脚踏实地 仰望星空