240 发简信
IP属地:黑龙江
  • Resize,w 360,h 240
    零基础搭建Hadoop大数据处理环境

    于Hadoop需要运行在Linux环境中,而且是分布式的,因此个人学习只能装虚拟机,本文都以VMware Workstation为准,安装Cen...

  • Resize,w 360,h 240
    16个非常实用的大数据工具

    Apache Hadoop是目前最成熟的大数据分析工具,但是市场上也不乏其他优秀的大数据工具。目前市场上有数千种工具能够帮你节约时间和成本,带你...

  • Resize,w 360,h 240
    基于Kafka与Spark的实时大数据质量监控平台

    微软的ASG (应用与服务集团)包含Bing,、Office,、Skype。每天产生多达5 PB以上数据,如何构建一个高扩展性的data aud...

  • Resize,w 360,h 240
    Apache Spark常见的三大误解

    最近几年关于Apache Spark框架的声音是越来越多,而且慢慢地成为大数据领域的主流系统。最近几年Apache Spark和Apache H...

  • Resize,w 360,h 240
    HBase原理——要弄懂的sequenceId

    HBase数据在写入的时候首先追加写入HLog,再写入Memstore,也就是说一份数据会以两种不同的形式存在于两个地方。 为什么需要seque...

  • 10道Hadoop面试真题及解题思路

    搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。 (一)海量日志数据,提取出某日访问百度次数最...

  • Resize,w 360,h 240
    如何使用HBase?大数据存储的两个实战场景

    现如今各种数据存储方案层出不穷,本文仅仅是结合两个实战场景就基于HBase的大数据存储做了简单的分析,并对HBase的原理做了简单的阐述。如何使...

  • Resize,w 360,h 240
    批处理ETL已死,Kafka才是数据处理的未来?

    在 QCon 旧金山会议上,Neha Narkhede 做了“ETL 已死,而实时流长存”的演讲,并讨论了企业级数据处理领域所面临的挑战。该演讲...

    0.1 2710 0 10
  • 如何避免HBase写入过快引起的各种问题

    首先我们简单回顾下整个写入流程 client api ==> RPC ==> server IPC ==> RPC queue ==> RPC ...

个人介绍
大数据零基础的和做大数据想进阶的加群:806025609 免费获取一份大数据学习视频和大数据学习体系进阶图。我们每周有六到七节视频更新。
这也是感谢大家对我的关注和支持。