240 发简信
IP属地:山西
  • 120
    基于文本情感分析技术的数据分析应用

    引语:在不同的情境下,词语会被被赋予不同的情感色彩,通过不同的情感色彩我们可以得到一些信息。而这些信息可以帮助我们更好的工作。 1. 情感分析介绍及作用 情感分析是自然语言处...

  • 120
    【容错篇】Spark Streaming的还原药水——Checkpoint

    一个 Streaming Application 往往需要7*24不间断的跑,所以需要有抵御意外的能力(比如机器或者系统挂掉,JVM crash等)。为了让这成为可能,Spa...

  • FileStatus类介绍

    原文链接 FileStatus对象封装了文件系统中文件和目录的元数据,包括文件的长度、块大小、备份数、修改时间、所有者以及权限等信息。 FileStatus对象一般由File...

  • 120
    Hadoop InputFormat介绍

    Hadoop InputFormat介绍 1 概述 我们在编写MapReduce程序的时候,在设置输入格式的时候,会调用如下代码: 通过上面的代码来保证输入的文件是按照我们想...

  • 120
    Kafka背景及架构介绍

    Kafka背景及架构介绍 Kafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统...

  • HBase扫描操作Scan

    HBase扫描操作Scan 1 介绍 扫描操作的使用和get()方法类似。同样,和其他函数类似,这里也提供了Scan类。但是由于扫描工作方式类似于迭代器,所以用户无需调用sa...

  • HBase CURD之Delete

    HBase CURD之Delete HTable提供了删除方法,同时与之前的方法一样有一个相应的类为Delete。 1 单行删除 delete()方法有许多变体其中一个只需一...