五、Scala 和Spark 安装 Scala的安装比较简单,下载安装包,解压,然后配置环境变量即可使用。 1. Scala 安装 下载Scal...
实体关系抽取介绍 实体关系抽(RE, Relation Extraction)取任务是信息抽取中重要的一个子任务,同时也是知识图谱构建过程中必不...
1. 引言 所谓文本表示既是通过某种形式将文本字符串表示成计算机所能处理的数值向量。那么为什么要进行文本表示,根本原因是计算机不能直接对文本字符...
二、 virtual box 虚拟机配置静态IP 和上网 本篇是继上篇之后的第二篇,在这一节中将介绍虚拟机静态IP配置及为了搭建Spark集群的...
1. 序列标注和分类问题对比 我们知道序列标注问题有时候也被当做一个分类问题去对待,那么为什么传统分类算法较少用于序列标注的任务比如NER。核...
1. 系统环境 win7 64位 T450 已有python2.7, 直接下载的py.exe进行安装的,非Anaconda2安装。 python...
1、Naive Bayes classification 朴素贝叶斯分类器在文本分类中使用很广泛,因为他简单、高效,在大量的样本集上具有较好的分...
四、Hadoop 集群创建 根据前几节的设置,我们已经对一台机器完成了从网络到hadoop等一些列的配置,为便于测试hadoop 集群,本节将介...
1.简介 该项目通过利用NLP相关技术,对query中的无用词进行识别并剔除,以提高搜索质量。 To be continued!