一 前言 这是之前写的一篇文章,现在整理一下,重新发出来。由于Ambari安装在ARM机器上问题比较多。主要问题如下: ambari依赖的nod...
一 前言 阅读本文前需要掌握的知识: Linux基本原理和命令 Hadoop生态系统(包括HDFS,Spark的原理和安装命令) 由于Hadoo...
意译一篇《scala面试问题》的博客,原文地址:http://pedrorijo.com/blog/scala-interview-questi...
前言 我们通过业务系统将爬虫的数据写入了HBase,这篇文章说说HBase的表结构,及在HBase上利用Phoenix进行SQL操作。 HBas...
前言 由于我们用爬虫框架采集了一些非结构化的数据,现在要存入HBase数据库,所以在原来的Spark集群上集成HBase数据库。Spark集群的...
最近半个月开始研究Spark的机器学习算法,由于工作原因,其实现在还没有真正开始机器学习算法的研究,只是做了前期大量的准备,现在把早年学习的,正...
前言 本文在之前搭建的集群上,运行一个地理空间分析的示例,示例来自于《Spark高级数据分析》第八章。Github项目地址:https://gi...
前言 前面的android项目刚完,项目总结文章还未写完,公司需要研究大数据处理应用平台,任务下达到我们部门了,鉴于部门物理机只有一台,而虚拟机...
最原始出处:http://blog.csdn.net/myan/article/details/647511 (CSDN孟岩的博客) 本文转自:...
文集作者