Mac 系统安装Hadoop 2.7.3

1.查看是否安装了Java
以后会运行jar包,肯定需要java的运行环境。查看java版本,在terminal输入:java -version

2.下载hadoop
地址:http://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz
本次下载中间版本,hadoop-2.7.3版本.用第二个镜像下载速度较快

3.配置mac os 自身环境
这个主要是配置ssh环境。先在terminal里面输入ssh localhost
方法一:当前用户没有权限。这个多半是系统为安全考虑,默认设置的。
更改设置如下:进入系统偏好设置 --> 共享 --> 勾选远程登录,并设置允许访问:所有用户。
再次输入“ssh localhost",再输入密码并确认之后,可以看到ssh成功。


方法二:
$ ssh-keygen-t dsa-P''-f~/.ssh/id_dsa
$ cat/.ssh/id_dsa.pub>>/.ssh/authorized_keys
无论方法一,还是方法二这里面还有一个麻烦,就是每次都会要求输入用户密码。//ToDo(待补充解决方案)

4.设置环境变量
①在terminal输入:touch ~/.bash_profile
打开文件:vim ~/.bash_profile
export HADOOP_HOME=/Users/hadoop/hadoop-1.2.1(根据你自己的目录进行设定)
export PATH=$PATH:$HADOOP_HOME/bin
②保存文件
③设置变量立即生效命令:source ~/.bash_profile
④查看设置变量设置是否成功:hadoop version


5.配置Hadoop目录下的文件
路径下:hadoop-2.7.3/etc/hadoop
① Hadoop hadoop-env.sh 配置
JAVA_HOME={your java home directory}
HADOOP_PREFIX={your hadoop distribution directory}
说明:查看JAVA_HOME 命令:/usr/libexec/java_home# set to the root of your Hadoop
说明:HADOOP_PREFIX 你本地hadoop路径 xxxx/hadoop-2.7.3/


② core-site.xml文件配置
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>

③ hdfs-site.xml
<property>
<name>dfs.replication</name>
<value>1</value>
</property>

④ mapred-site.xml (此文件默认有mapred-site.xml.template,拷贝使用)
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

⑤ yarn-site.xml
<property>
<name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value>
</property>

⑥ 安装HDFS
xxxxx(你机器hadoop的目录)/hadoop-2.7.3/bin/hadoop namenode -format


image5.jpg

..........中间省略.....


image6.png

HDFS 安装成功

⑦ 启动hadoop
xxxx/hadoop-2.7.3
1)启动NameNode和DataNode的守护进程
(中间提示输入password ,需要输入mac开机密码)
$ sbin/start-dfs.sh
2)启动ResourceManager和NodeManager的守护进程。
(中间提示输入password ,需要输入mac开机密码)
$ sbin/start-yarn.sh
3)访问localhost:50070和localhost:8088测试是否正常


image7.png

image8.png

6 运行Hadoop样例程序
/hadoop-2.7.3(在此目录下运行以下命令)
①创建hdfs目录:
$ bin/hdfs dfs -mkdir/user
$ bin/hdfs dfs -mkdir/user/{username}
说明:username 自己设置 (#make sure you add correct username here)

②拷贝一些文件到input目录:
$ bin/hdfs dfs-put etc/hadoop input

③运行样例:
$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jargrep input output'dfs[a-z.]+'

hadoop-mapreduce-examples-2.7.3.jar此文件需要版本需要自己查看 ,路径为:xxxx/hadoop-2.7.3/share/hadoop/mapreduce


image9.png

..........中间省略.....


image10.png

④在localhost:50070中的Utilities标签下找到/user/{username}目录,可以看到样例运行成功。


image11.png

image12.png

7 停止Hadoop
/hadoop-2.7.3(在此目录下运行以下命令)
$ sbin/stop-yarn.sh
$ sbin/stop-dfs.sh

本文参考:http://zhongyaonan.com/hadoop-tutorial/setting-up-hadoop-2-6-on-mac-osx-yosemite.html

推荐阅读更多精彩内容