CDH集群安装

http://www.jianshu.com/p/57179e03795f

http://blog.csdn.net/jdplus/article/details/45920733

下载CDH

下载CM

http://archive.cloudera.com/cm5/

->cm->5->选择自己要下载的版本

下载parcels

http://archive.cloudera.com/cdh5/

->parcels->选择版本->下载 *.parcel + *.parcel.shal1 + mainfest.json

安装jdk

配置环境变量

http://www.linuxidc.com/Linux/2016-09/134941.htm

http://www.cnblogs.com/samcn/archive/2011/03/16/1986248.html

CDH 安装

1.安装操作系统

2.编辑用户名

vi /etc/sysconfig/network

编辑 hosts

vi /etc/hosts

172.16.1.140 cdh0

172.16.1.141 cdh1

172.16.1.142 cdh2

3.配置网络

vi /etc/sysconfig/network-scripts/ifcfg-eth0

DEVICE=eth0

HWADDR=00:0C:29:A5:F0:97

TYPE=Ethernet

UUID=bba6e950-82c4-4874-aca2-af94dc501018

ONBOOT=yes

NM_CONTROLLED=yes

BOOTPROTO=static

IPADDR=172.16.1.142

NETMASK=255.255.0.0

GATEWAY=172.16.0.1

DNS1=114.114.114.114

DNS2=8.8.8.8

4.关闭 SELinux

vi /etc/sysconfig/selinux

SELIINUX=disabled

5.关闭防火墙

chkconfig iptables off 重启生效 centos7 systemctl disable firewalld.service

6.配置SSH免密登录

(注意:SSH免密登录是主从、从从任意两台主机间互相都是可以免密登录的,这里使用一种简单策略,将所有主机密钥添加到master,然后将master的key拷贝到所有主机,这样所有的主机都有集群所有的登录密钥【免密登录机制:如果我持有谁的公钥,我就允许谁免密登录进入我的系统】)

1)所有的主机(包括主从)都生成密钥

ssh-keygen -t rsa  回车三次生成密钥对(ls -a ./.ssh 可以看到生成后的内容)

2)所有主机的公钥拷贝到master

scp ./.ssh/id_rsa.pub root@172.16.1.141:/root/id_rsa.pub.s141    (其它主机类同)

3)所有的公钥追加到同一个自动认证文件内

cat ./id_rsa.pub.s142 >> ./.ssh/authorized_keys  (其它类同)

4)将最终含有所有主机公钥的自动认证文件authorized_keys复制到其它所有的主机上

scp ./.ssh/authorized_keys root@172.16.1.141:/root/.ssh/authorized_keys (其它类同)

7.配置NTP(时间同步服务)

1)yum install ntp;配置开机启动:chkconfig ntpd on;检查是否设置成功:chkconfig --list ntpd 其中2-5为on状态就代表成功;(其它主机类同)

ntpdate -u [时间服务器IP或域名地址(如0.cn.pool.ntp.org)] 看一下是否能校时成功

启动 ntp服务

systemctl start ntpd

2)编辑配置 vi /etc/ntp.conf

# 中国这边最活跃的时间服务器 : http://www.pool.ntp.org/zone/cn

# prefer 指的意思是以该ntp服务器为主,见:http://blog.sina.com.cn/s/blog_6243051e0100q8ee.html

master 配置增加 server 0.cn.pool.ntp.org prefer   

#增加NTP自身同步,不可用时用local时间提供给ntp客户端 见:http://weigang-gao.iteye.com/blog/2266919

server 127.127.1.0

fudge 127.127.1.0 stratum 8

ntp客户端(从机 slave )与master 同步 ntp.conf 只需直接增加  server cdh0[master]

立马同步时间可使用 ntpdate -u 0.cn.pool.ntp.org

8.安装JDK,配置Java环境变量

1)卸载自带的OpenJdk,使用rpm -qa | grep java查询java相关的包,使用rpm -e --nodeps 包名卸载之

2)mkdir /usr/java

tar -zxvf jdk-8u131-linux-x64.tar.gz

vi /etc/profile

export JAVA_HOME=/usr/java/jdk1.8.0_131

export PATH=$PATH:$JAVA_HOME/bin

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

source /etc/profile 重启后依然有效,但当前不立即重启需要立即生效,所以使用source命令

(其它主机类同)

9.安装MySQL(仅master)

1)yum install mysql-server (centos7 [yum install mysql-community-server])

2)chkconfig mysqld on  设置开机启动

3)service mysqld start  启动mysql服务

4)mysqladmin -u root password '123456'  设置管理员账户密码

5)mysql -uroot -p123456    进入mysql命令行,创建相应数据库(按实际需要安装创建数据库)

create database repm DEFAULT CHARSET utf8 COLLATE utf8_general_ci;

create database hive DEFAULT CHARSET utf8 COLLATE utf8_general_ci;

create database oozie DEFAULT CHARSET utf8 COLLATE utf8_general_ci;

create database hue DEFAULT CHARSET utf8 COLLATE utf8_general_ci;

6)#授权root用户在主节点拥有所有数据库的访问权限

grant all privileges on *.* to 'root'@'cdhmaster' identified by '123456' with grant option;flush privileges;

10.安装CDH

添加scm用户

useradd --system --home=/opt/cm-5.11.0/run/cloudera-scm-server/ --no-create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm

(所有节点都需要)

1)上传cloudera-manager*.tar.gz 到/opt,tar -zxvf解压,将mysql-connector-java*.jar拷贝到opt/cm-*/share/cmf/lib/

2)为cm配置数据库

/opt/cm-5.11.0/share/cmf/schema/scm_prepare_database.sh mysql cm -hlocalhost -uroot -p123456 --scm-host localhost scm scm scm

vi /opt/cm-5.11.0/etc/cloudera-scm-agent/config.ini [server_host改为主节点名]

scp -r /opt/cm-5.11.0 root@cdh1:/opt/    【其它节点类同】

3)将*parcel、*parcel.sha1、mainfest.json拷贝到主节点的/opt/cloudera/parcel-repo  *parcel.sha1重命名为*parcel.sha

4)启动

/opt/cm-5.11.0/etc/init.d/cloudera-scm-server start  #only 主机 master

/opt/cm-5.11.0/etc/init.d/cloudera-scm-agent start  #所有主机 slave

5)登录webCM管理安装,逐一安装组件(以便排查具体的错误,幸好这样离线安装几乎不会有什么意外的错误)

组件安装顺序 zookeeper、hdfs、yarn(include mapreduce2)、hive、ooize、hue(这个顺序看停止集群服务的关停顺序时可以侧面反映出),然后安装 impala,hbase,spark(spark安装直接选择 spark [on yarn]),不要选择什么 spark singlealone 安装 hive和ooize时,

记得把 MySQL mysql-connector-java*.jar拷贝到/opt/cloudera/parcels/CDH-5.11.0-1.cdh5.11.0.p0.34/lib/hive/lib 和 /var/lib/oozie

参考推荐:http://www.cnblogs.com/codedevelop/p/6762555.html

安装错误排除:

一、常规排查法:

1.sysout,syseer,查看完整错误信息->2.找到错误处根据提示判断出错是权限不够还是文件缺失或信息不一致等准确定位,可以大致锁定错误范围,看是否有

另外的输入日志如 /var/log/X ,如果没有则根据判断的出错范围方向google

二、重复安装导致的问题

特别是重复安装导致的问题,由于删除不干净,或用户名遗留的问题,需要定位出部位然后手工修改删除

三、实在不行,可能原步骤错误导致乱样,重新安装,还是不行,只有换版本

安装的几个地方遇到的问题集锦:

旧用户名的问题,/var/log/X 和/var/lib/X都有原来遗留的文件,导致新安装的时候名称不对或权限不够

http://blog.sina.com.cn/s/blog_7ea3d46f0101ljlz.html

hdfs的目录命名实际是和Linux的一致,/dfs/

旧版本安装CDH 5.3.3或是不同于tar.gz解压安装的方式,安装hive时mysql的jdbc包需要在/usr/share/java/mysql-connector-java.jar[jar重命名]

安装迂回策略:

1.当上传权限不够时,如,电信WiFi集群里,只有WiFi账户可以上传,但CDH实际操作是需要root权限,所以可以采用迂回策略,先把jar等上传到主机,然后用

mv 命令移动到指定地点,然后用chown修改所属用户和所属用户组,chmod修改用户权限;

2、yum工具安装软件包

当我们的集群内网无法上外网时,我们需要安装一下软件如ntp,但是这些安装包邮很多依赖,为保证我们一次性有保证的找到所有包安装,我们可以在其他可以上网的

机子上修改yum使用下载缓存,缓存安装包到目录,yum安装后将包拷贝到不能上网的集群,设置yum安装使用本地目录,这样就可以离线yum安装了,同时可以使用httpd

配置,使多个机子都到同一主机目录获取安装包安装;

centos 设置时间,分两次设置,先设置年月日,然后设置时分秒

date -s 20170817

date -s 10:27:12

/opt/cm-5.12.2/etc/init.d/cloudera-scm-server: line 109: pstree: command not found

yum install psmisc

#yum -y install perl perl-devel

rm -rf /opt/cm-5.12.2/lib/cloudera-scm-agent/*

cdh 安装时提示 ERROR  Failure due to stall on seeded torrent.

一个是要关闭 ipv6 ,一个是要必须先启动cm Server完成(能看到web管理页面),后再启动agent

=====================================================

rpm -qa | grep java

rpm -e --nodeps 包名

oracle 下载jdk rpm

rpm -ivh 包名

systemctl stop firewalld.service

systemctl disable firewalld.service

vi /etc/selinux/config

将SELINUX=enforcing改为SELINUX=disabled

修改主机名

hostnamectl set-hostname cdh0

http://archive.cloudera.com/cm5/cm/5/cloudera-manager-centos7-cm5.13.1_x86_64.tar.gz

创建目录

/opt/cloudera/parcel-repo

/opt/cm-5.13.1/etc/init.d/cloudera-scm-server start

/opt/cm-5.13.1/etc/init.d/cloudera-scm-agent start

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,015评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,262评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,727评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,986评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,363评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,610评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,871评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,582评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,297评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,551评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,053评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,385评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,035评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,079评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,841评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,648评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,550评论 2 270

推荐阅读更多精彩内容