视频:https://www.bilibili.com/video/av52167219
PS:建议先看课程视频1-2篇,再根据视频或文档部署,
如有问题,及时与@若泽数据J哥联系。
一.准备工作
1.离线部署主要分为三块:
a.MySQL离线部署
b.CM离线部署
c.Parcel文件离线源部署
2.规划:
节点 | MySQL部署组件 | Parcel文件离线源 | CM服务进程 | 大数据组件 |
---|---|---|---|---|
hadoop001 | MySQL | Parcel | Activity Monitor | NN RM DN NM |
hadoop002 | Alert Publisher Event Server | DN NM | ||
hadoop003 | Host Monitor Service Monitor | DN NM |
3.下载源:
- CM
cloudera-manager-centos7-cm5.16.1_x86_64.tar.gz - Parcel
CDH-5.16.1-1.cdh5.16.1.p0.3-el7.parcel
CDH-5.16.1-1.cdh5.16.1.p0.3-el7.parcel.sha1
manifest.json - JDK
https://www.oracle.com/technetwork/java/javase/downloads/java-archive-javase8-2177648.html
下载jdk-8u202-linux-x64.tar.gz - MySQL
https://dev.mysql.com/downloads/mysql/5.7.html#downloads
下载mysql-5.7.26-el7-x86_64.tar.gz - MySQL jdbc jar
mysql-connector-java-5.1.47.jar
下载完成后要重命名去掉版本号,
mv mysql-connector-java-5.1.47.jar mysql-connector-java.jar
准备好百度云,下载安装包:
链接:https://pan.baidu.com/s/10s-NaFLfztKuWImZTiBMjA 密码:viqp
二.集群节点初始化
1.阿里云上海区购买3台,按量付费虚拟机
CentOS7.2操作系统,2核8G最低配置
2.当前笔记本或台式机配置hosts文件
- MAC: /etc/hosts
- Window: C:\windows\system32\drivers\etc\hosts
公网地址:
1 | 1106.15.234.222 hadoop001 |
3.设置所有节点的hosts文件
私有地址、内网地址:
1 | 1echo "172.19.7.96 hadoop001">> /etc/hosts |
4.关闭所有节点的防火墙及清空规则
1 | 1systemctl stop firewalld |
5.关闭所有节点的selinux
1 | 1vi /etc/selinux/config |
6.设置所有节点的时区一致及时钟同步
6.1.时区
1 | 1[root@hadoop001 ~]# date |
查看命令帮助,学习至关重要,无需百度,太👎
1 | 1[root@hadoop001 ~]# timedatectl --help |
查看哪些时区
1 | 1[root@hadoop001 ~]# timedatectl list-timezones |
所有节点设置亚洲上海时区
1 | 1[root@hadoop001 ~]# timedatectl set-timezone Asia/Shanghai |
6.2.时间
所有节点安装ntp
1 | 1[root@hadoop001 ~]# yum install -y ntp |
选取hadoop001为ntp的主节点
1 | 1[root@hadoop001 ~]# vi /etc/ntp.conf |
time
1 | 1server 0.asia.pool.ntp.org |
当外部时间不可用时,可使用本地硬件时间
1 | 1server 127.127.1.0 iburst local clock |
允许哪些网段的机器来同步时间
1 | 1restrict 172.19.7.0 mask 255.255.255.0 nomodify notrap |
开启ntpd及查看状态
1 | 1[root@hadoop001 ~]# systemctl start ntpd |
验证
1 | 1[root@hadoop001 ~]# ntpq -p |
其他从节点停止禁用ntpd服务
1 | 1[root@hadoop002 ~]# systemctl stop ntpd |
每天凌晨同步hadoop001节点时间
1 | 1[root@hadoop002 ~]# crontab -e |
7.部署集群的JDK
1 | 1mkdir /usr/java |
8.hadoop001节点离线部署MySQL5.7(假如觉得困难哟,就自行百度RPM部署,因为该部署文档是我司生产文档)
- 文档链接:https://github.com/Hackeruncle/MySQL
- 视频链接:https://pan.baidu.com/s/1jdM8WeIg8syU0evL1-tDOQ 密码:whic
9.创建CDH的元数据库和用户、amon服务的数据库及用户
1 | 1create database cmf DEFAULT CHARACTER SET utf8; |
10.hadoop001节点部署mysql jdbc jar
1 | 1mkdir -p /usr/share/java/ |
三.CDH部署
1.离线部署cm server及agent
1 | 11.1.所有节点创建目录及解压 |
2.hadoop001节点部署离线parcel源
1 | 12.1.部署离线parcel源 |
3.所有节点创建软件安装目录、用户及用户组权限
1 | 1mkdir -p /opt/cloudera/parcels |
4.hadoop001节点启动Server
1 | 14.1.启动server |
5.所有节点启动Agent
1 | 1/opt/cloudera-manager/cm-5.16.1/etc/init.d/cloudera-scm-agent start |
6.接下来,全部Web界面操作
http://hadoop001:7180/
账号密码:admin/admin
7.欢迎使用Cloudera Manager–最终用户许可条款与条件。勾选
8.欢迎使用Cloudera Manager–您想要部署哪个版本?选择Cloudera Express免费版本
9.感谢您选择Cloudera Manager和CDH
10.为CDH集群安装指导主机。选择[当前管理的主机],全部勾选
11.选择存储库
12.集群安装–正在安装选定Parcel假如
本地parcel离线源配置正确,则”下载”阶段瞬间完成,其余阶段视节点数与内部网络情况决定。
13.检查主机正确性
1 | 113.1.建议将/proc/sys/vm/swappiness设置为最大值10。 |
14.自定义服务,选择部署Zookeeper、HDFS、Yarn服务
15.自定义角色分配
16.数据库设置
17.审改设置,默认即可
18.首次运行
19.恭喜您!
20.主页
CDH全套课程目录,如有buy,加微信(ruoze_star)
1 | 1 0.青云环境介绍和使用 |