type
status
date
slug
summary
tags
category
icon
password
AI 摘要
😀
这里写文章的前言: 本文章使用阿里云服务器安装Hadoop基础教程
对于学生来说,阿里云的高校计划可以领取300元的优惠卷是对于我们学习hadoop有很大帮助 阿里云高校计划链接入口
推荐一个开发工具,主要对新手不是很熟悉使用vim的用户 Xterminal
软件
版本
下载链接
Hadoop
3.3.4
Flume
1.10.1
Zookeeper
3.8.3
JDK
1.8
Kafka
2.12
MySQL
8.0.3
Hive
3.1.3
Flink
1.17.1
HBase
2.4.11
Spark
3.1.3
Spark-without-hadoop
3.1.3
datax
Maxwell
服务器规划
hadoop102
hadoop103
hadoop104
NameNode
ResourceManage
SecondaryNaneNode
DataNode
DataNode
DataNode
NodeManager
NodeManager
NodeManager
HistoryServer
-
-
jdk
jdk
jdk
zk
zk
zk
kafka
kafka
kafka
MySQL
-
-
Flume
-
-
Hive
-
-
flink(JobManager)
flink
flink
TaskManager
TaskManager
TaskManager
HBase
HBase
HBase
Spark

阿里云购买服务器

notion image
notion image
notion image
notion image
notion image
notion image
notion image

配置安全组

notion image
notion image
notion image
可以选择手动添加,但太麻烦了有多直接选择导入
notion image
 

搭建环境

 

服务器登录

notion image
分别记住这三个公网ip
打开软件
notion image
测试
notion image
notion image

配置内网ip互联

notion image
 
notion image
三台机器都需要
一个一个操作太麻烦了写一个脚本
在写脚本之前我们想要创建一个用户来管理我们后续的hadoop全家桶安装
于是创建一个hadoop用户
切换到hadoop用户写脚本
notion image
请注意
notion image
这三个为自己的主机
给文件权限
分发内容
notion image
 

SSH互联

接下来就是互联按照往常的安装来说
分别是 root 和 hadoop 用户需要进行互联
这个软件有个好处就是可以批量操作
notion image
notion image
开始互联吧!
notion image
root 和 hadoop 用户都要操作一遍

jdk1.8

后续的安装都推荐使用hadoop用户且用hadoop102进行操作
先用root给hadoop权限
上传目录
安装目录

上传jdk,hadoop,zookeeper,kafka,flume

notion image
notion image
耐心等一会
notion image
 
现在上传完成开始进行jdk安装
修改名字(默认都在module操作,后续不提示)
环境变量
验证
notion image
分发
notion image
先不着急查看其他两台,profile还没有分发,等hadoop一起

Hadoop

解压
改名

配置

推荐使用软件自带的编辑器 xedit命令
 
环境变量
 
分发环境
分发hadoop
检查java
notion image
检查hadoop
notion image
格式化
启动脚本
jps查看脚本

启动与关闭

notion image
notion image
notion image
 

Zookeeper

 
解压修改名字
 

配置

 
配置服务器编号
注意编号是2
 
修改配置文件
notion image
或者替换配置文件内容
 

分发

修改hadoop103,hadoop104的myid配置
 

脚本

notion image
 

kafka

解压和修改名
 

配置

 
环境变量
记得刷新
 

分发

修改hadoop103/104的配置文件
 
 

脚本

请记住kakfa是在zookeeper启动下才能成功启动
notion image
 

Flume

解压和修改名
 

配置

分发
 

MySQL

或者用上面的
解压下载的
notion image
上传MySQL和hive
notion image
 

安装MySQL

root 密码是 000000

检查登录

notion image
安装成功
 

Hive

 
解压和修改名
 

配置

 
hive-env.sh
 
hive-site.xml
环境变量
解决日志Jar包冲突
 
将MySQL的JDBC驱动拷贝到Hive的lib目录
notion image

配置元数据库

mysql操作
hive操作
notion image
修改元数据库字符集
启动
notion image

配置客户端

beeline
notion image
DG配置
notion image
 

脚本

这个脚本只用于启动metastor和hiveserver2以及杀死hive
hi.sh
 
 

HBase

安装前确保Hadoop集群和zk启动
notion image
解压和修改名
 

配置

环境变量配置
记得分发和刷新一下
 
hbase-env.sh
 
hbase-site.xml
 
regionservers
 
解决HBase和Hadoop的log4j兼容性问题
 

分发和启动

成功图,端口号16010
notion image
如果说找不到jdk
自动在hbase-env.sh添加jdk路径

高可用

Flink

解压和修改名

配置

 
flink-conf.yaml
 
workers
 
masters
 

分发

hadoop103/104
修改配置flink-conf.yaml
 

Yarn运行模式

环境变量添加
启动截图
notion image
如果打不开,不要慌,先检查阿里云安全组是否打开了8081端口
notion image
 

Spark(Yarn)

解压和修改名
 

配置

hadoop的yarn-site.xml
记得分发
Spark配置
 
 
spark-env.sh
 
spark-defaults.conf
 
 

启动和测试

启动历史服务器
测试
 
查看
notion image
 

Spark on Hive

解压和修改名
 

配置

 
spark-env.sh
 
环境变量
记得刷新变量
 
hive创建spark文件
 
HDFS创建路径,用于存储历史日志和Spark的jar包
 
修改hive的hive-site.xml
添加
 
Yarn环境配置
notion image

测试

notion image
第一次很慢需要调用资源,但第二次就很快了。
 

Maxwell

解压和修改名

启用MySQL Binlog

增加
 
重启MySQL服务
在MySQL中创建数据库
配置Maxwell

脚本

datax

解压和修改名
自我测试检查
notion image
 
 
 
 
 
 
 
 
 
 
 
 

📎 参考文章

  • 一些引用
  • 引用文章
 
💡
有关Notion安装或者使用上的问题,欢迎您在底部评论区留言,一起交流~
Hive的安装离线数仓搭建
Loading...