hadoop全分布式集群搭建

不落微笑 2022-03-26 原文

hadoop全分布集群(master)

安装JDK环境

tar -zxvf /opt/software/jdk-8u301-linux-x64.tar.gz -C /opt/module

修改配置文件

vi /etc/profile.d/my_env.sh

my_env.sh

#JAVA_HOME
export JAVA_HOME=/opt/module/jdk1.8.0_301
export PATH=$PATH:$JAVA_HOME/bin

同步到各个结点（脚本）

xsync /etc/profile

最后(生效并测试每个节点)

source /etc/profile
java

安装hadoop

tar -zxvf /opt/software/hadoop-3.1.3.tar.gz -C /opt/module

修改配置文件(hadoop)

vi /etc/profile.d/my_env.sh

my_env.sh

#HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-3.1.3
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

修改配置文件(集群)

cd /opt/module/hadoop-3.1.3/etc/hadoop/

core-site.xml

 <!--指定Namenode的地址-->
        <property>
                <name>fs.defaultFS</name>
                <value>hdfs://master:8020</value>
        </property> 
        <!--指定hadoop数据的存储目录-->
        <property>
                <name>hadoop.tmp.dir</name>
                <value>/opt/module/hadoop-3.1.3/data</value>
        </property> 
        <!--配置HDFS网页登录使用的静态用户为hadoop
        <property>
                <name>hadoop.http.staticuser.user</name>
                <value>hadoop</value>
        </property>-->

hdfs-site.xml

<!--nn web端访问地址-->
        <property>
                <name>dfs.namenode.http-address</name>
                <value>master:9870</value>
        </property>
        <!--2nn web端访问地址-->
        <property>
                <name>dfs.namenode.secondary.http-address</name>
                <value>slave2:9868</value>
        </property>

yarn-site.xml

<!--指定MR走shuffle-->
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>
        <!--指定ResourceManager的地址-->
        <property>
                <name>yarn.resourcemanager.hostname</name>
                <value>slave1</value>
        </property>
        <!--环境变量的继承-->
        <property>
                <name>yarn.nodemanager.env-whitelist</name>
                <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
        </property>
        <!-- 开启日志聚集功能 -->
        <property>
                <name>yarn.log-aggregation-enable</name>
                <value>true</value>
        </property>
        <!-- 设置日志聚集服务器地址 -->
        <property>
                <name>yarn.log.server.url</name>
                <value>http://master:19888/jobhistory/logs</value>
        </property>
        <!-- 设置日志保留时间为 7 天 -->
        <property>
                <name>yarn.log-aggregation.retain-seconds</name>
                <value>604800</value>
        </property>

mapred-site.xml

 <!--指定mapreduce程序运行在Yarn上-->
        <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value> 
        </property> 

        <!-- 历史服务器端地址 -->
        <property>
                <name>mapreduce.jobhistory.address</name>
                <value>master:10020</value> 
        </property>
        <!-- 历史服务器 web 端地址 -->
        <property>
                <name>mapreduce.jobhistory.webapp.address</name>
                <value>master:19888</value> 
        </property>

workers(不能有任何的空格)

master
slave1
slave2

同步到各个结点（脚本）

xsync /opt/module/hadoop-3.1.3/etc/hadoop/

ssh免密登录

master(主机)

master$ ssh master
master$ cd .ssh/
master$ ssh-keygen -t rsa  #三个空格
master$ ssh-copy-id master
master$ ssh-copy-id slave1
master$ ssh-copy-id slave2

slave1和slave2同上

master(主机root用户)

master$ su root
master$ cd .ssh/
master$ ssh-keygen -t rsa  #三个空格
master$ ssh-copy-id master
master$ ssh-copy-id slave1
master$ ssh-copy-id slave2

初始化并启动服务(master)

cd /opt/module/hadoop-3.1.3/
hdfs namenode -format

master

cd /opt/module/hadoop-3.1.3/
sbin/start-dfs.sh
bin/mapred --daemon start historyserver

slave1

cd /opt/module/hadoop-3.1.3/
sbin/start-yarn.sh

：有错误和不足请随时指点

本文链接：https://www.cnblogs.com/blwx/p/16058003.html

hadoop全分布式集群搭建的更多相关文章

4、hadoop 全分布配置

hadoop 全分布配置分别有3台主机10.10.10.128 master10.10.10.129 slave110.10.10.130 slave21、配置网络信息（在所有节点上执行)vi /etc/sysconfig/ne...

[分布式学习]消息队列之rocketmq笔记

文档地址 RocketMQ架构哔哩哔哩上的视频 mq有很多，近期买了《分布式消息中间件实践》这本书，学习关于 […]...

程序员修神之路–做好分库分表其实很难之二（继续送书）

菜菜哥，上次听你给我讲了分库的情况后，我明白了很多，能再给我讲讲分表吗有收获就好，分表其实有很多情况和分库类 […]...

freeNAS 搭建

一台弃旧的HP电脑，2012年的。 4G内存，i7CPU。开干！第一步骤。下载 https://www. […]...

1.2 Hadoop快速入门

1.2 Hadoop快速入门1、Hadoop简介Hadoop是一个开源的分布式计算平台。提供功能：利用服务器集群，根据用户定义的业务逻辑，对海量数据的存储（HDFS）和分析计算（MapReduce）2、Hadoop核心组件Comm...

搭建 RTMP 服务器

主要步骤具体步骤 FAQ docker 搭建版参考主要步骤下载 nginx 的 rtmp 模块编译n […]...

大数据技术之_12_Sqoop学习_Sqoop 简介+Sqoop 原理+Sqoop 安装+Sqoop 的简单使用案例+Sqoop 一些常用命令及参数

第1章 Sqoop 简介第2章 Sqoop 原理第3章 Sqoop 安装3.1 下载并解压3.2 修改配置文件 […]...

分布式文件系统FastDFS动态扩容

　　当用户量越来越大，则集群中某个group总会到达其极限，这时就得扩展集群的容量了。 FastDFS的扩容分 […]...

IDEA 的配置确实有些烦人，完整的配置我之前发过，现在有个著名的报错： Error during artif […]...

盘一盘 synchronized （一）—— 从打印Java对象头说起

Java对象头的组成 Java对象的对象头由 mark word 和 klass pointer 两部分组成 […]...

这11款chrome神器，用起来爽到爆

前言对于从事IT行业的我们来说，几乎无时无刻都在用chrome浏览器，因为它给我们的工作和生活带来了极大的便 […]...

Spring源码解析之ConfigurationClassPostProcessor（二）

上一个章节，笔者向大家介绍了spring是如何来过滤配置类的，下面我们来看看在过滤出配置类后，spring是如 […]...

vue-cli 项目踩坑 npm install 时出错

1、报错如下： 2、此时你执行npm run dev / npm run build 会报错如下 npm […]...

.Net Core跨平台应用研究-HelloDDNS(动态域名篇)

.Net Core跨平台应用研究-HelloDDNS -玩转DDNS 摘要为解决自己搭建的内网 […]...

leetcode-0617 合并二叉树

题目地址https://leetcode-cn.com/problems/merge-two-binary-t […]...

Google基本利用

site:baidu.com #用于收集子域名不要输入WWW intitle:管理登录 Filetype: […]...

hadoop全分布式集群搭建

hadoop全分布集群(master)

hadoop全分布式集群搭建的更多相关文章

随机推荐

热门专题

目录导航