Hadoop集群运行

? 2022-04-09 原文

在Hadoop文件参数配置完成之后

在master上操作

su - hadoop
cd /usr/local/src/hadoop/
./bin/hdfs namenode -format
hadoop-daemon.sh start namenode
hadoop-daemon.sh start secondarynamenode
jps

如果看到NameNode和SecondaryNameNode就表示成功

在slave上操作

su - hadoop
hadoop-daemon.sh start datanode
jps

如果看到DataNode就表示成功

在master上操作

su - hadoop
hdfs dfsadmin -report

给用户做免密

ssh-keygen -t rsa
ssh-copy-id slave1
ssh-copy-id slave2
ssh-copy-id master
stop-dfs.sh
start-dfs.sh
start-yarn.sh
jps

如果在master上看到ResourceManager，并且在slave上看到NodeManager就表示成功

hdfs dfs -mkdir /input
hdfs dfs -ls /
mkdir ~/input
vi ~/input/data.txt
hello world
hello hadoop
hello zzz

保存后执行以下命令

hdfs dfs -put ~/input/data.txt /input
hdfs dfs -cat /input/data.txt
hadoop jar /usr/local/src/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount /input/data.txt /output

执行完后要看到map是100%，reduce也是100%，还要看到successfully

hdfs dfs -cat /output/part-r-00000

在windows真机上执行

进入C:\windows\system32\drivers\etc
把此目录下的hosts文件拖到桌面上
右键打开此文件加入ip与主机名的映射关系
保存后拖回原文件
在浏览器上输入master:8088访问可以看到 MapReduce程序刚刚完成的作业
在浏览器上输入master:50070访问namenode和datanode
在浏览器上输入master:50090访问secondarynamenode

停止 Hadoop（非必要步骤）

1.步骤一：停止 yarn
[hadoop@master hadoop]$ stop-yarn.sh
步骤二：停止 DataNode
[hadoop@slave1 hadoop]$ hadoop-daemon.sh stop datanode
stopping namenode
[hadoop@slave2 hadoop]$ hadoop-daemon.sh stop datanode
stopping namenode
步骤二：停止 NameNode
[hadoop@master hadoop]$ hadoop-daemon.sh stop namenode
stopping namenode
步骤三：停止 SecondaryNameNode
[hadoop@master hadoop]$ hadoop-daemon.sh stop secondarynamenode
stopping secondarynamenode
步骤四：查看 JAVA进程，确认 HDFS进程已全部关闭
[hadoop@master hadoop]$ jps
3528 Jps
30838 RunJar

版权声明：本文为?原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/zhengyan6/p/16123195.html

Hadoop集群运行的更多相关文章

Hadoop–HDFS
Hadoop 3.1.2算法复杂度]孙发复杂度分为时间复杂度和空间复杂度时间复杂度执行算需要计算工作量而空间复杂度是指执行这个算法所需要的内存空间；时间和空间都是计算机资源的重要体现，而算法的复杂性就是体现在运行该算法时的计算机所...
Oracle RAC管理及维护命令详解
Oracle Clusterware的命令集可以分为以下4种：节点层：osnodes 网络层：oifcfg […]...
Hadoop十九
HDFS API操作在Windows上操作hadoop，需要添加hadoop依赖，我的hadoop是3.3.1版本的，我用的依赖是3.2.0的，需要配置环境变量 PATH添加如下路径：然后双击依赖中的一闪而过就是...
实验1：HADOOP实验-HDFS与MAPREDUCE操作
云计算技术与应用石家庄铁道大学信息学院实验1：HADOOP实验-HDFS与MAPREDUCE操作本次实验属于验证型实验，通过本次实验学生将掌握以下内容：1、利用虚拟机搭建集群部署hadoop2、HDFS文件操作以及文...
Hadoop 数据迁移用法详解
Hive系列文章 Hive表的基本操作Hive中的集合数据类型Hive动态分区详解hive中orc格式表的数据 […]...
应用AI芯片加速 Hadoop 3.0 纠删码的计算性能
本文由云+社区发表做为大数据生态系统中最重要的底层存储文件系统HDFS，为了保证系统的可靠性，HDFS通过多 […]...
知道打印机的IP 怎么连接运行
直接在运行里输入“\\”+“打印机IP ” 即可出现该打印机（注：该打印机必须是共享打印机非直接用网线连接的打 […]...
高可用Redis(十二)：Redis Cluster
Redis Cluster是Redis官方提供的Redis集群功能 1.为什么要实现Redis Cluster […]...

随机推荐

分享一篇IBN（Intent-based networking）调研报告
IBN调研报告背景 SDN（Software-defined network）：最大特点在于具有松耦合的控制 […]...
开启本地DNS缓存来加速网页浏览 – 仆本浪人
开启本地DNS缓存来加速网页浏览如果你觉得DNS解析慢，或者上网慢的话，可以尝试一下：安装dnsmasq： […]...
使用线程 Monitor.Wait() 和 Monitor.Pulse()
Wait() 和 Pulse() 机制用于线程间交互。当在一个对象上使用Wait() 方法时，访问这个对象 […]...
Access 与 Excel 最重要的区别是什么?
最核心的区别是：一、Access 是基于关系型数据库（RDBMS）设计的 2、Excel 是基于任意形式的电 […]...
如何像黑客一样思考_转
转自：https://news.cnblogs.com/n/554087/ 黑客也许是世界上最酷的工作 […]...
Win10家庭版远程桌面问题最新解决方法解决-2020/7/14
Win10家庭版远程桌面问题...
angular分页插件tm.pagination二次触发问题解决歪方案
　　今天在学习angularjs的分页插件时遇到了一个前端的问题，谷歌浏览器开发者模式调试的时候发现每次点击分 […]...
ArcGIS10中国工具正式发布，包括图框，接合图表，批量打印，图形裁剪，椭球面积，自动编号 – gisoracle
View Post ArcGIS10中国工具正式发布，包括图框，接合图表，批量打印，图形裁剪，椭球面积，自动编 […]...

展开目录

目录导航