Hadoop运行错误：输出目录已存在 - Output directory hdfs://master:9000/output already exists

Sofiacodes 2022-03-25 原文

Hadoop运行错误 – Output directory hdfs://master:9000/output already exists

在集群上测试：

hadoop jar /opt/software/wc.jar com.atguigu.mapreduce.WordCountDriver /wc.input /wc.output

自编译的wordcount出现的错误：

Exception in thread "main" org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory hdfs://hadoop102:9000/wc.input already exists

1.hdfs的output目录已经存在。

检查hdfs文件系统上并没有output目录：有则删除即可

2.检查java代码路径是否错误

//5.指定job原始文件输入目录
FileInputFormat.setInputPaths(job, new Path(args[0]));  //args:当前所运行的参数(取第一个参数)
//指定job输出结果所在的目录
FileOutputFormat.setOutputPath(job, new Path(args[1]));  //args:当前所运行的参数(取第二个参数)

问题出在您的参数编号上：args[0]实际上是com.atguigu.mapreduce.WordCountDriver（主类名），因此您需要使用args[1]作为输入，使用args[2]作为输出。

错误显示为Output directory hdfs://hadoop102:9000/wc.input already exists：它正在尝试使用input文件夹作为输出。更改一下运行参数序号即可

FileInputFormat.addInputPath(job, new Path(args[1]));
FileOutputFormat.setOutputPath(job, new Path(args[2]));

总结：在idea上运行是没问题的，在集群上运行的时候指定了全类名，把它当做输入了。此时输出采用输入路径作为输入了。固显示输出路径已存在。

本文链接：https://www.cnblogs.com/Sofiacodes/p/16053606.html

Hadoop运行错误：输出目录已存在 - Output directory hdfs://master:9000/output already exists的更多相关文章

Hadoop(23)-Yarn资源调度器

Hadoop(23)-Yarn资源调度器 Yarn是一个资源调度平台，负责为运算程序提供服务器运算资源，相当于 […]...

Hadoop 三剑客之 —— 分布式文件存储系统 HDFS

一、介绍二、HDFS 设计原理 2.1 HDFS 架构 2.2 文件系统命名空间 2. […]...

Flink 专题1 ：搭建Flink 及Flink 简介

目录 Flink 专题1 ：搭建Flink 及Flink 简介 Flink 简介 Flink 的优势: Fl […]...

实验1：HADOOP实验-HDFS与MAPREDUCE操作

云计算技术与应用石家庄铁道大学信息学院实验1：HADOOP实验-HDFS与MAPREDUCE操作本次实验属于验证型实验，通过本次实验学生将掌握以下内容：1、利用虚拟机搭建集群部署hadoop2、HDFS文件操作以及文...

Hadoop运行环境搭建

目录：1. 准备虚拟机（最小化安装）2. 配置一台纯净版模板机 -- 固定ip地址、修改主机名 -- 用xshell工具连接模板机 -- 通过yum安装方式安装必要的软件 -- 关防火墙 -- 修改ho...

hadoop介绍

hadoop允许用户使用简单的编程模型实现跨机器集群对海量数据进行分布式计算处理。 hadoop核心组件： 1、HDFS（分布式文件存储系统）：解决海量数据存储。2、YARN（集群资源管理和任务调度框架）：解决资源任务调度。3...

Hadoop HA高可用搭建流程

8.3 HDFS-HA集群配置 8.3.1 环境准备 1. 修改IP 2. 修改主机名及主机名和IP地址的映射 […]...

linux后台运行命令

Linux后台运行命令有两种方式：cmd & ：后台运行，关掉终端会停止运行nohup cmd & ：后台运行，关掉终端不会停止运行方式一：cmd &cmd & 实现让命令在后台运行。但不要将有用户交互的命令放到后台，这样命令...

随机推荐

经常使用Firefox插件大全

Web开发者经常使用的火狐插件 1）FireShot：是一个截图工具，来源于截图软件Screenshot St […]...

POJ1321-棋盘问题

【题目描述】在一个给定形状的棋盘（形状可能是不规则的）上面摆放棋子，棋子没有区别。要求摆放时任意的两个棋子不 […]...

数据结构：哈希表以及哈希冲突的解决方案

前言基于先前的学习计划，最近打算深入学习Java的集合类，首先要研究的就是HashMap，在学习HashMa […]...

Eclipse 无法编译或提示“错误: 找不到或无法加载主类” – __keras

Eclipse 无法编译或提示“错误: 找不到或无法加载主类” project显示一个红色叹号，通常是.j […]...

手机号码正则验证（含港澳台） – sharon-mxy

手机号码正则验证（含港澳台）刚用php写了一个云片网发送短信的接口，大陆号码不需要加区号，但是港澳台及国际号 […]...

关于SignalR 进行双向多步对话

关于ASP.NET SignalR 解释百度百科是这样说的： ASP.NET SignalR 是为 ASP.N […]...

轮播图js版&jQ版

JS版轮播图 html部分和css部分自己任意定主要构成: 1,一个固定的框超出框的部分隐藏 2,几张图片 […]...

HCNP Routing&Switching之OSPF特殊区域

OSPF的特殊区域，主要目的是屏蔽相关LSA，从而到达精简LSDB数据库和路由条目的目的；它和路由汇总都是优化 […]...

Hadoop运行错误：输出目录已存在 - Output directory hdfs://master:9000/output already exists

Hadoop运行错误 – Output directory hdfs://master:9000/output already exists

Hadoop运行错误：输出目录已存在 - Output directory hdfs://master:9000/output already exists的更多相关文章

随机推荐

热门专题

目录导航