运行MapReduce任务

hemomo 2020-02-06 原文

1：运行MapReduce任务

1：原始数据准备

统计用户的登录次数：

源数据login_log.txt如下：

7whygb5m@linshiyouxiang.net

nuahvuhuoia@qq.com

uashkufawuk@163.com

wafwqfqw@gmail.com

iuhukawhfuk@sina.com

wfkwbfkuw@tom.com

iuqwhfuihuqiw@yahoo.com

hiuwqhuiryquiw545@yahoo.com

uiwqyiuyr7qwrqa@sohu.com …

2：应用程序准备

集群目录：

$HADOOP_HOME/share/hadoop/mapreduce/中找到程序包：

hadoop-mapreduce-examples-2.6.4.jar

该程序包提供了一些测试模块：

wordcount //对输入文件中的单词进行词频统计

pi //估算圆周率pi的值

wordmean //计算输入文件中单词的平均长度

3：提交任务指令解析

hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jar

wordcount /user/root/login_log.txt /user/root/output

说明：

wordcount //指定程序包的主类

/user/root/login_log.txt //hdfs上需要计算的源文件

/user/root/output //hdfs上输出文件的目录

4：查看输出结果

在/user/root/output目录下有两个文件：

_SUCCESS //这是标识文件，表示这个任务执行完成

part-r-00000 //完成任务后产生的结果文件

输出前5行：

hadoop fs -cat /user/root/output/part-r-00000 | head -n 5

5：查看集群的资源管理情况

https://master:18088

查看计算资源的使用情况

查看mapreduce的任务列表

查看具体作业的详细信息

本文链接：https://www.cnblogs.com/hemomo/p/12271518.html

BDD实战篇 – .NET Core里跑Specflow – 可以跑集成测试和单元测试 […]...

CodeChef-RNDRATIO Mysterious Ratio 题解

CodeChef-RNDRATIO Mysterious Ratio 题意简述：对每个 \(1 \le i […]...

移动端页面开发（经典布局篇）

一. viewport 什么是viewport 简单来讲，viewport就是浏览器上，用来显示网页的那一 […]...

C#中如何给Excel添加水印

我们知道Microsoft Excel并没有内置的功能直接给Excel表添加水印，但是其实我们可以用其他变通的 […]...

【一起学源码-微服务】Nexflix Eureka 源码十三：Eureka源码解读完结撒花篇~！

前言想说的话【一起学源码-微服务-Netflix Eureka】专栏到这里就已经全部结束了。实话实说，从 […]...

010 有顺序的Map的实现类：TreeMap和LinkedHashMap

作者：nnngu GitHub：https://github.com/nnngu 博客园：http://www […]...

ZwQuerySystemInformation 安全使用心得 Delphi 版

ZwQuerySystemInformation 安全使用心得 Delphi 版。作为 DELPHI 版本， […]...

[PS] 透明底图片制作

网页中有时需要自己绘制一些图片，或者现有的图片希望修改底色，这些都会用到透明底色的图片，下面总结两种方法，比较 […]...

运行MapReduce任务

1：运行MapReduce任务

运行MapReduce任务的更多相关文章

随机推荐

热门专题

目录导航