Hadoop 一

zlnfcl 2022-10-18 原文

Hadoop要解决的问题：

　　海量数据的存储和计算

Hadoop优势

　　1.高可靠性，Hadoop底层维护多个数据副本，即使某个结点故障，也不会导致数据丢失

　　2.高扩展性：在集群间分配任务数据，方便扩展数以千计的结点（动态增加删除服务器）

　　3.高效性： Hadoop是并行工作的，加快任务处理速度

　　4.高容错性：能够自动将失败的任务重新分配

Hadoop的组成（重点）

　　Hadoop3.x在组成上没有太大变化

HDFS概述：

　　NameNode（nn）：记录每个文件块存储的位置（类似与目录）（文件名，文件目录结构，文件属性，文件权限，文件块列表以及所在的DataNode）

　　DataNode（dn）：具体来存储数据（在本地文件系统存储文件块数据，以及块数据的校验和）

　　Secondary NameNode （2NN）：辅助NameNode工作（每隔一段时间对NameNode的元数据进行备份）

Yarn（ResourceManager–RM和NodeManager–NM）

　　ResourceManager：整个集群的资源管理–内存、CPU等

　　NodeManager：单个结点的资源管理

　　ApplicationMaster：单个任务运行的管理者

　　Container：容器，相当于一个独立的服务器，里面封装任务运行所需要的资源，CPU 内存网络等

　　　多个客户端，集群上可以运行多个APP Master，每个NM上可有多个Container

MapReduce

　　计算过程分为两个阶段：Map和Reduce

　　Map：并行处理输入数据

　　Reduce：对Map阶段的结果进行汇总

HDFS，Yarn，MapReduce三者关系

大数据生态图

本文链接：https://www.cnblogs.com/zlnfcl/p/16803913.html

Hadoop 一的更多相关文章

Hive窗口函数保姆级教程

在SQL中有一类函数叫做聚合函数，例如sum()、avg()、max()等等，这类函数可以将多行数据按照规则聚 […]...

Hadoop的JavaAPI

1.配置winutil的环境变量然后在Path变量中加入 2.测试创建一个普通的Java工程测试FileSystem fs = null;@Beforepublic void init() throws Exception{f...

1.Hadoop集群安装部署

Hadoop集群安装部署 1.介绍（1）架构模型（2）使用工具 VMWARE cenos7 Xshell […]...

hadoop基本应用

（1）修改主机名并刷新一下主机名称（建议打开窗口重新连接一下）[root@bdvm2022 ~]# hostnamectl set-hostname lixianhui38[root@bdvm2022 ~]# [root@bdvm20...

hadoop_WordCountMap

import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;imp...

spark 2.3 导致driver OOM的一个SparkPlanGraphWrapper源码的bug

背景长话短说，我们部门一个同事找到我，说他的spark 2.3 structured streaming程序 […]...

Hadoop拾遗

一、Hadoop简介2003 年 Google 发表三篇论文也就是所谓的“三架马车”，分别是《The Google File System》《MapReduce: Simplified Data Processing on Larg...

Hadoop学习2

一、今日学习今天学习关于Hadoop的介绍，了解到的Hadoop是由Java编写的Apache开源框架，允许使用简单的编程模型跨计算机集群分布式处理大型数据集，并且还了解到了Hadoop的相关架构以及是如何工作的。（1）Hadoop框架...

随机推荐

win10系统安装VMware虚拟机软件以及linux系统

一、安装VMware 　　1.在VMware官网下载VMware Workstation Pro 15.5.1 […]...

Postgresql命令行和数据库备份与恢复

进入Postgresql 1 进入数据库默认安装会创建postgres 用户，,使用postgres […]...

axios异步提交表单数据的不同形式

踩坑Axios提交form表单几种格式前后端分离的开发前后端, 前端使用的vue,后端的安全模块使用的Spr […]...

程序员最艰巨的十大任务

程序员最艰巨的任务跟编写代码没有多少关系。编码是逻辑思路的一种实践，这跟程序员日常工作中的其它任务比起来相对简 […]...

性能测试的主要指标 – 灰太熊

性能测试的主要指标性能事物、物品的某些特性的评价值时间角度、处理能力软件性能测试用一定的技术、找出 […]...

2020全国大学生数学建模C题中小微企业的信贷决策随机森林代码

2020全国大学生数学建模C题中小微企业的信贷决策（随机森林代码）　　某银行对确定要放贷企业的贷款额度为10 […]...

有趣的css3实战案例剖析——（水纹波动）

对于css3的学习，更多的是在于对新特性和基础理论的熟悉，这篇文章通过一个案例带领大家了解css3里一 […]...

Jmeter配置元件——JDBC Connection Configuration参数化

在昨天Jmeter配置元件——CSV DataSet Config参数化一文中，有提到，在参数化时，还可以使用 […]...

Hadoop 一

Hadoop 一的更多相关文章

随机推荐

热门专题

目录导航