如何查看spark与hadoop、kafka、Scala、flume、hive等兼容版本【适用于任何版本】

匿名 2021-08-15 原文

问题导读

1.通过什么途径，可以查看与spark兼容的组件版本？
2.如何获取pom文件？
3.pom文件中包含了哪些信息？
4.spark编译通过什么参数可以指定hadoop版本？

当我们安装spark的时候，很多时候都会遇到这个问题,如何找到对应spark的各个组件的版本，找到比较标准的版本兼容信息。答案在spark源码中的pom文件。首先我们从官网下载源码。进入官网

[Bash shell] 纯文本查看复制代码

1	`http://spark.apache.org`

选择download，然后我们看到下面内容

[Bash shell] 纯文本查看复制代码

#

Master development branch

git

clone git:

//github.com/apache/spark.git

#

Maintenance branch with stability fixes on top of Spark 2.2.0

git

clone git:

//github.com/apache/spark

.git

-b branch-2.2

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

我们看到上面需要使用git下载。
如果你是window，那么可以装一个Linux虚拟机，或则直接在window上安装。window安装遇到的问题可参考
win7安装 git软件下载以及遇到的问题解决解决方法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=8521
这里使用Linux安装，更加方便。执行下面命令

[Bash shell] 纯文本查看复制代码

1	`sudo` `yuminstall` `perl openssh git -y`

上面安装完毕，下载源码

[Bash shell] 纯文本查看复制代码

1	`git clone git://github.com/apache/spark.git`

当然如果你不想这么麻烦，只想查看pom.xml文件，也可以直接访问

[Bash shell] 纯文本查看复制代码

1	`github.com/apache/spark.git`

然后打开pom.xml即可

[Bash shell] 纯文本查看复制代码

1	`https://github.com/apache/spark/blob/master/pom.xml`

这时候我们可以查看里面的兼容信息spark的版本为2.3.0-SNAPSHOT
0?wx_fmt=jpeg

接着我们找到<properties>里面有各种所需软件的信息，比如
jdk1.8,hadoop位2.6.5，2.7.1，2.7.3。
flume版本为flume1.6.0，
zookeeper版本为3.4.6
hive为：1.2.1
scala为：2.11.8

这样我们在安装的时候就找到它们版本兼容的依据。
当然官网提供一种编译的版本，剩下的需要我们自己编译。下一篇我们讲该如何编译我们想要的版本。
0?wx_fmt=jpeg
这里需要说明的一个地方即maven的profile，是为了适应不同的版本。我们在编译的时候，可以通过-P指定版本

0?wx_fmt=jpeg

本文链接：

如何查看spark与hadoop、kafka、Scala、flume、hive等兼容版本【适用于任何版本】的更多相关文章

初探Kafka Streams

Kafka在0.10版本推出了Stream API，提供了对存储在Kafka内的数据进行流式处理和分析的能力。 […]...

Flume – Kafka日志平台整合

1. Flume介绍 Flume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传 […]...

kafka rebalance解决方案 -incremental cooperative协议和static membership功能

在kafka2.4的时候，社区推出两个新feature来解决重平衡过程中stop the world的问题。 […]...

Scala 学习（5）之「类——基本概念3」

目录使用模式匹配进行类型判断 protected 调用父类的constructor 匿名内部类抽象类抽象 […]...

SpringBoot + Kafka + ELK 完成海量日志收集（超详细）

整体流程大概如下：服务器准备在这先列出各服务器节点，方便同学们在下文中对照节点查看相应内容 SpringB […]...

Akka-CQRS（9）- gRPC，实现前端设备与平台系统的高效集成

前面我们完成了一个CQRS模式的数据采集（录入）平台。可以预见：数据的产生是在线下各式各样的终端系统中，包 […]...

大数据技术之_16_Scala学习_06_面向对象编程-高级+隐式转换和隐式值

第八章面向对象编程-高级8.1 静态属性和静态方法8.1.1 静态属性-提出问题8.1.2 基本介绍8.1. […]...

kafka 获取topic每个分区的数据条数

执行命令 [hduser@hadoop4 bin]$ kafka-run-class.sh kafka.too […]...

随机推荐

test

404...

Python—安装路径查看

python是解释型脚本语言，在执行时，逐句解释执行，不需要进行预编译。但需要有自身的Python解释器。 […]...

20181107-软考学习计划

第一天建立软考的学习计划起始时间 2018年11月7日-2019年5月1日论文练字目标半 […]...

jQuery实现放大镜效果

<!DOCTYPE html><html lang=”en”> […]...

循序渐进VUE+Element 前端应用开发(2）— Vuex中的API、Store和View的使用

循序渐进VUE+Element 前端应用开发(2）— Vuex中的API、Store和View的使 […]...

计算机图形学——人机交互绘图技术

人机交互（Human-Computer Interaction）是指用户与计算机系统之间的通信，它是人与计算机 […]...

最大的人工智能AI工具目录-Futurepedia

Futurepedia，一个在线最大的人工智能AI工具目录，网站在线收录各种人工智能AI工具，可以浏览1534种AI工具和50个类别，例如营销、图像生成和视频编辑，可以按类别、价格和功能搜索和过滤进行搜索查找工具，网站每天更新 5 个以上的新 AI 工具，对人工智能ai感兴趣的可以试试这个非常不错的在线人工智能AI工具目录，总能找到你喜欢满意的人工智能ai工具。...

windows 电脑配置信息检测

内存条 DDR4 DDR4相比DDR3最大的区别有： 1）处理器：每次内存升级换代时，必须支持的就 […]...

如何查看spark与hadoop、kafka、Scala、flume、hive等兼容版本【适用于任何版本】

如何查看spark与hadoop、kafka、Scala、flume、hive等兼容版本【适用于任何版本】的更多相关文章

随机推荐

热门专题

目录导航