Zeppelin是一个基于Web的notebook,提供交互数据分析和可视化。后台支持接入多种数据处理引擎,如spark,hive等。支持多种语言: Scala(Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等。

链接:http://zeppelin.apache.org/download.html

选择 zeppelin-0.8.1-bin-all.tgz

本文使用zepplin连接hive,所以需要虚拟机提前安装好hadoop以及hive
安装hadoop参考:https://blog.csdn.net/and52696686/article/details/107287066
安装hive参考:https://blog.csdn.net/and52696686/article/details/107007007

将下载好的安装包文件拖拽至之前创建好的linux系统 /opt/software 目录下
解压并重命名:

  1. tar -zxvf zeppelin-0.8.1-bin-all.tgz -C /opt/install/
  2. mv zeppelin-0.8.1-bin-all/ zeppelin081

切换至zeppelin配置文件conf目录下

  1. cd /opt/install/zeppelin/conf

复制并重命名

  1. cp zeppelin-site.xml.template zeppelin-site.xml
  2. vi zeppelin-site.xml

进入文件需修改两处
在这里插入图片描述
在下插入以下代码:

  1. <!-- 修改端口配置,便于访问国外网站 -->
  2. <property>
  3. <name>zeppelin.helium.registry</name>
  4. <value>helium</value>
  5. </property>

修改端口号:默认是8080,为避免冲突,修改为其他端口号
修改后如图
在这里插入图片描述

在当前conf目录下拷贝zeppelin系统脚本并重命名

  1. cp zeppelin-env.sh.template zeppelin-env.sh

编辑

  1. vi zeppelin-env.sh

修改下图;两处红框位置 “JAVA_HOME路径”和 “HADOOP_CONF_DIR配置文件路径”
在这里插入图片描述
在这里插入图片描述
修改后:
在这里插入图片描述
在这里插入图片描述

切换至zeppelin/bin目录下,启动:

  1. cd /opt/install/zeppelin081/bin
  2. ./zeppelin-daemon.sh start

启动成功如下图:会提示ok
在这里插入图片描述
在web端输入: 192.168.206.129:8000
zeppeline启动较慢,虚拟机界面提示启动成功需耐心等待一会才可以打开网页:
在这里插入图片描述
关闭 zeppelin:

  1. ./zeppelin-daemon.sh stop

Zepplin中没有默认的hive解释器,所以需要通过jdbc解释器进行添加

①:拷贝 hive/conf 文件夹下的 hive-site.xml 到zeppelin081/conf目录下

  1. cp /opt/install/hive/conf/hive-site.xml /opt/install/zeppelin081/conf

②:拷贝jar包
拷贝下面两个jar包到zeppelin安装目录下 interperter/jdbc 中
hadoop/share/hadoop/common/hadoop-common-2.6.0-cdh5.14.2.jar
hive/lib/hive-jdbc-1.1.0-cdh5.14.2-standalone.jar

  1. cp /opt/install/hadoop260/share/hadoop/common/hadoop-common-2.6.0-cdh5.14.2.jar /opt/install/zeppelin081/interpreter/jdbc/
  1. cp /opt/install/hive/lib/hive-jdbc-1.1.0-cdh5.14.2-standalone.jar /opt/install/zeppelin081/interpreter/jdbc/
  1. start-all.sh
  2. zkServer.sh start
  3. service mysql start
  4. hive --service metastore #进程需独占一窗口
  5. nohup hive --service hiveserver2 & #进程需独占一窗口

配置hive坏境前一定要确认beelin服务能正常启动,因为zeppelin中搭载hive环境是通过beeine来连接的

若之前启动过没有关闭不用再次启动

  1. cd /opt/install/zeppelin081/bin
  2. ./zeppelin-daemon.sh start

网址:192.168.206.129:8000
①:右上角anonymous –> interpreter –> +Create新建一个叫做hive的集成环境
在这里插入图片描述
在这里插入图片描述

②:设置properties
创建分组名就叫做 hive ,分组为 jdbc
在这里插入图片描述
设置下图三处红框位置内容即可
default.driver : org.apache.hive.jdbc.HiveDriver
default.url : jdbc:hive2://192.168.42.200:10000
default.user : null
在这里插入图片描述
设置完成保存即可

在zepplin中,点击notebook,通过create new note创建一个notebook.
其中name可以任意,Default Interpreter选择hive
在这里插入图片描述
在这里插入图片描述

注意,zepplin中操作hive不能有分号

  1. %hive
  2. show databases

在这里插入图片描述
继续测试
在这里插入图片描述

以上测试无报错信息,说明zeppelin连接hive成功!

版权声明:本文为huanghanyu原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/huanghanyu/p/13792739.html