Flume 读取RabbitMq消息队列消息，并将消息写入kafka

yihec 2018-04-28 原文

首先是关于flume的基础介绍

组件名称	功能介绍
Agent代理	使用JVM 运行Flume。每台机器运行一个agent，但是可以在一个agent中包含多个sources和sinks。
Client客户端	生产数据，运行在一个独立的线程。
Source源	从Client收集数据，传递给Channel。
Sink接收器	从Channel收集数据，进行相关操作，运行在一个独立线程。
Channel通道	连接 sources 和 sinks ，这个有点像一个队列。
Events事件	传输的基本数据负载。

目前来说flume是支持多种source

其中是支持读取jms消息队列消息，但是并不支持读取rabbitMq,所以需要对flume进行二次开发

这里主要就是flume怎么从rabbitMq读取数据

这里从git上找到了一个关于flume从rabbitMq读取数据的插件

下载地址是:https://github.com/gmr/rabbitmq-flume-plugin

上面有一些英文的描述，大家可以看下

环境介绍

centOS 7.3 jdk1.8 cdh5.14.0

1.用 mvn 打包该项目，会生成两个JAR包

2.因为我这边使用的以cdh方式安装集成flume的，所以把这两个jar 扔到 /usr/lib 下面

如果是普通的安装方式需要把这两个jar包复制到 flume安装目录的lib下面

3.进入cdh管理页面配置Agent

下面是详细的配置，我这边是直接把消息写入kafka集群里的

tier1.sources = source1

tier1.channels = channel1

tier1.sinks = sink1

tier1.sources.source1.type = com.aweber.flume.source.rabbitmq.RabbitMQSource

tier1.sources.source1.bind = 127.0.0.1

tier1.sources.source1.port = 5672

tier1.sources.source1.virtual-host = /

tier1.sources.source1.username = guest

tier1.sources.source1.password = guest

tier1.sources.source1.queue = test

tier1.sources.source1.prefetchCount = 10

tier1.sources.source1.channels = channel1

tier1.sources.source1.threads = 2

tier1.sources.source1.interceptors = i1

tier1.sources.source1.interceptors.i1.type = org.apache.flume.interceptor.TimestampInterceptor$Builder

tier1.sources.source1.interceptors.i1.preserveExisting = true

tier1.channels.channel1.type = memory

tier1.sinks.sink1.channel = channel1

tier1.sinks.sink1.type = org.apache.flume.sink.kafka.KafkaSink

tier1.sinks.sink1.topic = flume_out

tier1.sinks.sink1.brokerList = 127.0.0.1,127.0.0.1:9093,27.0.0.1:9094

tier1.sinks.sink1.requiredAcks = 1

tier1.sinks.sink11.batchSize = 20

配置完成更新配置重新启动Agent

这个是接收到rabbitMq消息

大功告成，如果配置中有疑问的可以留言，我看到后会回复

本文链接：https://www.cnblogs.com/yihec/p/8969107.html

Flume 读取RabbitMq消息队列消息，并将消息写入kafka的更多相关文章

网站流量日志分析（数据采集之 Flume 采集）

目录网站流量日志分析的意义如何进行网站分析流量分析内容导航分析转化分析（漏斗模型分析）网站流量日志 […]...

[ETL] Flume 理论与demo（Taildir Source & Hdfs Sink）

一、Flume简介 1. Flume概述　　Flume是Cloudera提供的一个高可用的，高可靠的，分布式 […]...

Flume+Kafka+Storm+Hbase+HDSF+Poi整合

Flume+Kafka+Storm+Hbase+HDSF+Poi整合需求：针对一个网站，我们需要根据用户的 […]...

数据采集组件：Flume基础用法和Kafka集成

Flume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统，Flume支 […]...

flume-kafka-storm-hdfs-hadoop-hbase

# bigdata-test项目地址：https://github.com/windwant/bigdata- […]...

大数据之Flume

什么是Flume ApacheFlume是一个分布式的、可靠的、可用的系统，用于高效地收集、聚合和将大量来自不 […]...

flume1.9 用户指南（中文版）

...

hadoop flume

flume将所有主机hadoop的日志同步到hdfs里(4.5.7.8)flume 需要设置第四章hadoop配置文件，启动hadoop，zookeeper集群设置，hbase配置上传 flume 文件解压到/usr/loc...

随机推荐

vue-cli3脚手架的配置以及使用

Vue CLI 是一个基于 Vue.js 进行快速开发的完整系统，提供：通过 @vue/cli 搭建交互式的 […]...

5月底更新后桌面右下角出现的新闻资讯怎么删除？

5月底更新后桌面右下角出现的新闻资讯怎么删除？英文版的是News and interests ...

前端性能优化之利用 Chrome Dev Tools 进行页面性能分析

背景我们经常使用 Chrome Dev Tools 来开发调试，但是很少知道怎么利用它来分析页面性能，这篇文 […]...

计算字符个数

　　今天终于放假啦，这不，风尘仆仆地从学校回到家中，洗澡淋浴，无比酣畅，同时准备写一会儿代码，预计到薄暮时分哦 […]...

你知道CPU结构也会影响Redis性能吗？

啦啦啦，我是卖身不卖艺的二哈，ε=(´ο｀*)))唉错啦（我是开车的二哈），我又来了，铁子们一起开车呀！今天 […]...

jQuery的使用

首先百度jQuery扩展包，下载之后将里面的js，css文件全都引入到页面中就可以使用了。 <scrip […]...

ajax用法流程

这里是用javascript做的一个ajax的一个用法以及总结概括。供友友们进行参考。 1 window.on […]...

黑马程序员_Java基础视频-深入浅出精华版–视频列表

\day01\avi\01.01_计算机基础(计算机概述).avi; \day01\avi\01.02_计算机 […]...

Flume 读取RabbitMq消息队列消息，并将消息写入kafka

Flume 读取RabbitMq消息队列消息，并将消息写入kafka的更多相关文章

随机推荐

热门专题

目录导航