基于Centos7xELK+Kafka集群部署方案
本次集群部署使用ELK版本统一为6.8.10,kafka为2.12-2.51 均可在官网下载
elasticsearch下载地址:https://www.elastic.co/cn/downloads/elasticsearch
logstash下载地址:https://www.elastic.co/cn/downloads/logstash
kibana下载地址:https://www.elastic.co/cn/downloads/kibana
kafka下载地址:http://kafka.apache.org/downloads
整体流程如下图 仅供参考 可根据需求调整
一、elasticsearch安装
(1) 准备部署包并解压到/usr/local 下并解压
• tar -zxf elasticsearch-6.8.10.tar.gz
• tar -zxf kibana-6.8.10-linux-x86_64.tar.gz
• tar -zxf logstash-6.8.10.tar.gz
(2) 由于elasticsearch启动的时候不能直接用root用户启动,所以需要创建普通用户
useradd elk
chown -R elk:elk elasticsearch-6.8.10
chown -R elk:elk kibana-6.8.10-linux-x86_64
chown -R elk:elk logstash-6.8.10
(3)启动前的配置工作防止启动报错
修改操作系统的内核配置文件:vim /etc/sysctl.conf
新增:vm.max_map_count=655360
vim /etc/security/limits.conf
新增:* soft nofile 65536
* hard nofile 65536
* soft nproc 4096
* hard nproc 4096
执行 sysctl -p 使配置生效
(4) 配置elasticsearch 配置文件elasticsearch.yml
network.host192.168.220.132
(5) 启动
./bin/elasticsearch
#后台启动
./bin/elasticsearch -d
(6)查看是否启动成功
ps aux|grep elasticsearch
# 关闭es(kill + 进程号)
kill 99089
(7) 如上操作复制到192.168.220.131将配置文件elasticsearch.yml中 node.name: node-1改为
node.name
二、kibana安装
(1) 配置kibana配置文件kibana.yml
vi kibana.yml
修改
elasticsearch.hosts
(2) 启动Kibana
# 查看kibana是否启动成功
fuser -n tcp 5601
# 关闭kibana
kill 线程号
# 启动kibana
./bin/kibana
# 后台启动
nohup ./bin/kibana &
三、logstash安装
(1) 配置logstash配置文件logstash.yml
vi logstash.yml
(2) /config目录下新增文件logstash.conf
cp logstash-sample.conf logstash.conf
input {
kafka {
bootstrap_servers => "192.168.220.131:9092,192.168.220.132:9092"
topics => ["qlz-test","qlz-test1"]
group_id => "logstash-file"
codec => "json"
}
}
output {
elasticsearch {
hosts => ["http://192.168.220.131:9200"]
index => "elasticsearch-test"
}
}
(3)启动logstash
bin/logstash -f config/logstash.conf
#后台启动
nohup bin/logstash -f config/logstash.conf &
#查看后台启动日志
tail -f nohup.out
#查看是否启动成功
ps aux|grep logstash
四、kafka集群安装
准备kafka_2.12-2.5.1.tgz安装包并解压到/usr/local下
tar -zxf kafka_2.12-2.5.1.tgz
在搭建kafka集群之前需要提前安装zookeeper集群,kafka压缩包只带zookeeper程序,只需要解压配置即可使用
(1) 修改配置文件zookeeper配置文件
vi zookeeper.properties
#数据路径
dataDir=/data/zookeeper
# the port at which the clients will connect
clientPort=2181
# disable the per-ip limit on the number of connections since this is a non-production config
maxClientCnxns=0
#tickTime : 这个时间是作为 Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个 tickTime 时间就会发送一个心跳。
tickTime=2000
# 集群模式下,follower机器启动,需要从Leader上同步最新数据,来确定自身服务新状态,同步需要在initLimit内完成。即同步时间为10*2000=20s(initLimit*tickTime)
initLimit=20
# 集群模式下,Leader需要与集群中的其他机器Follower进行通信,则通过心跳机制来检测Follower状态,如果超过心跳间隔syncLimit,则表示Follower下线。心跳时间间隔为5*2000=10s(syncLimit*tickTime)
syncLimit=10
#2888 端口:表示的是这个服务器与集群中的 Leader 服务器交换信息的端口;
#3888 端口:表示的是万一集群中的 Leader 服务器挂了,需要一个端口来重新进行选举,选出一个新的 Leader ,而这个端口就是用来执行选举时服务器相互通信的端口
server.1=192.168.220.131:2888:3888
server.2=192.168.220.132:2888:3888
创建数据目录并创建myid文件,文件为数字,用于标识唯一主机,必须有这个文件否则zookeeper无法启动
mkdir /data/zookeeper -p
echo 1 >/data/zookeeper/myid
(2) 修改kafka配置文件
vi server.properties
#唯一数字分别为1,2
broker.id=1
#这个broker监听的端口
prot=9092
#唯一填服务器IP
host.name=192.168.220.131
num.network.threads=3
num.io.threads=8
socket.send.buffer.bytes=102400
socket.receive.buffer.bytes=102400
socket.request.max.bytes=104857600
#kafka日志路径,不需要提前创建,启动kafka时创建
log.dirs=/data/kafka-logs
#分片数,需要配置较大,分片影响读写速度
num.partitions=16
num.recovery.threads.per.data.dir=1
offsets.topic.replication.factor=1
transaction.state.log.replication.factor=1
transaction.state.log.min.isr=1
log.retention.hours=168
log.segment.bytes=1073741824
log.retention.check.interval.ms=300000
#zookpeer集群
zookeeper.connect=192.168.220.131:2181,192.168.220.132:2181
zookeeper.connection.timeout.ms=6000
group.initial.rebalance.delay.ms=0
把配置拷贝至其他kafka主机,zookeeper.properties配置一样 ,server.properties配置一下两处不一样,myid也不一样
broker.id=2
host.name=192.168.220.132
(3) 启动zookeeper顺序为服务器1 2
/usr/local/kafka_2.12-2.5.1/bin/zookeeper-server-start.sh /usr/local/kafka_2.12-2.5.1/config/zookeeper.properties
#后台启动
/usr/local/kafka_2.12-2.5.1/bin/zookeeper-server-start.sh -daemon /usr/local/kafka_2.12-2.5.1/config/zookeeper.properties
启动过程中提示拒绝连接不用理会,由于zookeeper集群在启动的时候,每个结点都试图去连接集群中的其它结点,先启动的肯定连不上后面还没启动的,所以上面日志前面部分的异常是可以忽略的。通过后面部分可以看到,集群在选出一个Leader后,最后稳定了。其他节点也可能会出现类似的情况,属于正常
检测是否启动
netstat -ntalp|grep -E "2181|2888|3888"
(4) 启动kafka
/usr/local/kafka_2.12-2.5.1/bin/kafka-server-start.sh /usr/local/kafka_2.12-2.5.1/config/server.properties
#后台启动
/usr/local/kafka_2.12-2.5.1/bin/kafka-server-start.sh -daemon /usr/local/kafka_2.12-2.5.1/config/server.properties
(5) 测试
在kafka01创建一个主题,主题名为qlz-test
./kafka-topics.sh --create --zookeeper 192.168.220.131:2181 --replication-factor 3 --partitions 1 --topic qlz-test
查看主题
# 查看所有主题
./kafka-topics.sh --list --zookeeper 192.168.220.131:2181
# 查看qlz-test主题详情
./kafka-topics.sh --describe --zookeeper 192.168.220.131:2181 --topic qlz-test
Topic: qlz-test PartitionCount: 1 ReplicationFactor: 2 Configs:
Topic: qlz-test Partition: 0 Leader: 1 Replicas: 1,2 Isr: 1,2
#主题名称:qlz-test
#Partition:只有一个从0开始
#leader:id为1的broker
#Replicas: 副本存在id为 1 2的上面
#Isr:活跃状态的broker
删除主题
./kafka-topics.sh --delete --zookeeper 192.168.220.131:2181 --topic qlz-test
使用kafka01发送消息,这里是生产者角色
./kafka-console-producer.sh --broker-list 192.168.220.131:9092 --topic qlz-test
出现命令行需要手动输入消息
使用kafka02接收消息,这里是消费者角色
./kafka-console-consumer.sh --bootstrap-server 192.168.220.131:9092 --topic qlz-test --from-beginning