Kafka (快速)安装部署

2024-09-08 11:28
文章标签 部署 安装 快速 kafka

本文主要是介绍Kafka (快速)安装部署,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 1、软件下载&配置环境
    • 1_JDK安装
    • 2_Zookeeper安装
    • 3_Kafka安装
  • 2、单机安装
    • 1_配置主机名和IP映射
    • 2_单机Kafka配置
  • 3、集群安装
    • 1_配置主机名和IP的映射关系
    • 2_时钟同步
    • 3_Zookeeper配置信息
    • 4_集群Kafka配置
  • 4、kafka的其他脚本命令

1、软件下载&配置环境

下面的操作无论是单机部署还是分布式集群环境下都是通用的。

准备好安装的目录,我们将所有软件安装包统一上传至/export/software目录下,下载完毕后软件解压至/export/server

mkdir -p /export/server /export/software

1_JDK安装

下载地址:https://www.oracle.com/java/technologies/downloads/

在这里插入图片描述

下载并上传至服务器对应的目录中。

解压缩JDK安装文件:

tar -zxvf jdk-8u421-linux-x64.tar.gz -C /export/server

配置JDK的软链接:

ln -s /export/server/jdk-8u421-linux-x64.tar.gz jdk

配置JAVA_HOME环境变量,以及将$JAVA_HOME/bin文件夹加入PATH环境变量中

 vim /etc/profile

尾部添加如下:

export JAVA_HOME=/export/server/jdk
export PATH=$PATH:$JAVA_HOME/bin

生效环境变量:

source /etc/profile

有些安装的系统可能自带jdk,但是这种jdk可以使用java -version检查,但如果使用javac就不行了,最好进行卸载。

如果是 yum 安装,可以按照下述流程卸载:

#1.查看CentOS自带JDK是否已安装yum list installed | grep java
#2.假使存在自带的jdk,删除centos自带的JDKyum -y remove java-1.8.0-openjdk*
yum -y remove tzdata-java.noarch
#删除系统自带的Java程序
rm -f /usr/bin/java
#软连接我们自己安装的Java程序
ln -s /export/server/jdk/bin/java /usr/bin/java

rpm安装,可以按照下述流程卸载:

rpm -qa | grep jdk #查看是否存在安装的jdk
rpm -e `rpm -qa | grep jdk` # 卸载,如果存在依赖的情况可以使用下方的强制卸载
rpm -e --nodeps `rpm -qa | grep jdk` # 强制删除jdk

2_Zookeeper安装

下载地址:https://zookeeper.apache.org/releases.html#download

在这里插入图片描述

选择历史版本——本次选择3.5.7进行安装下载

在这里插入图片描述
在这里插入图片描述

下载完成后,上传到服务器后进行解压:

tar -zxvf apache-zookeeper-3.5.7-bin.tar.gz -C /export/server

配置 Zookeeper 的软链接:

ln -s apache-zookeeper-3.5.7-bin zookeeper

配置 ZK_HOME 环境变量,以及将$ZK_HOME/bin文件夹加入PATH环境变量中

 vim /etc/profile

尾部添加如下:

export ZK_HOME=/export/server/zookeeper
export PATH=$PATH:$ZK_HOME/bin

生效环境变量:

source /etc/profile

Zookeeper的下载和安装已经完成,我们接下来直接对其配置进行修改:

cd /export/server/zookeeper/conf #进入zookeeper配置文件目录下
cp zoo_sample.cfg zoo.cfg #将Zookeeper提供的配置文件复制一份,复制成Zookeeper默认寻找的文件

进入 zookeeper 目录下,创建数据存放的目录:

cd /export/server/zookeeper
mkdir data

修改 zookeeper 配置文件,将数据存放目录指定为我们创建的目录:

vim /export/server/zookeeper/conf/zoo.cfg
##修改以下配置
dataDir=/export/server/zookeeper/data

启动 Zookeeper,在其bin目录下为我们提供了服务脚本:

#./zkServer.sh [--config <conf-dir>] {start|start-foreground|stop|restart|status|print-cmd}
./bin/zkServer.sh start zoo.cfg #启动

查看是否启动成功

jps # 看到控制台成功输出 QuorumPeerMain,表示启动成功

使用jps发现Zookeeper成功启动了,也并不代表我们可以正常使用了,使用如下命了查看其状态:

./bin/zkServer.sh status zoo.cfg ## Mode: standalone表示ok

控制台打印 Mode: standalone 表示可以正常使用了。

3_Kafka安装

下载地址:https://kafka.apache.org/downloads。

在这里插入图片描述

选择 kafka_2.12-3.8.0.tgz 进行下载,Scala 2.12 和 Scala 2.13 主要是使用Scala编译的版本不同,两者皆可。

下载完成后,上传到服务器后进行解压:

tar -zxvf kafka_2.12-3.8.0.tgz -C /export/server

配置 Kafka 的软链接:

ln -s kafka_2.12-3.8.0.tgz kafka

配置 KAFKA_HOME 环境变量,以及将$KAFKA_HOME/bin文件夹加入PATH环境变量中

 vim /etc/profile

尾部添加如下:

export KAFKA_HOME=/export/server/kafka
export PATH=:$PATH:${KAFKA_HOME}

生效环境变量:

source /etc/profile

2、单机安装

Kafka一般情况下都是分布式架构的,单机节点的使用情况基本不存在——了解即可。

按照以下步骤执行:

  • 安装JDK1.8+,配置JAVA_HOME (CentOS 64bit)
  • 配置主机名和IP映射
  • 关闭防火墙 | 防火墙开机自启动
  • 安装&启动Zookeeper
  • 安装&启动|关闭Kafka

上述有些步骤部分已经完成,不再重复叙述。

1_配置主机名和IP映射

配置主机名——我是用的是SHENYANG,替换成自己的即可:

echo HOSTNAME=SHENYANG >> /etc/sysconfig/network
cat /etc/sysconfig/network
reboot #重启生效

如果上述方式不成功可以试试下面这种:

hostnamectl set-hostname SHENYANG

配置主机名和IP的映射关系——使用自己当前服务器的主机名和IP:

vi /etc/hosts
192.168.193.141 SHENYANG
ping SHENYANG #测试是否ok

如果在内网测试环境下最好关闭防火墙。

2_单机Kafka配置

在Kafka的config目录下存在相关的配置信息——本次我们只想让Kafka快速启动起来只关注server.properties文件即可:

cd ${KAFKA_HOME}/config
ls
#connect-console-sink.properties    connect-file-source.properties   consumer.properties  server.properties
#connect-console-source.properties  connect-log4j.properties         kraft                tools-log4j.properties
#connect-distributed.properties     connect-mirror-maker.properties  log4j.properties     trogdor.conf
#connect-file-sink.properties       connect-standalone.properties    producer.properties  zookeeper.properties

打开配置文件,并主要注意以下几个配置:

vim server.propertiesbroker.id=0 #kafka服务节点的唯一标识,这里是单机不用修改
#     listeners = PLAINTEXT://your.host.name:9092  别忘了设置成自己的主机名
listeners=PLAINTEXT://SHENYANG:9092 #kafka底层监听的服务地址,注意是使用主机名,不是ip。
# log.dirs 指定的目录 kafka启动时可以自动创建,因此不要忘了让kafka可以有读写这个目录的权限。
log.dirs=/export/server/kafka/data ##kafka的分区以日志的形式存储在集群中(其实就是broker数据存储的目录)
# The minimum age of a log file to be eligible for deletion due to age
log.retention.hours=168 #日志的留存策略,默认168小时也就是一周
# zookeeper 的连接地址 ,别忘了设置成自己的主机名,单机情况下可以使用 localhost
zookeeper.connect=SHENYANG:2181

上述配置完成后就可以在单机环境下成功启动 Kafka了。

./bin/kafka-server-start.sh -daemon config/server.properties #后台启动kafka

使用 jps 查看是否成功启动kafka:

jps
34843 QuorumPeerMain
21756 Jps
116076 Kafka

单机启动完成。

3、集群安装

Kafka 集群模式是kafka最常见的使用架构,按照以下步骤执行:

  • 安装JDK1.8+,配置JAVA_HOME (CentOS 64bit)

  • 配置主机名和IP映射

  • 关闭防火墙 | 防火墙开机自启动

  • 同步时钟 ntpdate cn.pool.ntp.org | ntp[1-7].aliyun.com

  • 安装&启动Zookeeper

  • 安装&启动|关闭Kafka

本次使用三个节点模拟集群环境:CentOSA、CentOSB、CentOSC。

针对每个节点修改主机名称,查看当前主机的ip地址并固定,添加子网掩码,网关,DNS1。

#修改主机名
hostnamectl set-hostname node1
#修改IP地址
vim /etc/sysconfig/network-scripts/ifcfg-ens33#不要直接copy,针对自己的进行修改
TYPE="Ethernet"
PROXY_METHOD="none"
BROWSER_ONLY="no"
BOOTPROTO="static"
DEFROUTE="yes"
IPV4_FAILURE_FATAL="no"
IPV6INIT="yes"
IPV6_AUTOCONF="yes"
IPV6_DEFROUTE="yes"
IPV6_FAILURE_FATAL="no"
IPV6_ADDR_GEN_MODE="stable-privacy"
NAME="ens33"
UUID="0d7ad579-b7c8-4b92-a94c-00633288d421"
DEVICE="ens33"
ONBOOT="yes"
IPADDR="192.168.193.151"
NETMASK="255.255.255.0"
GETEWAY="192.168.193.2"
DNS1="192.168.193.2"

按照第一节,每个节点都将软件下载并配置好环境变量和配置信息。

1_配置主机名和IP的映射关系

针对每一个节点的hosts文件添加节点的ip映射信息:

vim  /etc/hosts
192.168.193.141 CentOSA
192.168.193.142 CentOSB
192.168.193.143 CentOSC
ping #测试

也可以采取修改一个主机的hosts文件,通过 scp的方式进行拷贝——比如在CentOSA节点修改完成后执行:

scp /etc/hosts CentOSB:/etc/
scp /etc/hosts CentOSC:/etc/

别忘了在自行测试时关闭防火墙。

2_时钟同步

因为是在集群环境下,所以不要忘记同步三个主机节点的时钟:

yum install ntp -y
ntpdate cn.pool.ntp.org | ntp[1-7].aliyun.com #两个时钟同步地址选择一个就行

3_Zookeeper配置信息

在第一节中我们编辑了 zoo.cfg 文件配置,但是如果是集群环境下,还需要添加服务节点的信息:

vim /export/server/zookeeper/conf/zoo.cfg
##额外添加以下配置
server.1=CentOSA:2888:3888 #数据同步端口:领导选举时服务器监听的端口
server.2=CentOSB:2888:3888
server.3=CentOSC:2888:3888

配置完成后通过scp命令将配置文件拷贝到其他节点——假设当前配置的是A节点:

scp -r /export/server/zookeeper/conf/zoo.cfg CentOSB:/export/server/zookeeper/conf/
scp -r /export/server/zookeeper/conf/zoo.cfg CentOSC:/export/server/zookeeper/conf/

当然,也可以只安装并配置一台zookeeper,然后将整个软件拷贝过去。

接下来我们还需要在每个 zookeeper 节点的数据目录下创建对应的服务id文件与上面配置的server.id进行绑定:

# A
echo 1 > /export/server/zookeeper/data/myid #在这个文件中写入自己服务的id号
# B
echo 2 > /export/server/zookeeper/data/myid
# C
echo 3 > /export/server/zookeeper/data/myid

接下来启动所有的zookeeper节点。别忘了关防火墙!

4_集群Kafka配置

集群的 server.properties配置文件与单机的有所不同:

cd ${KAFKA_HOME}/config
vim server.propertiesbroker.id=0 #kafka服务节点的唯一标识 A 0,B 1,C 2
#     listeners = PLAINTEXT://your.host.name:9092  别忘了设置成自己的主机名
listeners=PLAINTEXT://CentOSA:9092 #集群中需要设置成每个节点自己的
# log.dirs 指定的目录 kafka启动时可以自动创建,因此不要忘了让kafka可以有读写这个目录的权限。
log.dirs=/export/server/kafka/data ##kafka的分区以日志的形式存储在集群中(其实就是broker数据存储的目录)
# The minimum age of a log file to be eligible for deletion due to age
log.retention.hours=168 #日志的留存策略,默认168小时也就是一周
# zookeeper 集群的连接地址 
zookeeper.connect=CentOSA:2181,CentOSB:2181,CentOSC:2181

在配置完成 A节点后,还是使用 scp命令进行传输配置文件,然后再修改broker.idlisteners

scp -r /export/server/kafka/config/server.properties CentOSB:/export/server/kafka/config/
scp -r /export/server/kafka/config/server.properties CentOSC:/export/server/kafka/config/##修改差异配置
cd ${KAFKA_HOME}/config
vim server.properties# B节点
broker.id=1
listeners=PLAINTEXT://CentOSB:9092
# C节点
broker.id=2
listeners=PLAINTEXT://CentOSC:9092

配置完成后,kafka集群即可正常启动。集群的配置和单机的配置基本相似。

4、kafka的其他脚本命令

kafka服务还提供了除了启动外的其他命令:

./bin/kafka-server-stop.sh #关闭kafka
kafka-console-consumer.sh #消费命令
kafka-console-producer.sh #生产命令
kafka-consumer-groups.sh #查看消费者组,重置消费位点等
kafka-topics.sh #查询topic状态,新建,删除,扩容
kafka-acls.sh #配置,查看kafka集群鉴权信息
kafka-configs.sh #查看,修改kafka配置
kafka-mirror-maker.sh #kafka集群间同步命令
kafka-preferred-replica-election.sh #重新选举topic分区leader
kafka-producer-perf-test.sh #kafka自带生产性能测试命令
kafka-reassign-partitions.sh #kafka数据重平衡命令
kafka-run-class.sh #kafka执行脚本

重点关注前面几个,消费者,生产、消费者组和Topic管理:

创建Topic;

#副本因子数不能大于broker数,如果同一台机器上存储了多个备份就多余了
./bin/kafka-topics.sh --bootstrap-server CentOSA:9092,CentOSB:9092,CentOSC:9092 --create --topic topic02 --partitions 3 --replication-factor 3 

查看:

./bin/kafka-topics.sh --bootstrap-server CentOSA:9092,CentOSB:9092,CentOSC:9092 --list

详情:

./bin/kafka-topics.sh  --bootstrap-server CentOSA:9092,CentOSB:9092,CentOSC:9092 --describe --topic topic01
Topic:topic01	PartitionCount:3	ReplicationFactor:3	Configs:segment.bytes=1073741824Topic: topic01	Partition: 0	Leader: 0	Replicas: 0,2,3	Isr: 0,2,3Topic: topic01	Partition: 1	Leader: 2	Replicas: 2,3,0	Isr: 2,3,0Topic: topic01	Partition: 2	Leader: 0	Replicas: 3,0,2	Isr: 0,2,3

修改:

./bin/kafka-topics.sh --bootstrap-server CentOSA:9092,CentOSB:9092,CentOSC:9092 --alter --topic topic01 --partitions 2

删除:

./bin/kafka-topics.sh --bootstrap-server CentOSA:9092,CentOSB:9092,CentOSC:9092 --delete --topic topic03

消费者订阅:

# 别忘了指定消费者组
./bin/kafka-console-consumer.sh --bootstrap-server CentOSA:9092,CentOSB:9092,CentOSC:9092 --topic topic01 --group g1 --property print.key=true --property print.value=true --property key.separator=,

生产:

./bin/kafka-console-producer.sh --broker-list CentOSA:9092,CentOSB:9092,CentOSC:9092 --topic topic01

消费组:

 ./bin/kafka-consumer-groups.sh --bootstrap-server CentOSA:9092,CentOSB:9092,CentOSC:9092 --list g1./bin/kafka-consumer-groups.sh --bootstrap-server CentOSA:9092,CentOSB:9092,CentOSC:9092 --describe --group g1TOPIC PARTITION CURRENT-OFFSET LOG-END-OFFSET LAG CONSUMER-ID    HOST            CLIENT-ID
topic01 1                      0                    0                           0     consumer-1-**    /192.168.52.130 consumer-1
topic01 0                      0                    0                          0      consumer-1-**   /192.168.52.130 consumer-1
topic01 2                      1                     1                          0      consumer-1-**   /192.168.52.130 consumer-1

这篇关于Kafka (快速)安装部署的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1147982

相关文章

RabbitMQ 延时队列插件安装与使用示例详解(基于 Delayed Message Plugin)

《RabbitMQ延时队列插件安装与使用示例详解(基于DelayedMessagePlugin)》本文详解RabbitMQ通过安装rabbitmq_delayed_message_exchan... 目录 一、什么是 RabbitMQ 延时队列? 二、安装前准备✅ RabbitMQ 环境要求 三、安装延时队

redis-sentinel基础概念及部署流程

《redis-sentinel基础概念及部署流程》RedisSentinel是Redis的高可用解决方案,通过监控主从节点、自动故障转移、通知机制及配置提供,实现集群故障恢复与服务持续可用,核心组件包... 目录一. 引言二. 核心功能三. 核心组件四. 故障转移流程五. 服务部署六. sentinel部署

Java Kafka消费者实现过程

《JavaKafka消费者实现过程》Kafka消费者通过KafkaConsumer类实现,核心机制包括偏移量管理、消费者组协调、批量拉取消息及多线程处理,手动提交offset确保数据可靠性,自动提交... 目录基础KafkaConsumer类分析关键代码与核心算法2.1 订阅与分区分配2.2 拉取消息2.3

linux系统上安装JDK8全过程

《linux系统上安装JDK8全过程》文章介绍安装JDK的必要性及Linux下JDK8的安装步骤,包括卸载旧版本、下载解压、配置环境变量等,强调开发需JDK,运行可选JRE,现JDK已集成JRE... 目录为什么要安装jdk?1.查看linux系统是否有自带的jdk:2.下载jdk压缩包2.解压3.配置环境

Python多线程实现大文件快速下载的代码实现

《Python多线程实现大文件快速下载的代码实现》在互联网时代,文件下载是日常操作之一,尤其是大文件,然而,网络条件不稳定或带宽有限时,下载速度会变得很慢,本文将介绍如何使用Python实现多线程下载... 目录引言一、多线程下载原理二、python实现多线程下载代码说明:三、实战案例四、注意事项五、总结引

Python利用PySpark和Kafka实现流处理引擎构建指南

《Python利用PySpark和Kafka实现流处理引擎构建指南》本文将深入解剖基于Python的实时处理黄金组合:Kafka(分布式消息队列)与PySpark(分布式计算引擎)的化学反应,并构建一... 目录引言:数据洪流时代的生存法则第一章 Kafka:数据世界的中央神经系统消息引擎核心设计哲学高吞吐

C#使用Spire.XLS快速生成多表格Excel文件

《C#使用Spire.XLS快速生成多表格Excel文件》在日常开发中,我们经常需要将业务数据导出为结构清晰的Excel文件,本文将手把手教你使用Spire.XLS这个强大的.NET组件,只需几行C#... 目录一、Spire.XLS核心优势清单1.1 性能碾压:从3秒到0.5秒的质变1.2 批量操作的优雅

Python库 Django 的简介、安装、用法入门教程

《Python库Django的简介、安装、用法入门教程》Django是Python最流行的Web框架之一,它帮助开发者快速、高效地构建功能强大的Web应用程序,接下来我们将从简介、安装到用法详解,... 目录一、Django 简介 二、Django 的安装教程 1. 创建虚拟环境2. 安装Django三、创

linux安装、更新、卸载anaconda实践

《linux安装、更新、卸载anaconda实践》Anaconda是基于conda的科学计算环境,集成1400+包及依赖,安装需下载脚本、接受协议、设置路径、配置环境变量,更新与卸载通过conda命令... 目录随意找一个目录下载安装脚本检查许可证协议,ENTER就可以安装完毕之后激活anaconda安装更

Jenkins的安装与简单配置过程

《Jenkins的安装与简单配置过程》本文简述Jenkins在CentOS7.3上安装流程,包括Java环境配置、RPM包安装、修改JENKINS_HOME路径及权限、启动服务、插件安装与系统管理设置... 目录www.chinasem.cnJenkins安装访问并配置JenkinsJenkins配置邮件通知