Kafka多少算高并发(看这篇就够了)

高并发是大型架构核心,下面我详解Kafka高并发@mikechen

高并发

在分布式系统中,高并发通常指系统能同时处理大量请求的能力。

Kafka多少算高并发(看这篇就够了)

并发不是指单线程速度快,而是在单位时间内能同时处理多少个请求。

常见的几个衡量指标:

指标 含义
QPS(Query Per Second) 每秒请求数
TPS(Transaction Per Second) 每秒事务数
吞吐量(Throughput) 系统每秒能处理的数据量(MB/s、GB/s)
延迟(Latency) 请求从发出到响应的耗时

 

Kafka多少算高并发

一般来说:

单机写入超 10 万条/s 已属高并发;

集群吞吐超过 百万条/秒,属于典型的“高并发Kafka场景”。

Kafka多少算高并发(看这篇就够了)

不同部署规模下的性能差异如下:

规模 场景 并发性能参考
单机(1 Broker) 本地开发/测试 5~10万条/秒
小集群(3 Broker) 中小型业务 30~50万条/秒
中型集群(6~10 Broker) 电商/日志场景 100~300万条/秒
大型集群(20+ Broker) 大型互联网场景 500万~千万级 TPS

Broker层高并发配置

Broker层优化:并行与IO吞吐。

Kafka多少算高并发(看这篇就够了)

分区数(partitions)增加:更多分区 = 更多并行线程写入。

磁盘顺序写:Kafka通过page cache + zero copy实现接近磁盘极限吞吐。

Batch 批量写入:通过参数batch.sizelinger.ms合并请求提升写入效率。

I/O 优化:开启num.io.threadsnum.network.threads提升并行度。

 

2. Broker水平扩容

Broker水平扩容:通过扩容节点分散写入压力。

Kafka多少算高并发(看这篇就够了)

log.dirs=/data1/kafka,/data2/kafka,/data3/kafka

多磁盘分区存储:多路径配置提升IO性能。

 

3. 网络与批量传输

启用异步批量发送:

acks=1
linger.ms=10
batch.size=32768
compression.type=lz4

 

4. 零拷贝

确保操作系统支持并启用零拷贝(sendfile),这是 Kafka 高吞吐量的核心技术之一。

Kafka多少算高并发(看这篇就够了)

陈睿mikechen

10年+大厂架构经验,资深技术专家,就职于阿里巴巴、淘宝、百度等一线互联网大厂。

关注作者「mikechen」公众号,获取更多技术干货!

后台回复架构,即可获取《阿里架构师进阶专题全部合集》,后台回复面试即可获取《史上最全阿里Java面试题总结

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧