高并发是大型架构核心,下面我详解Kafka高并发@mikechen
高并发
在分布式系统中,高并发通常指系统能同时处理大量请求的能力。

并发不是指单线程速度快,而是在单位时间内能同时处理多少个请求。
常见的几个衡量指标:
| 指标 | 含义 |
|---|---|
| QPS(Query Per Second) | 每秒请求数 |
| TPS(Transaction Per Second) | 每秒事务数 |
| 吞吐量(Throughput) | 系统每秒能处理的数据量(MB/s、GB/s) |
| 延迟(Latency) | 请求从发出到响应的耗时 |
Kafka多少算高并发
一般来说:
单机写入超 10 万条/s 已属高并发;
集群吞吐超过 百万条/秒,属于典型的“高并发Kafka场景”。

不同部署规模下的性能差异如下:
| 规模 | 场景 | 并发性能参考 |
|---|---|---|
| 单机(1 Broker) | 本地开发/测试 | 5~10万条/秒 |
| 小集群(3 Broker) | 中小型业务 | 30~50万条/秒 |
| 中型集群(6~10 Broker) | 电商/日志场景 | 100~300万条/秒 |
| 大型集群(20+ Broker) | 大型互联网场景 | 500万~千万级 TPS |
Broker层高并发配置
Broker层优化:并行与IO吞吐。

分区数(partitions)增加:更多分区 = 更多并行线程写入。
磁盘顺序写:Kafka通过page cache + zero copy实现接近磁盘极限吞吐。
Batch 批量写入:通过参数batch.size、linger.ms合并请求提升写入效率。
I/O 优化:开启num.io.threads、num.network.threads提升并行度。
2. Broker水平扩容
Broker水平扩容:通过扩容节点分散写入压力。

log.dirs=/data1/kafka,/data2/kafka,/data3/kafka
多磁盘分区存储:多路径配置提升IO性能。
3. 网络与批量传输
启用异步批量发送:
acks=1 linger.ms=10 batch.size=32768 compression.type=lz4
4. 零拷贝
确保操作系统支持并启用零拷贝(sendfile),这是 Kafka 高吞吐量的核心技术之一。

陈睿mikechen
10年+大厂架构经验,资深技术专家,就职于阿里巴巴、淘宝、百度等一线互联网大厂。
关注作者「mikechen」公众号,获取更多技术干货!
后台回复【架构】,即可获取《阿里架构师进阶专题全部合集》,后台回复【面试】即可获取《史上最全阿里Java面试题总结》