kafka文件存储机制

飞熊 • 2023年5月14日下午10:20 • 后端笔记 • 阅读 249

命运对每个人都是一样的，不一样的是各自的努力和付出不同，付出的越多，努力的越多，得到的回报也越多，在你累的时候请看一下身边比你成功却还比你更努力的人，这样，你就会更有动力。

导读：本篇文章讲解 kafka文件存储机制，希望对大家有帮助，欢迎收藏，转发！站点地址：www.bmabk.com，来源：原文

前言

我们知道，生产者发送给kafka的数据肯定是需要存储的，存储意味着数据落盘，但是这个数据存储的结构是怎样的呢？

不妨先来了解下kafka文件存储机制

Topic是逻辑上的概念，而partition是物理上的概念，每个partition对应于一个log文件，该log文件中存储的就是Producer生产的数据；
Producer生产的数据会被不断追加到该log文件末端，为防止log文件过大导致数据定位效率低下，Kafka采取了分片和索引机制，将每个partition分为多个segment；
每个segment包括：“.index”文件、“.log”文件和.timeindex等文件。这些文件位于一个文件夹下，该文件夹的命名规则为：topic名称+分区序号，例如：first-0；

总体的文件结构如下图所示：

对上面的文件结构再做几点补充说明：

一个partition分为多个segment
.log 日志文件 .index 偏移量

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

文章由极客之家整理，本文链接：https://www.bmabk.com/index.php/post/143306.html

赞 (0)

0 0

后端笔记

高频数据采集请求如何不影响主业务（7）【数据采集】

000406

服务端技术精选
2024年3月28日
后端笔记

【bug】解决问题：Could not GET ‘https://maven.aliyun.com/ repository/google/androidx/appcompat/ appcompat/

000210

飞熊
2023年4月6日
后端笔记

validation校验包常用校验注解@NotEmpty，@NotBlank，@NotNull等注解

000298

飞熊
2023年12月26日
后端笔记

LeetCode 10 正则表达式匹配：Java算法图解

000333

飞熊
2023年3月4日
后端笔记

mysql 中将汉字(中文)按照拼音首字母排序、数字和英文排序

000471

飞熊
2023年12月26日
后端笔记

解密HTTP错误码101：升级协议的奇妙世界

000294

飞熊
2023年12月11日
后端笔记

面试题七：重建二叉树（正式题解：给出二叉树的前序遍历序列和中序遍历序列重建出二叉树）

000203

飞熊
2023年4月6日
后端笔记

mysql中varchar和 text的区别

000287

飞熊
2023年12月11日
后端笔记

Window切换Jdk版本失败问题

000268

飞熊
2023年12月26日
后端笔记

Spring 整合Mybatis。

000201

seven_
2023年2月28日
后端笔记

MySQL：UNION的使用

000266

飞熊
2023年8月7日
后端笔记

Get 和 Post 区别与用法

000230

飞熊
2023年4月17日

发表回复

登录后才能评论

极客之家——专业性很强的中文编程技术网站，欢迎收藏到浏览器，订阅我们！