您当前位置：首页 > 互联网 > Kafka的Log存储解析

Kafka的Log存储解析

来源：程序员人生发布时间：2015-01-26 09:02:02 阅读次数：6688次

Kafka的Log存储解析

标签（空格分隔）： kafka

引言

Kafka中的Message是以topic为基本单位组织的，不同的topic之间是相互独立的。每一个topic又可以分成几个不同的partition(每一个topic有几个partition是在创建topic时指定的)，每一个partition存储1部份Message。借用官方的1张图，可以直观地看到topic和partition的关系。
Anatomy of a Topic

partition是以文件的情势存储在文件系统中，比如，创建了1个名为page_visits的topic，其有5个partition，那末在Kafka的数据目录中(由配置文件中的log.dirs指定的)中就有这样5个目录: page_visits-0， page_visits⑴，page_visits⑵，page_visits⑶，page_visits⑷，其命名规则为<topic_name>-<partition_id>，里面存储的分别就是这5个partition的数据。

接下来，本文将分析partition目录中的文件的存储格式和相干的代码所在的位置。

Partition的数据文件

Partition中的每条Message由offset来表示它在这个partition中的偏移量，这个offset不是该Message在partition数据文件中的实际存储位置，而是逻辑上1个值，它唯1肯定了partition中的1条Message。因此，可以认为offset是partition中Message的id。partition中的每条Message包括了以下3个属性：

offset
MessageSize
data

其中offset为long型，MessageSize为int32，表示data有多大，data为message的具体内容。它的格式和Kafka通讯协议中介绍的MessageSet格式是1致。

Partition的数据文件则包括了若干条上述格式的Message，按offset由小到大排列在1起。它的实现类为FileMessageSet，类图以下：
FileMessageSet类图
它的主要方法以下：

append: 把给定的ByteBufferMessageSet中的Message写入到这个数据文件中。
searchFor: 从指定的startingPosition开始搜索找到第1个Message其offset是大于或等于指定的offset，并返回其在文件中的位置Position。它的实现方式是从startingPosition开始读取12个字节，分别是当前MessageSet的offset和size。如果当前offset小于指定的offset，那末将position向后移动LogOverHead+MessageSize（其中LogOverHead为offset+messagesize，为12个字节）。
read：准确名字应当是slice，它截取其中1部份返回1个新的FileMessageSet。它不保证截取的位置数据的完全性。
sizeInBytes: 表示这个FileMessageSet占有了多少字节的空间。
truncateTo: 把这个文件截断，这个方法不保证截断位置的Message的完全性。
readInto: 从指定的相对位置开始把文件的内容读取到对应的ByteBuffer中。

我们来思考1下，如果1个partition只有1个数据文件会怎样样？

新数据是添加在文件末尾（调用FileMessageSet的append方法），不论文件数据文件有多大，这个操作永久都是O(1)的。
查找某个offset的Message（调用FileMessageSet的searchFor方法）是顺序查找的。因此，如果数据文件很大的话，查找的效力就低。

那Kafka是如何解决查找效力的的问题呢？有两大宝贝：1) 分段 2) 索引。

数据文件的分段

Kafka解决查询效力的手段之1是将数据文件分段，比如有100条Message，它们的offset是从0到99。假定将数据文件分成5段，第1段为0⑴9，第2段为20⑶9，以此类推，每段放在1个单独的数据文件里面，数据文件以该段中最小的offset命名。这样在查找指定offset的Message的时候，用2分查找就能够定位到该Message在哪一个段中。

为数据文件建索引

数据文件分段使得可以在1个较小的数据文件中查找对应offset的Message了，但是这仍然需要顺序扫描才能找到对应offset的Message。为了进1步提高查找的效力，Kafka为每一个分段后的数据文件建立了索引文件，文件名与数据文件的名字是1样的，只是文件扩大名为.index。
索引文件中包括若干个索引条目，每一个条目表示数据文件中1条Message的索引。索引包括两个部份（均为4个字节的数字），分别为相对offset和position。

相对offset：由于数据文件分段以后，每一个数据文件的起始offset不为0，相对offset表示这条Message相对其所属数据文件中最小的offset的大小。举例，分段后的1个数据文件的offset是从20开始，那末offset为25的Message在index文件中的相对offset就是25⑵0 = 5。存储相对offset可以减小索引文件占用的空间。
position，表示该条Message在数据文件中的绝对位置。只要打开文件并移动文件指针到这个position就能够读取对应的Message了。

index文件中并没有为数据文件中的每条Message建立索引，而是采取了稀疏存储的方式，每隔1定字节的数据建立1条索引。这样避免了索引文件占用过量的空间，从而可以将索引文件保存在内存中。但缺点是没有建立索引的Message也不能1次定位到其在数据文件的位置，从而需要做1次顺序扫描，但是这次顺序扫描的范围就很小了。

在Kafka中，索引文件的实现类为OffsetIndex，它的类图以下：
OffsetIndex类图

主要的方法有：

append方法，添加1对offset和position到index文件中，这里的offset将会被转成相对的offset。
lookup, 用2分查找的方式去查找小于或等于给定offset的最大的那个offset

小结

我们以几张图来总结1下Message是如何在Kafka中存储的，和如何查找指定offset的Message的。

Message是依照topic来组织，每一个topic可以分成多个的partition，比如：有5个partition的名为为page_visits的topic的目录结构为：
topic_partition

partition是分段的，每一个段叫LogSegment，包括了1个数据文件和1个索引文件，下图是某个partition目录下的文件：

可以看到，这个partition有4个LogSegment。

借用博主@lizhitao博客上的1张图来展现是如何查找Message的。
search
比如：要查找绝对offset为7的Message：

首先是用2分查找肯定它是在哪一个LogSegment中，自然是在第1个Segment中。
打开这个Segment的index文件，也是用2分查找找到offset小于或等于指定offset的索引条目中最大的那个offset。自然offset为6的那个索引是我们要找的，通过索引文件我们知道offset为6的Message在数据文件中的位置为9807。
打开数据文件，从位置为9807的那个地方开始顺序扫描直到找到offset为7的那条Message。

这套机制是建立在offset是有序的。索引文件被映照到内存中，所以查找的速度还是很快的。

1句话，Kafka的Message存储采取了分区(partition)，分段(LogSegment)和稀疏索引这几个手段来到达了高效性。

生活不易，码农辛苦
如果您觉得本网站对您的学习有所帮助,可以手机扫描二维码进行捐赠
程序员人生

------分隔线----------------------------

上一篇 Hibernate（二）hibernate原理简单实现对比JDBC

下一篇 netsh命令解决网络切换问题

分享到:

------分隔线----------------------------

为码而活

积分：4237

15粉丝

7关注

栏目热点