Buffer-tree 也称为COLA,即cache-oblivious,可以不需要知道具体内存大小和一个块的大小,使用一套逻辑进行处理,因此内存大小可知,内存可能被临时占用去做其它事情。
Buffer-tree典型的实现是TokuDB,在里面被称为Fractal-tree。
其算法的基本过程为:
3. 如果再写入一个值“11”,因为第一行已经写满,所以将“3”取出,和“11”排序,尝试写入第二行。又因为第二行也定满了,所以将第二行取出,对“3”,“11”,“5”,“10”进行排序,写入第四行。结果如下图所示。
从上面操作过程可知,Buffer-tree与LSM的思想类似,每次将数据从上一层取出,与外部数据进行归并后写入新的队列中。这对SAS磁盘非常友好,对磁盘的写入性能有很大的提升。
为了提高查询速度,在合并的时候,上层需要持有下层数据的指针。因此最后的结构如下图:
关于B-tree,Append-file,Buffer-tree三种读写方式的算法复杂度为:
举例说明损耗:
对于100W 个128字节。N = 2^30;log(N) = 30;
磁盘中1MB数据块有8192个数据,B = 8192;logB = 13;
结论:Buffer-tree对IO的使用远远小于B树。
原文:http://www.cnblogs.com/sinaxyz/p/4201328.html