AeroSpike 是一个基于Hash的NoSQL,本质上是一个KV存储系统
最简单的理解就是内存中存放了一个红黑树,红黑树里面存放的是索引,索引里面存放的是hash之后的值以及数据存放的位置
索引中不会存放Key的值,而是存放一个hash值(通过key+set计算cf_digest_compute2
),索引另外还存放了设备号(实际是文件)以及具体的rblock_id以及value的长度(n_rblocks)
st=>start: Start
find_index=>operation: 查内存索引
hit_index=>condition: 索引命中
find_swb=>operation: 查写入缓冲区(SWB)
find_ssd=>operation: 查磁盘
hit=>condition: 命中
e=>end
st->find_index->hit_index
hit_index(yes)->find_swb->hit
hit_index(no)->e
hit(yes)->e
hit(no)->find_ssd
find_ssd->e
设备(实际上是个文件描述符)
我们把一个文件区域进行划分块,每一块大小为16byte
| rblock0 | rblock1 | rblock2 | ... | rblockn |
因此通过rblock_id 很容易就能确定value是在哪里存储
nblock是这条记录占用block的数量
swb 是写入缓冲区
因为写磁盘这个操作比较耗时,为了降低系统调用次数可以引入缓冲区,每次先写这个缓冲区,写满之后再刷盘
AeroSpike所有操作都是基于写入的,只会操作当前缓冲区,不会更改之前写入的记录,比如删除一条记录也是写入一条某个key被删除
缓冲区大小是 8M
后台线程扫描文件,整理块
原文:https://www.cnblogs.com/stdpain/p/12635528.html