布谷鸟哈希最早于2001 年由Rasmus Pagh 和Flemming Friche Rodler 提出。该哈希方法是为了解决哈希冲突的问题而提出，利用较少计算换取了较大空间。名称源于该哈希方法行为类似于布谷鸟在别的鸟巢中下蛋，并将别的鸟蛋挤出的行为。它具有占用空间小、查询迅速等特性，可用于Bloom filter 和内存管理。

算法描述

算法使用hashA 和hashB 计算对应key 的位置。

当两个哈希任意位置为空，则选择一个位置插入
让两个哈希有位置为空时，则插入到空位置
当两个哈希位置均不为空时，随机选择两者之一的位置上keyx 踢出，计算踢出的keyx 另一个哈希值对应的位置进行插入，转至2执行（即当再次插入位置为空时插入，仍旧不为空时，踢出这个keyy）

图例

1. 插入key1 两个位置均为空,则插入任意位置.

2. 插入后

3. 插入key2 两个位置有一个位置为空,则插入空的位置中

4. 插入后效果

5. 新插入keyi 发现对应两个位置均被占据

6. 随机选择一个位置提出所在位置的key（key1），将踢出的key 放置在另一个哈希结果对应的位置上

7. 如果踢出的key（key1）又占据/踢出了其他key（keyj）的位置，则反复执行上面的过程直到结束

其他

Cockoo hash 有两种变形。一种通过增加哈希函数进一步提高空间利用率；另一种是增加哈希表，每个哈希函数对应一个哈希表，每次选择多个张表中空余位置进行放置。三个哈希表可以达到80% 的空间利用率。
Cockoo hash 的过程可能因为反复踢出无限循环下去，这时候就需要进行一次循环踢出的限制，超过限制则认为需要添加新的哈希函数。
在SOSP 11 的SLIT 文章中有使用Cockoo hash。

增加哈希表过程如下：

当新插入一个key hashA 在上面哈希表位置和hashB 在下面哈希表的位置分别被key1 和keyx 占据，任选一个key 提出（这里选择key1）。

计算key1 hashB 的值然后插入到下面的hashB 对应的哈希表中。

PS

文中图使用graphviz 绘制，图例第七张图片生成文件如下：

   1: digraph G {

   2: "node0" [

   3: label = "<f0>null | <f1>null | <f2>keyi | <f3>null | <f4>null | <f5>key1 | <f6>key2 | <f7>......"

   4: shape = "record"

   5: ];

6:

   7: "node2"[

   8: label="key1"

   9: ];

10:

  11: "node3"[

  12: label="key2"

  13: ];

14:

  15: "node1"[

  16: label="keyi"

  17: ];

18:

  19: "node1"->"node0":f2[color="red",shape="record",label="hashA"];

  20: "node1"->;"node0":f6[color="red",shape="record",label="hashB"];

21:

  22: "node0":f2->;"node2";

  23: "node0":f5->;"node2"[style="dotted"];

24:

  25: "node0":f2->;"node3"[style="dotted"];

  26: "node0":f6->;"node3";

27:

  28: "node0":f5:s->;"node0":f7:s[color="blue",shape="record",label="keyj"];

  29: }

在GVEdit 在使用的时候，F5 是生成图片，并在对应的目下生成了响应的图形文件，相关设置在Graph setting 里面，第一次用的时候总是找不到export image 的方法，总导出不了对应图片。

呆鸥

Brains first and then Hard Work

Cuckoo Hash 布谷鸟哈希

算法描述

图例

其他

PS

《Cuckoo Hash 布谷鸟哈希》上有2条评论

发表回复取消回复

算法描述

图例

其他

PS

《Cuckoo Hash 布谷鸟哈希》上有2条评论

发表回复 取消回复

发表回复取消回复