算法6-4：哈希表现状

时间：2014-06-17 21:47:57 阅读：375 评论：0 收藏：0 [点我收藏+]

战争故事

很久很久以前，曾经发生过很多关于哈希函数的战争故事。那些战争的基本原理就是通过精心构造造成大量的哈希冲突从而占用大量的CPU资源。

bubuko.com,布布扣

被攻击的软件例有以下例子：

在Java中的String对象很容易构造哈系冲突。下图展示了Java中哈系冲突的例子。

bubuko.com,布布扣

使用更加高级的哈系函数，避免冲突。比如md4 md5 sha0 sha1 sha2 whirlpool ripemd160。但是md4 md5 sha0 sha1目前能够找到缺陷，关于MD5的冲突请戳这里：http://www.links.org/?p=6

MD5不适合用于关联数组，因为开销太大。

目前介绍了两种解决冲突的办法，分别是独立链表和线性探针。

独立链表：

线性探针：

目前已经实现了很多不同的哈希算法。

双值哈希：

一个哈希函数返回两个哈希值，插入元素时插入到较短的链条上。这种方法能够减少链条长度的期望值。

双重哈希：

使用线性探针方法，但是每次冲突之后跳过不同数量的元素来寻找空位。这种方法能够很好地消除连续的占位，使得哈希表能够被几乎填满，但是删除很难实现。

Cuckoo哈希：

先产生一个哈希，计算出一个位置，如果有冲突，再增加一些参数继续哈希，计算出另外一个位置。直到找到空位位置。这种方法的查找操作在最坏情况下复杂度是N。

哈希表和平衡树都可以实现关联数组。

哈希表：

二叉树：

Java库中对于这两种方法都有实现。java.util.TreeMap java.util.TreeSet是通过红黑树实现的，java.util.HashMap java.util.IdentityHashMap是通过哈希表实现的。

原文：http://blog.csdn.net/caipeichao2/article/details/31414469

踩

(0)

评论一句话评论（0）

分享档案

更多>