LeetCode 上两道相似的 hash 数据结构设计题。
两道题题干相似,都是给出接口要求实现数据结构。两道题都做出了一些简化以降低设计难度:
其实这道题的时间和空间卡的非常松,grandyang的方案 直接用一个能覆盖key取值范围的大数组也能过。当然,对这种方案我们也可以稍微优化一下,比如 hashset 的时候用 bitmap 代替 int,可以压缩到原本所需空间的 1/32。
不过既然是考察哈希设计,我们还是要尽量考虑设计一个更有“哈希味儿”的方案,即使是做的简单粗糙一些:
这里的哈希函数,我在直接取余之前还做了一点混淆,用于让数据分散更均匀。
/*
* @lc app=leetcode id=705 lang=cpp
*
* [705] Design HashSet
*/
// @lc code=start
class MyHashSet {
constexpr static int nSlot = 521; // 997;
vector<vector<int>> data;
int hashFunc(int key) {
return ((key >> 16) ^ (key * 31)) % nSlot;
}
public:
/** Initialize your data structure here. */
MyHashSet() : data(nSlot) {
}
void add(int key) {
int index = hashFunc(key);
for (int i=0; i<data[index].size(); i++) {
if (data[index][i] == key) {
return;
}
}
data[index].push_back(key);
}
void remove(int key) {
int index = hashFunc(key);
for (int i=0; i<data[index].size(); i++) {
if (data[index][i] == key) {
data[index][i] = data[index].back();
data[index].pop_back();
return;
}
}
}
/** Returns true if this set contains the specified element */
bool contains(int key) {
int index = hashFunc(key);
for (int i=0; i<data[index].size(); i++) {
if (data[index][i] == key) {
return true;
}
}
return false;
}
}; // AC
/**
* Your MyHashSet object will be instantiated and called as such:
* MyHashSet* obj = new MyHashSet();
* obj->add(key);
* obj->remove(key);
* bool param_3 = obj->contains(key);
*/
// @lc code=end
/*
* @lc app=leetcode id=706 lang=cpp
*
* [706] Design HashMap
*/
// @lc code=start
class MyHashMap {
// optimization TBD:
// 1. scaling slots;
// 1. binary-search for KV-pair in the same slot
// 1. better hash function
constexpr static int nSlot = 521; // 997;
vector<vector<pair<int,int>>> data;
int hashFunc(int key) {
return ((key >> 16) ^ (key * 31)) % nSlot;
}
public:
/** Initialize your data structure here. */
MyHashMap() : data(nSlot) {
}
/** value will always be non-negative. */
void put(int key, int value) {
int index = hashFunc(key);
for (int i=0; i<data[index].size(); i++) {
if (data[index][i].first == key) {
data[index][i].second = value;
return;
}
}
data[index].push_back({key, value});
return;
}
/** Returns the value to which the specified key is mapped, or -1 if this map contains no mapping for the key */
int get(int key) {
int index = hashFunc(key);
for (int i=0; i<data[index].size(); i++) {
if (data[index][i].first == key) {
return data[index][i].second;
}
}
return -1;
}
/** Removes the mapping of the specified value key if this map contains a mapping for the key */
void remove(int key) {
int index = hashFunc(key);
for (int i=0; i<data[index].size(); i++) {
if (data[index][i].first == key) {
data[index][i] = data[index].back();
data[index].pop_back();
return;
}
}
}
}; // AC
/**
* Your MyHashMap object will be instantiated and called as such:
* MyHashMap* obj = new MyHashMap();
* obj->put(key,value);
* int param_2 = obj->get(key);
* obj->remove(key);
*/
// @lc code=end
实际上我们的设计距离实用的哈希表(如Java的HashMap和C++的unordered_map)还有很大差距,表现在:
以及,进一步的,考虑多线程并发访问的问题,是否需要加锁(如 ConcurrentHashMap),以及锁的类型、粒度设计。这些都可以作为程序员的“本钱”进行积累。
原文:https://www.cnblogs.com/zhcpku/p/14533957.html