散列函数将输入映射到输出。
散列表也被称为散列映射、映射、字典和关联数组。
创建电话簿
phone_book = {}
#或者phone_book = dict()
phone_book["马云"]=18888888888
phone_book["马化腾"]=16868686868
#获取马云的练习方式
print(phone_book["马云"])
散列表还适用于DNS解析
无论访问哪个网站,其网址都必须转换为IP地址。如
baidu.com -> 183.232.231.174
sina.com -> 36.156.86.241
163.com -> 111.3.84.41
假如负责管理投票站。每人只能投一票。有人来投票,需要先查询他的姓名,并在投票名单中进行查找,确保未投过票。
如果使用简单查找,当列表非常长时,耗时将很久。
使用散列表,则非常快。
voted={}
def check_voter(name):
if voted.get(name):
print("已经投过票了")
else:
voted[name]=True
print("让他投")
check_voter("tom") #让他投
check_voter("mike") #让他投
check_voter("mike") #已经投过票了
假设有人问你月球和地球之间的距离,你需要搜索,在告诉对方答案。缓存将答案存在本地,以后再问,直接回答。
缓存:
cache={}
def get_page(url):
if cache.get(url):
return cache[url] #返回缓存的数据
else:
data = get_data_from_server(url)
cache[url]=data #保存到缓存中
return data
散列表适合用于:
散列表长度一定比如key为a-z 26个字母,元素大于散列表的长度。a已经存了apple-1.49,如果再存储avocado-3.99,会因为给两个元素分配相同的位置的而冲突。为了避免冲突:如果两个key映射到同一位置,就在这个位置存储一个链表。
如果你的商品全是以a开头的,所有元素都存到一个链表中,散列表的速度会很慢。
经验:
平均情况下,散列表执行各种操作的时间为常量时间(O(1))。
常量时间:不过散列表多大,所需的时间都相同。
散列表的性能:
操作 | 平均情况 | 最糟情况 |
查找 | O(1) | O(n) |
插入 | O(1) | O(n) |
删除 | O(1) | O(n) |
填装因子=散列表包含的元素数/位置总数
如列表长度为5,里面有2个元素,其填装因子为0.4.
填装因子度量的是散列表中还有多少位置是空的。
填装因子大于1意味着商品数量超过了数组的位置数。一旦填装因子开始增大,你就需要在散列表中添加位置,这被称为调整长度。调整长度通常将数组增长一倍。
填装因子越低,发生冲突的可能性越小,散列表的性能越高。经验:一旦填装因子大于0.7,就调整散列表的长度。
良好的散列函数让数组中的值呈均匀分布,避免让值扎堆,导致大量的冲突。
原文:https://www.cnblogs.com/csj2018/p/12088301.html