欧意交易所资讯

uncategorized
首页 > 欧意交易所资讯 > 正文内容

哈希表(Hashtable)

4个月前 (07-05)欧意交易所资讯

哈希表是普通数组概念的推广,是能够根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数(Hash Function),存放记录的数组叫做散列表(Hash Table)。

在平均情况下,在哈希表中查找一个元素的期望时间是 O(1)O(1) ,因此效率极高。Python中的字典就是采用了哈希表的结构。

1. 直接寻址表

当关键字的全域 UU 比较小时,直接寻址简单有效,假设某应用要用到一个动态集合,其中每个元素都有一个取自于全域 U={0,1,..,m−1}U=\left\{ 0,1,..,m-1 \right\} 的关键字,且假设没有两个元素具有相同的关键字。

我们用数组(直接寻址表) T[0,...,m−1]T[0,...,m-1] 来表示该动态集合,其中每个位置对应全域 UU 中的一个关键字即可。

这样检索、插入和删除操作都是 O(1)O(1) 的时间。

但是如果全域 UU 很大,那么一台计算机的内容是无法存储的;如果实际要存储的关键字集合 K≪UK\ll U ,那么分配给 TT 的大部分空间都要浪费掉。因此我们产生了Hash Table

2. 哈希表

在直接寻址方式下,具有关键字 kk 的元素被存放在槽 kk 中,在散列方式下,利用散列函数 h(k)h(k) 根据关键字 kk 计算出槽的位置,函数 hh 将关键字全域 UU 映射到散列表 T[0,...,m−1]T[0,...,m-1] 的槽位上:

h:U→{0,...,m−1}h:U\rightarrow \left\{ 0,...,m-1 \right\}

这样就能够缩小需要处理的下标范围,即值域从 |U||U| 降到了 mm

但这样存在一个问题,两个关键字可能映射到同一个槽上,称之为碰撞(collision)

,我们通过两种方法来进行解决。一个是链接法(chaining),另一个是开放寻址法(open addressing).

2.1 链接法(chaining)解决碰撞问题

在链接法中,把散列到同一槽中的所有元素放到一个链表中,槽 jj 中有一个指针,指向由所有散列到 jj 的元素构成的链表的头;如果不存在这样的元素,则置为NULL。

如果散列表中的槽树至少与表中的元素数成正比,即 n=O(m)n=O(m) ,则平均来说,查找操作需要常数量的时间;同时,插入操作在最坏情况下需要 O(1)O(1) 的时间,删除操作最坏情况下需要 O(1)O(1) 的时间,因此全部的字典操作平均情况下都可以在 O(1)O(1) 时间内完成。

其优点主要包括:

拉链法处理冲突简单,且无堆积现象,即非同义词决不会发生冲突,因此平均查找长度较短;在用拉链法构造的散列表中,删除结点的操作易于实现

缺点:

在对链表进行存储空间分配的时候,会降低整个程序的运行速率,因为哈希冲突后,用链表去延展来解决。

针对链表进行延展而效率低下的问题,出现了开放寻址法(Open addressing)。

2.2 开放寻址法(Open Addressing)解决碰撞问题

在开放寻址法中,所有的元素都存放在散列表中,因此哈希表的每个表项或包含一个元素,或包含NULL,而不像在链表法中,这里没有链表,也没有元素存放在散列表外。

在开放寻址法中,当要插入一个元素时,需要连续的检查(probe)散列表的各项,直到找到一个空槽来放置待插入的关键字为止,检查的顺序并非是 0,1,...,m−10,1,...,m-1 (这样查找时间为 Θ(n)\Theta(n) ),而是依赖于带插入的关键字,因此我们将散列表扩充为:

h:U×{0,...,m−1}→{0,...,m−1}h:U \times \left\{ 0,...,m-1 \right\} \rightarrow \left\{ 0,...,m-1 \right\}

对开放寻址法来说,要求对每一个关键字 kk ,probe序列为:

<h(k,0),h(k,1),h(k,2)...,h(k,m−1)><h(k,0),h(k,1),h(k,2)...,h(k,m-1)>

插入算法如下所示,即找到probe序列中第一个为空的表项插入。

def hash_insert(T,k): i = 0 if i < m: j = h(k,i) if T[j] == None://找到probe序列中第一个为空的表项插入 T[j] = k return j i += 1 error "hash table overflow"

查找算法与插入算法类似,在查找过程中,如果找到就返回;如果找到NULL,就查找失败。

def hash_search(T,k): i = 0 if i < m: j = h(k,i) if T[j] == k: return j if T[j] == None: return None i += 1 return None

在开放寻址中,删除操作执行较为困难,如果从槽 ii 中删除关键字,不能仅仅将表项置为NULL,这样的话,如果在插入某关键字 kk 的probe过程中,发现 ii 被占用了,则 kk 被插到后面的位置。当从槽 ii 中删除关键字后,则无法检索关键字 kk 。因此需要额外的机制,将删除的表项设置为DELETED,并且需要修改插入和查找算法。

但是如果使用了DELETED,查找时间就不再依赖于装载因子了,因此在必须删除关键字的应用中,往往采用链接法来解决碰撞。

常见的probe方法包括:

线性probe二次probe双重probe

这里不做详细介绍。

3. 链接法哈希表代码实现

以下是采用链接法实现的哈希表,主要用了List来存放链表,并且为了提高检索速度实现了resize方法。

#coding=utf-8 class MyHash(object): 哈希表设计 def __init__(self,length=10): self.length = length self.slots = [[] for i in range(self.length)] self.datasize = 0 def hash(self,k): return k % self.length def add(self,k,v): 添加(k,v) if self.datasize >= len(self.slots): self.resize() index = self.hash(k) if self.slots[index] != []: # 先判断是否有内容在里面 # 在判断是否有key重复 for item in self.slots[index]: if k == item[0]: self.slots[index].remove(item) #然后加入 self.slots[index].append((k,v)) self.datasize += 1 def get(self,k): 查找 index = self.hash(k) if self.slots[index] != []: for item in self.slots[index]: if k == item[0]: return item[1] raise KeyError def resize(self): 当元素过多时,需要将slots的数量增加 self.length *= 2 new_slots = [[] for i in range(self.length)] for slot in self.slots: for item in slot: # print item index = self.hash(item[0]) new_slots[index].append(item) self.slots = new_slots def __len__(self): return len(self.slots) def __str__(self): 当采用print方法时,可以输出想要的内容 return str(self.slots) if __name__ == __main__: h = MyHash() for i in range(23): h.add(i,i+1) print h.get(1) print h print len(h) print h.datasize

扫描二维码推送至手机访问。

版权声明:本文由欧意交易所app官方下载发布,如需转载请注明出处。

转载请注明出处http://doumiduoduo.cn/post/1290.html

相关文章

跨境电商平台崛起,蜜芽、网易考拉等你熟知的有哪些?

跨境电商平台崛起,蜜芽、网易考拉等你熟知的有哪些?

1.蜜芽 成立日期:2014年8月 的供应来自四部分:品牌国内总采购体系;海外直接采购;一般进口贸易;海外直邮及保税进口。米娅宝贝领衔“母婴品牌限时特卖”虽然产品类型单一,但对于女性消费者来说是个好消...

欧意集团:从简陋工厂到市场名噪,挑战与成长之路

同仁们,我们今天的话题将围绕欧意集团展开,其名颇有韵味否?确实如此。欧意集团之名犹如乐章,令人闻之心动,欲随之起舞。 辉煌的起点 你知道吗?欧意集团创立之初,仅有一间简陋的工厂,员工也仅是几位充满热血...

停止运营!“币世界”突然宣布

停止运营!“币世界”突然宣布

中国基金报记者 王建蔷 7月15日,加密货币内容社区“币世界”宣布即日起停止运营APP和网站。而在这背后,国内市场正掀起一...

买卖比特币是否违法?涉虚拟币交易犯罪概述解析

今年以来,以比特币为首的全球虚拟货币交易市场异常活跃,比特币、以太坊等虚拟货币价格持续走高,一些原先鲜为人知虚拟货币,涨幅高达成千上万倍,吸引了无数国人跟风进场。近期又因其市场价格波动幅度...

矿卡真的寿命短吗?618千元内矿卡攻略白鹿真的是从小美到大呀,小时候好可爱

矿卡真的寿命短吗?618千元内矿卡攻略白鹿真的是从小美到大呀,小时候好可爱

作者:老橙子 我也是个老矿工了,2011年就在挖矿了,当年看电脑报上的报道,脑袋一热就开挖了,算是中国最早的一批BTC矿工了 之前有人问我矿卡寿命是不是很短,我先上结论,矿卡...

留给莱特币的,只有一条风雨飘摇的路

留给莱特币的,只有一条风雨飘摇的路

免责声明:本文不构成任何投资建议。 小编:记得关注哦 莱特币并无其独特的发展路线图,大部分的Github更新都是复制比特币...

欧意交易平台 v67.72.1 2024 官方安卓版

欧意交易所app是一款专业的比特币交易平台,还支持莱特币、以太币等数字货币,提供及时丰富的行业资讯,支持多种币种在线交易,专业分析师在线直播提供精准的指导意见,帮助用户把握投资时机,全球排名第一的虚拟货币交易所已全新升级,提供多种加密货币在线交易,种类丰富,在线交易流程简单,金融级加密技术,使用起来绝对安全!目标是向区块链技术爱好者提供更多的区块链比特币相关的资讯及优质内容。