欧意交易所资讯

uncategorized
首页 > 欧意交易所资讯 > 正文内容

哈希表(Hashtable)

1年前 (2024-07-12)欧意交易所资讯

哈希表是普通数组概念的推广,是能够根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数(Hash Function),存放记录的数组叫做散列表(Hash Table)。

在平均情况下,在哈希表中查找一个元素的期望时间是 O(1)O(1) ,因此效率极高。Python中的字典就是采用了哈希表的结构。

1. 直接寻址表

当关键字的全域 UU 比较小时,直接寻址简单有效,假设某应用要用到一个动态集合,其中每个元素都有一个取自于全域 U={0,1,..,m−1}U=\left\{ 0,1,..,m-1 \right\} 的关键字,且假设没有两个元素具有相同的关键字。

我们用数组(直接寻址表) T[0,...,m−1]T[0,...,m-1] 来表示该动态集合,其中每个位置对应全域 UU 中的一个关键字即可。

这样检索、插入和删除操作都是 O(1)O(1) 的时间。

但是如果全域 UU 很大,那么一台计算机的内容是无法存储的;如果实际要存储的关键字集合 K≪UK\ll U ,那么分配给 TT 的大部分空间都要浪费掉。因此我们产生了Hash Table

2. 哈希表

在直接寻址方式下,具有关键字 kk 的元素被存放在槽 kk 中,在散列方式下,利用散列函数 h(k)h(k) 根据关键字 kk 计算出槽的位置,函数 hh 将关键字全域 UU 映射到散列表 T[0,...,m−1]T[0,...,m-1] 的槽位上:

h:U→{0,...,m−1}h:U\rightarrow \left\{ 0,...,m-1 \right\}

这样就能够缩小需要处理的下标范围,即值域从 |U||U| 降到了 mm

但这样存在一个问题,两个关键字可能映射到同一个槽上,称之为碰撞(collision)

,我们通过两种方法来进行解决。一个是链接法(chaining),另一个是开放寻址法(open addressing).

2.1 链接法(chaining)解决碰撞问题

在链接法中,把散列到同一槽中的所有元素放到一个链表中,槽 jj 中有一个指针,指向由所有散列到 jj 的元素构成的链表的头;如果不存在这样的元素,则置为NULL。

如果散列表中的槽树至少与表中的元素数成正比,即 n=O(m)n=O(m) ,则平均来说,查找操作需要常数量的时间;同时,插入操作在最坏情况下需要 O(1)O(1) 的时间,删除操作最坏情况下需要 O(1)O(1) 的时间,因此全部的字典操作平均情况下都可以在 O(1)O(1) 时间内完成。

其优点主要包括:

拉链法处理冲突简单,且无堆积现象,即非同义词决不会发生冲突,因此平均查找长度较短;在用拉链法构造的散列表中,删除结点的操作易于实现

缺点:

在对链表进行存储空间分配的时候,会降低整个程序的运行速率,因为哈希冲突后,用链表去延展来解决。

针对链表进行延展而效率低下的问题,出现了开放寻址法(Open addressing)。

2.2 开放寻址法(Open Addressing)解决碰撞问题

在开放寻址法中,所有的元素都存放在散列表中,因此哈希表的每个表项或包含一个元素,或包含NULL,而不像在链表法中,这里没有链表,也没有元素存放在散列表外。

在开放寻址法中,当要插入一个元素时,需要连续的检查(probe)散列表的各项,直到找到一个空槽来放置待插入的关键字为止,检查的顺序并非是 0,1,...,m−10,1,...,m-1 (这样查找时间为 Θ(n)\Theta(n) ),而是依赖于带插入的关键字,因此我们将散列表扩充为:

h:U×{0,...,m−1}→{0,...,m−1}h:U \times \left\{ 0,...,m-1 \right\} \rightarrow \left\{ 0,...,m-1 \right\}

对开放寻址法来说,要求对每一个关键字 kk ,probe序列为:

<h(k,0),h(k,1),h(k,2)...,h(k,m−1)><h(k,0),h(k,1),h(k,2)...,h(k,m-1)>

插入算法如下所示,即找到probe序列中第一个为空的表项插入。

def hash_insert(T,k): i = 0 if i < m: j = h(k,i) if T[j] == None://找到probe序列中第一个为空的表项插入 T[j] = k return j i += 1 error "hash table overflow"

查找算法与插入算法类似,在查找过程中,如果找到就返回;如果找到NULL,就查找失败。

def hash_search(T,k): i = 0 if i < m: j = h(k,i) if T[j] == k: return j if T[j] == None: return None i += 1 return None

在开放寻址中,删除操作执行较为困难,如果从槽 ii 中删除关键字,不能仅仅将表项置为NULL,这样的话,如果在插入某关键字 kk 的probe过程中,发现 ii 被占用了,则 kk 被插到后面的位置。当从槽 ii 中删除关键字后,则无法检索关键字 kk 。因此需要额外的机制,将删除的表项设置为DELETED,并且需要修改插入和查找算法。

但是如果使用了DELETED,查找时间就不再依赖于装载因子了,因此在必须删除关键字的应用中,往往采用链接法来解决碰撞。

常见的probe方法包括:

线性probe二次probe双重probe

这里不做详细介绍。

3. 链接法哈希表代码实现

以下是采用链接法实现的哈希表,主要用了List来存放链表,并且为了提高检索速度实现了resize方法。

#coding=utf-8 class MyHash(object): 哈希表设计 def __init__(self,length=10): self.length = length self.slots = [[] for i in range(self.length)] self.datasize = 0 def hash(self,k): return k % self.length def add(self,k,v): 添加(k,v) if self.datasize >= len(self.slots): self.resize() index = self.hash(k) if self.slots[index] != []: # 先判断是否有内容在里面 # 在判断是否有key重复 for item in self.slots[index]: if k == item[0]: self.slots[index].remove(item) #然后加入 self.slots[index].append((k,v)) self.datasize += 1 def get(self,k): 查找 index = self.hash(k) if self.slots[index] != []: for item in self.slots[index]: if k == item[0]: return item[1] raise KeyError def resize(self): 当元素过多时,需要将slots的数量增加 self.length *= 2 new_slots = [[] for i in range(self.length)] for slot in self.slots: for item in slot: # print item index = self.hash(item[0]) new_slots[index].append(item) self.slots = new_slots def __len__(self): return len(self.slots) def __str__(self): 当采用print方法时,可以输出想要的内容 return str(self.slots) if __name__ == __main__: h = MyHash() for i in range(23): h.add(i,i+1) print h.get(1) print h print len(h) print h.datasize

扫描二维码推送至手机访问。

版权声明:本文由欧意交易所app官方下载发布,如需转载请注明出处。

转载请注明出处http://doumiduoduo.cn/post/2091.html

相关文章

欧意交易所应用程序:下载安装指南,助您投资之路畅通无阻

欧意交易所应用程序以其诱人名称引人注目。此应用不仅为普通金融交易简化了流程,更为投资新手与资深投资者提供了便利。接下来,请允许我向您展示如何下载及安装这款神奇的应用,助您的投资之路畅通无阻。 一、寻找...

BTC比特币交易有哪些平台

BTC比特币交易有哪些平台

BTC比特币交易有哪些平台呢,圈子里面常见的一个权威平台叫非小号,上面能够查到平台及币种信息。 这是几个头部交易所,第一的就是常说的bi安 国内大部分用户公认的三...

创业失败32次,靠美图秀秀征服全国美女的吴欣鸿,买比特币亏1亿

创业失败32次,靠美图秀秀征服全国美女的吴欣鸿,买比特币亏1亿

说实话,正经人,谁还敢玩比特币啊。 不仅仅只是比特币,但凡是跟加密货币沾边的,最好一个都别碰。 当然了,现在说这个已经属于马后炮了。至少在刚进入今年的时候,谁都没想...

捡垃圾新境界,700块打造入门级游戏主机李英爱是倒着长的吗?52岁素颜出镜像小女孩,把大8岁老公熬成爹

捡垃圾新境界,700块打造入门级游戏主机李英爱是倒着长的吗?52岁素颜出镜像小女孩,把大8岁老公熬成爹

过去三年时间,对整机玩家而言可谓是“黑暗三年”。虚拟货币的到来,让显卡价格被疯狂炒到高位,甚至一度带动了其他硬件的价格,就连SSD、机械硬盘等也沦为挖矿工具,再加上疫情引发的“缺芯潮”,导致...

工商银行申请会话密钥的生成方法、装置、处理器及电子设备专利,解决了生成会话密钥时,会话密钥容易被破解的技术问题《家有儿女》中明目张胆的穿帮镜头,导演是把观众当傻子吗?

金融界2023年12月7日消息,据国家知识产权局公告,中国工商银行股份有限公司申请一项名为“会话密钥的生成方法、装置、处理器及电子设备“,公开号CN117176329A,申请日期为2023年...

香港公司在大陆经营合法吗?

香港公司在大陆经营合法吗?

原标题:香港公司在大陆经营合法吗? 针对这个问题,确切的回答是:是可以经营的。 但是不受当地工商局的保护,一般 香港公司又分为2种,一种属于离岸操作,一种属于本地操作,一般做外贸的客...

欧意交易平台 v67.72.1 2024 官方安卓版

欧意交易所app是一款专业的比特币交易平台,还支持莱特币、以太币等数字货币,提供及时丰富的行业资讯,支持多种币种在线交易,专业分析师在线直播提供精准的指导意见,帮助用户把握投资时机,全球排名第一的虚拟货币交易所已全新升级,提供多种加密货币在线交易,种类丰富,在线交易流程简单,金融级加密技术,使用起来绝对安全!目标是向区块链技术爱好者提供更多的区块链比特币相关的资讯及优质内容。