在对哈希结构的讨论上,我们对于已经在数组中有所使用,简单的来说就是通过下标定位某一种数据的方法。那么,我们学习的一些python知识点,也会体现出一些哈希结构。本篇所要讲的是字典和集合这两种,关于具体的哈希结构会就这两个方面分别展开介绍,大季家一起来看看内容。
1、字典
PyDictKeysObject定义了字典哈希表的一些字段。其中有两个数组 dk_indices[] 和 dk_entries[],这两个便是真正的存储数据的数组。kv 数据保存在dk_entries[]数组中,dk_indices[]来存储 kv 数据在dk_enties数组中保存的索引。其中每个 kv 数据以entry的数据结构来存储,如下:
typedefstruct{ /*Cachedhashcodeofme_key.*/ Py_hash_tme_hash; PyObject*me_key; PyObject*me_value;/*Thisfieldisonlymeaningfulforcombinedtables*/ }PyDictKeyEntry;
me_hash缓存存 key 的哈希值,防止哈希值的重复计算。me_key和me_value便是 key 和 value 的真正数据了。
2、集合
集合和字典一样,底层也是哈希结构,和字典相比,可理解为只有 key,没有 values。
相比字典,集合简单了不少。在PySetObject中直接保存了存储数据的数组。
根据集合的底层数据结构分析,它解决哈希冲突也是使用的「开发寻址法」。
集合的一些常用操作:
#初始化 s1={'1','2','3'}#不推荐,当元素中有字典时,会报错 s2=set(['1','4','5']) print(s1)#{'3','1','2'} print(s2)#{'3','1','2'} #交集 print(s1&s2)#{'1'} #并集 print(s1|s2)#{'3','5','4','2','1'} #差集 print(s1-s2)#{'3','2'} #判断子集和超集 s2.issubset(s1)#s2是否为s1的子集 s1.issuperset(s2)#s1是否为s2的超集 #集合的一些内建方法 #set.add(obj)添加集合元素 #set.remove(obj)删除集合元素 #set.update(set)合并集合 #set.pop()随机删除一个元素,并返回该元素