Dictionary

Dictionary与hashtable的区别:dictionary支持泛型。

通常处理哈希冲突的方法有:开放地址法,再哈希法,链地址法,建立一个公共栈区等。

在哈希表上进行查找的过程和哈希造表的过程基本一致。给定k值,根据造表时设定的哈希函数求得哈希地址,若表中此位置没有记录,则查找不成功;否则比较关键字,若和给定值相等,则查找成功;否则根据冲突的方法寻找下一地址,直到哈希表中某个位置为空或者表中所填关键值等于给定值为止。

Dictionary使用的哈希函数是除留余数法 h = F(k) % m;m为哈希表长度。

Dictionary使用的解决冲突的方法是拉链法,又称链地址法

拉链法的原理:将所有关键字为同义词的结点链接在同一个单链表中。若选定的散列表长度为m,则可将散列表定义为一个由m个头指针组成的指针数 组T[0..m-1]。凡是散列地址为i的结点,均插入到以T[i]为头指针的单链表中。T中各分量的初值均应为空指针。

private struct Entry {

public int hashCode;    //31位散列值,32最高位表示符号位,-1表示未使用

public int next;        //下一项的索引值,-1表示结尾

public TKey key;        //键

public TValue value;    //值

}

private int[] buckets;//内部维护的数据地址

private Entry[] entries;//元素数组,用于维护哈希表中的数据

private int count;//元素数量

private int version;

private int freeList;//空闲的列表

private int freeCount;//空闲列表元素数量

private IEqualityComparer<TKey> comparer;//哈希表中的比较函数

private KeyCollection keys;//键集合

private ValueCollection values;//值集合

private Object _syncRoot;

初始化函数

该函数用于,初始化的数据构造

private void Initialize(int capacity) {

//根据构造函数设定的初始容量,获取一个近似的素数

int size = HashHelpers.GetPrime(capacity);

buckets = new int[size];

for (int i = 0; i < buckets.Length; i++) buckets[i] = -1;

entries = new Entry[size];

freeList = -1;

}

size 哈希表的长度是素数,可以使元素更均匀地分布在每个节点上。GetPrime(capacity)返回离>capacity最近的质数。维护了个质数数组,初始capacity为0,返回3(初始大小)

buckets 中的节点值,-1表示空值。

freeList 为-1表示没有空链表。

buckets 和 freeList 所值指向的数据其实全是存储于一块连续的内存空间(entries )之中。

//取hashcode后还与0x7FFFFFFF做了个与操作,0x7FFFFFFF这就是int32.MaxValue的16进制,换成二进制是‭01111111111111111111111111111111‬,第1位是符号位,也就是说comparer.GetHashCode(key) 为正数的情况下与0x7FFFFFFF做 & 操作结果还是它本身,如果取到的hashcode是负数,负数的二进制是取反再补码,所以结果得到的是0x7FFFFFFF-(-hashcode)+1,结果是正数。其实简单来说,它的目的就是高性能的取正数。‬‬

扩容 //Resize消耗不低,比List<T>的要大,不光要copy元素,还要重建bucket。

private void Resize() {

Resize(HashHelpers.ExpandPrime(count), false);

}

private void Resize(int newSize, bool forceNewHashCodes) {

Contract.Assert(newSize >= entries.Length);

//重新初始化一个比原来空间还要大2倍左右的buckets和Entries,用于接收原来的buckets和Entries的数据

int[] newBuckets = new int[newSize];

for (int i = 0; i < newBuckets.Length; i++) newBuckets[i] = -1;

Entry[] newEntries = new Entry[newSize];

//数据搬家

Array.Copy(entries, 0, newEntries, 0, count);

//将散列值刷新,这是在某一个单链表节点数到达一个阈值(100)时触发

if(forceNewHashCodes) {

for (int i = 0; i < count; i++) {

if(newEntries[i].hashCode != -1) {

newEntries[i].hashCode = (comparer.GetHashCode(newEntries[i].key) & 0x7FFFFFFF);

}

}

}

//单链表数据对齐,无关顺序

for (int i = 0; i < count; i++) {

if (newEntries[i].hashCode >= 0) {

int bucket = newEntries[i].hashCode % newSize;

newEntries[i].next = newBuckets[bucket];

newBuckets[bucket] = i;

}

}

buckets = newBuckets;

entries = newEntries;

}

Dictionary为了性能并没有在Remove做重建,而是把位置空出来,这样节省大量时间。freeList和bucket类似(一样喜新厌旧),总是指向最新空出来的entry的index,而entry的next又把所有空的entry连起来了。这样insert时就可以先找到这些空填进去。

转载于:https://www.cnblogs.com/mcyushao/p/10629599.html

C#Dictionary源码相关推荐

  1. C# Dictionary源码解析

    Dictionary底层原理 本篇文章将介绍C#在.NET下的Dictionary的底层源码,源码都根据自己的理解加上了注释,源码直接到官网即可查看下载https://referencesource. ...

  2. C#要点技术(二) - Dictionary 底层源码剖析

    Dictionary 底层代码 我们知道 Dictionary 字典型数据结构,是以关键字Key 和 值Value 进行一一映射的.Key的类型并没有做任何的限制,可以是整数,也可以是的字符串,甚至可 ...

  3. HashTable详解、源码、扩容、深入理解HashTable、HashTable多线程并发问题

    Hashtable 简介 和HashMap一样,Hashtable 也是一个散列表,它存储的内容是键值对(key-value)映射. Hashtable 继承于Dictionary,实现了Map.Cl ...

  4. jieba分词流程及部分源码解读(一)

    首先我们来看一下jieba分词的流程图: 结巴中文分词简介 1)支持三种分词模式: 精确模式:将句子最精确的分开,适合文本分析 全模式:句子中所有可以成词的词语都扫描出来,速度快,不能解决歧义 搜索引 ...

  5. 一步一步Asp.Net MVC系列_权限管理总结(附MVC权限管理系统源码)

    TZHSWEET:请大家多多反馈问题,我已经在修改中了,已更新版本...... 如果大家遇到数据库附加问题,EF连接字符串问题,请自行配置,如果有bug反馈可以私聊,我的qq:409180955. 项 ...

  6. VVeboTableView 源码解析

    原文链接:http://www.jianshu.com/p/78027a3a2c41 最近在看一些 iOS 性能优化的文章,我找到了 VVeboTableView 这个框架.严格来说这个不属于框架,而 ...

  7. iOS WebviewJavascriptBridge 源码研读笔记

    这两天接近元旦,事情稍微少些,有些时间,索性写点什么,就从最擅长的iOS混合开发写起了,由于iOS开发经验不到四年吧,期间还搞了一年半的前端,有些知识可能还是积累的不足,能力不足,水平有限,可能有谬误 ...

  8. python3.7源码分析-字典

    python字典 Dictionary object implementation using a hash table ,通过描述可知,python的字典就是实现了一个hash表. Python字典 ...

  9. djangorestframework源码分析2:serializer序列化数据的执行流程

    djangorestframework源码分析 本文环境python3.5.2,djangorestframework (3.5.1)系列 djangorestframework源码分析-serial ...

最新文章

  1. VC++更改主窗口标题栏文字
  2. Discuz X3.1 论坛修改的方法(门户的修改)
  3. 小程序短视频项目———开发用户登录注册(一)
  4. Boost:boost::bimaps::unordered_multiset_of的测试程序
  5. HMAC-MD5算法原理及实现
  6. 考研失败了,该何去何从?
  7. PHP函数库06:PHP统计字符串里单词出现次数
  8. ffmpeg 分辨率 压缩_Ffmpeg 视频压缩的几个关键参数
  9. uk码对照表_这份中外衣服鞋码尺寸对照表,请收好!
  10. vue如何保存登录状态到全局?【vue状态管理】
  11. linux oracle 12170,ora-12170 linux
  12. SSH关于公钥认证Permission denied的问题
  13. [Other] Inno Setup 使用心德-一个完整的项目 包括.NET组建捆绑 去空格等
  14. 为什么php在网页中不显示,为什么网页显示不出php代码_后端开发
  15. 初中生物教师资格证经验贴
  16. 文字栅格化剪切蒙版——创建文字遮罩效果的两种方法——梦幻游乐园
  17. 基地树洞 | 自动化小系列之番外篇
  18. Softmax-with-Loss层的计算图 | Softmax梯度推导 | Loss损失函数
  19. 狂野飙车8:极速凌云 for Mac v1.0.2 Asphalt 8 好玩的赛车游戏
  20. Photoshop学习(十六):使用矢量蒙版

热门文章

  1. windows7+Apache2.2+PHP5.4.29 环境搭建
  2. 借双慧眼识别钓鱼欺诈网站
  3. [转]内核和用户空间数据交换
  4. javascript iterator
  5. IDEA 热启动,每次更改代码后不用重启服务
  6. 使用Python开发的POC多线程批量执行小框架
  7. 记一些大型项目中所作的规划
  8. makefile 文件模板
  9. 字符集 ISO-8859-1(1)
  10. UI Bootstrap