NSDictionary实现原理

NSDictionary是基于key - value 方式,把key映射到一个hash表中实现的

key

需要支持NSCopying协议,实际上不支持也可以作为key,但在swift中就必须要支持,支持NSCopying的原因在于,NSDicitionary是NSCopying的,在copy一个dictionary的时候需要key是NSCopying的(不信你用一个UIImage做key也是可以正常运行的,只要不copy)

添加key-value的时候不会对key做深复制,以下代码打印的内容是一样的

NSString *key = @"key";
NSLog(@"%p",key);
NSDictionary *dic = @{key:@(1)};
NSLog(@"%p",dic.allKeys.firstObject);

所以添加非NSCopying的对象也是可以的,因为对象作为key的必要条件是对象实现了:

- (NSUInteger)hash;

2018.8.3更新
上面这个说法仅限于创建NSDictionary的时候,如果是在NSMutableDictionary调用setObject方法,系统会强制复制一份,也就是会调用key的copyWithZone方法创建一个新的对象,setObject的key没支持NSCopying的话就会崩,同理setValue的key也需要支持NSCopying

方法,而NSObject本身就已经实现了这个方法,返回的是它本身的地址

如果你这样打印:

NSObject *obj = NSObject.new;
NSLog(@"%@",obj.hash);

你会发现打印出来的内容跟

NSLog(@"%@",obj);

是一样的,就侧面证明了NSObject的默认-hash打印的就是它本身的地址

而如果这样打印一个NSString的话会直接崩掉。。。说明NSString改写了hash方法返回了基于string计算的hash,所以只要你传入了内容一样的字符串都能拿到相应的value

并且NSString是经过特别优化的,会经可能的均匀hash的平均长度,使hash表尽可能的小

如果你要通过key查找value,需要key实现了:

- (BOOL)isEqual:(id)object;

同样NSObject也实现了,默认是通过对比自己的地址

value没什么好讲的,只要是个NSObject子类都行

hash表的实现

NSDictionary生成hash表使用的是拉链法,可以理解为“链表的数组”即:

根结构为数组,每个元素为链表

添加key的时候,会把key的hash对根结构的长度取余,结果作为根结构的下标,再把key插入到下标对应的链表元素中

一般不会在这个时候排序插入,而是直接插在链表头部以提高性能,当链表元素过多时才排序转换成平衡二叉树(该处理来自http://ios.jobbole.com/87716/,里面提到NSDictionary和java的HashMap实现类似,而HashMap是转换成红黑树)

解决hash冲突

hash冲突即存在多个hash一样的key

一般来说拉链法需要涉及到解决hash冲突,但巧就巧在,ObjC中一般对象的hash就是它本身的地址,所以几乎是不可能冲突的,对于NSString这类重写了hash方法的,会同时要求重写isEqual方法。当真的遇到hash冲突的话,NSDictionary插入时会无视冲突,而在取数据时,在找到hash后会多一步通过isEqual对比是不是需要的key,如果不是就继续往下找,一般来说出现hash冲突的key都会在同一个链表的相邻位置,所以查找的消耗会非常的低

同时NSHashTable,NSSet,NSMapTable的实现都是基于拉链法生成的hash表

推荐阅读更多精彩内容