IOS排序算法之桶排序、计数排序、基数排序

桶排序、计数排序、基数排序和前面讲的那些排序有所不同，不是基于比较的排序算法，而是一种线性排序。他们的时间复杂度更低：O(n)，但是对要排序的数据要求很苛刻，所以我们今天学习重点的是掌握这些排序算法的适用场景。

桶排序

首先，我们来看桶排序。桶排序，顾名思义，会用到“桶”，核心思想是将要排序的数据分到几个有序的桶里，每个桶里的数据再单独进行排序。桶内排完序之后，再把每个桶里的数据按照顺序依次取出，组成的序列就是有序的了。

image.png

桶排序的时间复杂度为什么是O(n)呢?我们一块儿来分析一.下。

如果要排序的数据有n个，我们把它们均匀地划分到m个桶内，每个桶里就有k=n/m个元素。每个桶内部使用快速排序，时间复杂度为O(k * logk)。m个桶排序的时间复杂度就是O(m*k logk),因为k=n/m,所以整个桶排序的时间复杂度就是0(nlog(n/m))。当桶的个数m接近数据个数n时，log(n/m) 就是一个非常小的常量，这个时候桶排序的时间复杂度接近0(n)。

桶排序看起来很优秀，那它是不是可以替代我们之前讲的排序算法呢?

答案当然是否定的。为了让你轻松理解桶排序的核心思想，我刚才做了很多假设。实际上，桶排序对要排序数据的要求是非常苛刻的。

首先，要排序的数据需要很容易就能划分成m个桶，并且，桶与桶之间有着天然的大小顺序。这样每个桶内的数据都排序完之后，桶与桶之间的数据不需要再进行排序。

其次，数据在各个桶之间的分布是比较均匀的。如果数据经过桶的划分之后，有些桶里的数据非常多，有些非常少，很不平均，那桶内数据排序的时间复杂度就不是常量级了。在极端情况下，如果数据都被划分到一个桶里，那就退化为O(nlogn)的排序算法了。

桶排序比较适合用在外部排序中

所谓的外部排序就是数据存储在外部磁盘中，数据量比较大，内存有限，无法将数据全部加载到内存中。

比如说我们有10GB的订单数据，我们希望按订单金额(假设金额都是正整数)进行排序，但是我们的内存有限，只有几百MB,没办法- - -次性把10GB的数据都加载到内存中。这个时候该怎么办呢?

现在我来讲一下，如何借助桶排序的处理思想来解决这个问题。

我们可以先扫描一遍文件，看订单金额所处的数据范围。假设经过扫描之后我们得到，订单金额最小是1元，最大是10万元。我们将所有订单根据金额划分到100个桶里，第一个桶我们存储金额在1元到1000元之内的订单，第二桶存储金额在1001元到2000元之内的订单，以此类推。每一个桶对应一个文件，并且按照金额范围的大小顺序编号命名(00, 01, 02...99) 。

理想的情况下，如果订单金额在1到10万之间均匀分布，那订单会被均匀划分到100个文件中，每个小文件中存储大约100MB的订单数据，我们就可以将这100个小文件依次放到内存中，用快排来排序。等所有文件都排好序之后，我们只需要按照文件编号，从小到大依次读取每个小文件中的订单数据，并将其写入到一个文件中，那这个文件中存储的就是按照金额从小到大排序的订单数
据了。

不过，你可能也发现了，订单按照金额在1元到10万元之间并不一-定是均匀分布的，所以10GB订单数据是无法均匀地被划分到100个文件中的。有可能某个金额区间的数据特别多，划分之后对应的文件就会很大，没法一次性读入内存。这又该怎么办呢?

针对这些划分之后还是比较大的文件，我们可以继续划分，比如，订单金额在1元到1000元之间的比较多，我们就将这个区间继续划分为10个小区间，1元到100元，101 元到200元，201 元到300元...901元到1000元。如果划分之后，101 元到200元之间的订单还是太多，无法- -次性读入内存，那就继续再划分，直到所有的文件都能读入内存为止。

代码如下:

#pragma mark -
#pragma mark 桶排序
- (void)bucketSort:(NSMutableArray *)datasource
{
    //预计每个桶内能装3个
    NSInteger size = 3;
    
    //桶的数量
    NSInteger bucketsCount = datasource.count / size;
    
    //找出最小值和最大值
    NSInteger min = [datasource[0] integerValue];
    NSInteger max = [datasource[0] integerValue];
    
    for (NSNumber *number in datasource)
    {
        if (number.integerValue < min)
        {
            min = number.integerValue;
        }
        
        if (number.integerValue > max)
        {
            max = number.integerValue;
        }
    }
    
    //平均值
    NSInteger average = ceil((double)(max - min)/(double)bucketsCount);
    
    NSMutableDictionary *dictionary = [NSMutableDictionary dictionary];
    
    for (NSInteger i = 0; i < bucketsCount; i++)
    {
        NSMutableArray *bucketArray = [NSMutableArray array];
        NSString *key = [NSString stringWithFormat:@"%@-%@",@(min + i * average),@(min + (i + 1) * average)];
        [dictionary setValue:bucketArray forKey:key];
    }
    
    for (NSNumber *number in datasource)
    {
        NSInteger i = floor((double)(number.integerValue - min) / (double)average);
        NSString *key = [NSString stringWithFormat:@"%@-%@",@(min + i * average),@(min + (i + 1) * average)];
        NSMutableArray *bucketArray = [dictionary valueForKey:key];
        [bucketArray addObject:number];
    }
    
    NSInteger length = 0;
    for (NSInteger i = 0; i < dictionary.allKeys.count; i++)
    {
        NSString *key = [NSString stringWithFormat:@"%@-%@",@(min + i * average),@(min + (i + 1) * average)];
        NSMutableArray *bucketArray = [dictionary objectForKey:key];
        [self quickSort:bucketArray];
        [datasource replaceObjectsAtIndexes:[NSIndexSet indexSetWithIndexesInRange:NSMakeRange(length, bucketArray.count)] withObjects:bucketArray];
        length += bucketArray.count;
    }
}

计数排序

我个人觉得，计数排序其实是桶排序的-种特殊情况。当要排序的n个数据，所处的范围并不大的时候，比如最大值是k,我们就可以把数据划分成k个桶。每个桶内的数据值都是相同的，省掉了桶内排序的时间。

我们都经历过高考，高考查分数系统你还记得吗?我们查分数的时候，系统会显示我们的成绩以及所在省的排名。如果你所在的省有50万考生，如何通过成绩快速排序得出名次呢?

考生的满分是900分，最小是0分，这个数据的范围很小，所以我们可以分成901个桶，对应分数从0分到900分。根据考生的成绩，我们将这50万考生划分到这901个桶里。桶内的数据都是分数相同的考生，所以并不需要再进行排序。我们只需要依次扫描每个桶，将桶内的考生依次输出到一个数组中，就实现了50万考生的排序。因为只涉及扫描遍历操作，所以时间复杂度是O(n)。

计数排序的算法思想就是这么简单，跟桶排序非常类似，只是桶的大小粒度不一样。不过，为什么这个排序算法叫“计数”排序呢?“计数”的含义来自哪里呢?

想弄明白这个问题，我们就要来看计数排序算法的实现方法。我还拿考生那个例子来解释。为了方便说明，我对数据规模做了简化。假设只有8个考生，分数在0到5分之间。这8个考生的成绩我们放在一个数组A[8]中，它们分别是: 2, 5, 3, O, 2, 3, O, 3。

考生的成绩从0到5分，我们使用大小为6的数组C[6]表示桶，其中下标对应分数。不过，C[6]内存储的并不是考生，而是对应的考生个数。像我刚刚举的那个例子，我们只需要遍历一遍考生分数，就可以得到C[6]的值。

image.png

从图中可以看出，分数为 3 分的考生有 3 个，小于 3 分的考生有 4 个，所以，成绩为 3 分的考生在排序之后的有序数组 R[8] 中，会保存下标 4，5，6 的位置。

image.png

那我们如何快速计算出，每个分数的考生在有序数组中对应的存储位置呢?这个处理方法非常巧
妙，很不容易想到。

思路是这样的:我们对C[6]数组顺序求和，C[6] 存储的数据就变成了下面这样子。C[k] 里存储小
于等于分数k的考生个数。

image.png

有了前面的数据准备之后，现在我就要讲计数排序中最复杂、最难理解的一部分了，请集中精力跟着我的思路!

我们从后到前依次扫描数组A。比如，当扫描到3时，我们可以从数组C中取出下标为3的值7,也就是说，到目前为止，包括自己在内，分数小于等于3的考生有7个，也就是说3是数组R中的第7个元素(也就是数组R中下标为6的位置)。当3放入到数组R中后，小于等于3的元素就只剩下了6个了，所以相应的C[3]要减1,变成6。

以此类推，当我们扫描到第2个分数为3的考生的时候，就会把它放入数组R中的第6个元素的位置(也就是下标为5的位置)。当我们扫描完整个数组A后，数组R内的数据就是按照分数从小到大有序排列的了。

image.png

代码如下：

#pragma mark -
#pragma mark 计数排序
- (void)countingSort:(NSMutableArray *)a
{
    if (a.count <= 1)
    {
        return;
    }
    
    NSInteger max = [a[0] integerValue];
    
    for (NSNumber *number in a)
    {
        if (number.integerValue > max)
        {
            max = number.integerValue;
        }
    }
    
    NSMutableArray *c = [NSMutableArray array];
    
    for (NSInteger i = 0; i <= max; i++)
    {
        [c addObject:@(0)];
    }
    
    NSMutableArray *r = [NSMutableArray array];
    for (NSInteger i = 0; i < a.count; i++)
    {
        [r addObject:@(0)];
        
        NSNumber *index = a[i];
        NSNumber *count = c[index.integerValue];
        [c replaceObjectAtIndex:index.integerValue withObject:@(count.integerValue + 1)];
    }
    
    for (NSInteger i = 1; i <= max; i++)
    {
        [c replaceObjectAtIndex:i withObject:@([c[i] integerValue] + [c[i - 1] integerValue])];
    }
    
    for (NSInteger i = a.count - 1; i >= 0; i--)
    {
        NSNumber *index = a[i];
        NSInteger count = [c[index.integerValue] integerValue] - 1;
        
        [r replaceObjectAtIndex:count withObject:a[i]];
        [c replaceObjectAtIndex:index.integerValue withObject:@(count)];
    }
    
    for (NSInteger i = 0; i < a.count; i++)
    {
        [a replaceObjectAtIndex:i withObject:r[i]];
    }
}

这种利用另外一个数组来计数的实现方式是不是很巧妙呢?这也是为什么这种排序算法叫计数排序的原因。不过，你千万不要死记硬背上面的排序过程，重要的是理解和会用。

我总结一下，计数排序只能用在数据范围不大的场景中，如果数据范围k比要排序的数据n大很多，就不适合用计数排序了。而且,计数排序只能给非负整数排序，如果要排序的数据是其他类型的，要将其在不改变相对大小的情况下，转化为非负整数。

比如，还是拿考生这个例子。如果考生成绩精确到小数后- -位，我们就需要将所有的分数都先乘以10，转化成整数，然后再放到9010个桶内。再比如，如果要排序的数据中有负数，数据的范围是[-1000, 1000]，那我们就需要先对每个数据都加1000,转化成非负整数。

基数排序

我们再来看这样一个排序问题。假设我们有10万个手机号码，希望将这10万个手机号码从小到大排序，你有什么比较快速的排序方法呢?

我们之前讲的快排，时间复杂度可以做到O(nlogn),还有更高效的排序算法吗?桶排序、计数排序能派上用场吗?手机号码有11位，范围太大，显然不适合用这两种排序算法。针对这个排序问题，有没有时间复杂度是O(n)的算法呢?现在我就来介绍一种新的排序算法，基数排序。

刚刚这个问题里有这样的规律:假设要比较两个手机号码a, b的大小，如果在前面几位中，a手机号码已经比b手机号码大了，那后面的几位就不用看了。

借助稳定排序算法，这里有一个巧妙的实现思路。还记得我们第11节中，在阐述排序算法的稳定性的时候举的订单的例子吗?我们这里也可以借助相同的处理思路，先按照最后一位来排序手机号码，然后，再按照倒数第二位重新排序，以此类推，最后按照第一位重新排序。经过11次排序之后，手机号码就都有序了。

手机号码稍微有点长，画图比较不容易看清楚，我用字符串排序的例子，画了一张基数排序的过程分解图，你可以看下。

image.png

注意，这里按照每位来排序的排序算法要是稳定的，否则这个实现思路就是不正确的。因为如果是非稳定排序算法，那最后一次排序只会考虑最高位的大小顺序，完全不管其他位的大小关系，那么低位的排序就完全没有意义了。

根据每一位来排序，我们可以用刚讲过的桶排序或者计数排序，它们的时间复杂度可以做到O(n)。如果要排序的数据有k位，那我们就需要k次桶排序或者计数排序，总的时间复杂度是O(k*n)。当k不大的时候，比如手机号码排序的例子，k最大就是11，所以基数排序的时间复杂度就近似于O(n)。

实际上，有时候要排序的数据并不都是等长的，比如我们排序牛津字典中的20万个英文单词，最短的只有1个字母，最长的我特意去查了下，有45个字母，中文翻译是尘肺病。对于这种不等长的数据，基数排序还适用吗?

实际上，我们可以把所有的单词补齐到相同长度，位数不够的可以在后面补“0”，因为根据ASClI值，所有字母都大于“O”，所以补“0”不会影响到原有的大小顺序。这样就可以继续用基数排序了。

我来总结一下，基数排序对要排序的数据是有要求的，需要可以分割出独立的“位”来比较，而且位之间有递进的关系，如果a数据的高位比b数据大，那剩下的低位就不用比较了。除此之外，每一位的数据范围不能太大，要可以用线性排序算法来排序，否则，基数排序的时间复杂度就无法做到O(n)了。

代码如下：

#pragma mark -
#pragma mark 基数排序
- (void)radixSort:(NSMutableArray *)datasource
{
    NSMutableArray *bucket = [self createBucket];
    NSInteger maxNumber = [self listMaxItem:datasource];
    NSInteger maxLength = [self numberLength:maxNumber];
    
    for (NSInteger digit = 1; digit <= maxLength; digit++)
    {
        //入桶
        for (NSNumber *number in datasource)
        {
            NSInteger baseNumber = [self fetchBaseNumber:number.integerValue digit:digit];
            NSMutableArray *subArray = bucket[baseNumber];
            [subArray addObject:number];
        }
        
        //出桶
        NSInteger index = 0;
        
        for (NSInteger i = 0; i < bucket.count; i++)
        {
            NSMutableArray *subArray = bucket[i];
            while (subArray.count > 0)
            {
                NSNumber *item = subArray[0];
                [datasource replaceObjectAtIndex:index withObject:item];
                [subArray removeObjectAtIndex:0];
                index++;
            }
        }
    }
}

//创建10个空桶
- (NSMutableArray *)createBucket
{
    NSMutableArray *bucketArray = [NSMutableArray array];
    
    for (NSInteger i = 0; i < 10; i++)
    {
        [bucketArray addObject:[NSMutableArray array]];
    }
    
    return bucketArray;
}

//计算无序序列中最大的数值
- (NSInteger)listMaxItem:(NSArray *)array
{
    NSInteger maxNumber = [array[0] integerValue];
    
    for (NSNumber *number in array)
    {
        if (maxNumber < number.integerValue)
        {
            maxNumber = number.integerValue;
        }
    }
    
    return maxNumber;
}

//获取数字的长度
- (NSInteger)numberLength:(NSInteger)number
{
    NSString *numberStr = [NSString stringWithFormat:@"%ld",(long)number];
    
    return numberStr.length;
}

//获取数值中特定位数的值
- (NSInteger)fetchBaseNumber:(NSInteger)number digit:(NSInteger)digit
{
    if (digit > 0 && digit <= [self numberLength:number])
    {
        NSMutableArray *numbersArray = [NSMutableArray array];
        
        NSString *numberStr = [NSString stringWithFormat:@"%ld",(long)number];
    
        for (NSInteger i = 0; i < numberStr.length; i++)
        {
            NSString *subStr = [numberStr substringWithRange:NSMakeRange(i, 1)];
            [numbersArray addObject:[NSNumber numberWithInteger:subStr.integerValue]];
        }
        
        return [numbersArray[numbersArray.count - digit] integerValue];
    }
    
    return 0;
}

内容小结

今天，我们学习了3种线性时间复杂度的排序算法，有桶排序、计数排序、基数排序。它们对要排序的数据都有比较苛刻的要求，应用不是非常广泛。但是如果数据特征比较符合这些排序算法的要求，应用这些算法，会非常高效，线性时间复杂度可以达到0(n)。

桶排序和计数排序的排序思想是非常相似的，都是针对范围不大的数据，将数据划分成不同的桶来实现排序。基数排序要求数据可以划分成高低位，位之间有递进关系。比较两个数，我们只需要比较高位，高位相同的再比较低位。而且每一-位的数据范围不能太大，因为基数排序算法需要借助桶排序或者计数排序来完成每- -个位的排序工作。

最后：

自己写了一个NSMutableArray+GLYSort算法分类，只需1行代码，即可完成复杂排序操作。

最后编辑于：2019.01.03 11:15:07

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 156,757评论 4赞 359
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 66,478评论 1赞 289
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 106,540评论 0赞 237
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 43,593评论 0赞 203
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 51,903评论 3赞 285
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,329评论 1赞 210
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,659评论 2赞 309
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,383评论 0赞 195
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,055评论 1赞 238
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,337评论 2赞 241
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 31,864评论 1赞 256
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,227评论 2赞 251
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 32,820评论 3赞 231
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 25,999评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,750评论 0赞 192
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,365评论 2赞 269
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,260评论 2赞 258

IOS排序算法之桶排序、计数排序、基数排序

桶排序

桶排序看起来很优秀，那它是不是可以替代我们之前讲的排序算法呢?

桶排序比较适合用在外部排序中

计数排序

基数排序

内容小结

最后：

推荐阅读更多精彩内容