排序算法之——归并排序和快速排序

冒泡排序、插入排序、选择排序这三种算法的时间复杂度都为 $O(n^2)$ ，只适合小规模的数据。今天，我们来认识两种时间复杂度为 $O(nlogn)$ 的排序算法——归并排序（Merge Sort）和快速排序（Quick Sort），他们都用到了分治思想，非常巧妙。

1. 归并排序（Merge Sort）？

1.1. 归并排序算法实现

归并排序的核心思想其实很简单，如果要排序一个数组，我们先把数组从中间分成前后两部分，然后分别对前后两部分进行排序，再将排好序的两部分数据合并在一起就可以了。

归并排序

归并排序使用的是分治思想，分治也即是分而治之，将一个大问题分解为小的子问题来解决。分治算法一般都是用递归来实现的。分治是一种解决问题的处理思想，递归是一种编程技巧。
如果要对数组区间 [p, r] 的数据进行排序，我们先将数据拆分为两部分 [p, q] 和 [q+1, r]，其中 q 为中间位置。对两部分数据排好序后，我们再将两个子数组合并在一起。当数组的起始位置小于等于终止位置时，说明此时只有一个元素，递归也就结束了。

递推公式：
merge_sort(p…r) = merge(merge_sort(p…q), merge_sort(q+1…r))

终止条件：
p >= r 不用再继续分解

对两个子数组进行合并的过程如下所示，我们先建立一个临时数组，然后从两个子数组的起始位置开始比较，将较小的元素一个一个放入临时数组，直到其中一个子数组比较完毕，再将剩下的另一个子数组余下的值全部放到临时数组后面。最后我们需要将临时数组中的数据拷贝到原数组对应的位置。

数组合并

代码实现

// O(n(logn))
void Merge_Sort(float data[], int left, int right, float sorted_data[])
{
    if(left < right)
    {
        int mid = (left + right) / 2;
        Merge_Sort(data, left, mid, sorted_data);
        Merge_Sort(data, mid+1, right, sorted_data);
        Merge_Array(data, left, mid, right, sorted_data);
    }
}

void Merge_Array(float data[], int left, int mid, int right, float temp[])
{
    int i = left, j = mid + 1;
    int k = 0;

    // 从子数组的头开始比较
    while(i <= mid && j <= right)
    {
        if (data[i] <= data[j])
        {
            temp[k++] = data[i++];
        }
        else
        {
            temp[k++] = data[j++];
        }
    }

    // 判断哪个子数组还有元素，并拷贝到 temp 后面
    while(i <= mid)
    {
        temp[k++] = data[i++];
    }
    while(j <= right)
    {
        temp[k++] = data[j++];
    }

    // 将 temp 中的数据拷贝到原数组对应位置
    for(i = 0; i < k; i++)
    {
        data[left+i] = temp[i];
    }
}

/*哨兵简化*/
void Merge_Array(float data[], int left, int mid, int right, float temp[])
{
    int max_num = INT_MAX;
    int len = right - left + 1;
    int data_left = new int[mid-left+2];
    int data_right = new int[right-mid+1];
    int i = 0, j = 0, k = 0;

    // 复制左半部分元素，放置哨兵在末尾
    for(int k = left; k <= mid; k++)
    {
        data_left[k-left] = data[k];
    }
    data_left[k-left] = max_num;

    // 复制右半部分元素，放置哨兵在末尾
    for(int k = mid + 1; k <= right; k++)
    {
        data_right[k-mid-1] = data[k];
    }
    data_right[k-mid-1] = max_num;

    for (int k = 0; k < len; k++)
    {
        if (data_left[i] <= data_right[j])
        {
            data[k+left] = data_left[i++];
        }
        else
        {
            data[k+left] = data_right[j++];
        }
    }
}

1.2. 归并排序算法分析

归并排序是一个稳定的排序算法，在进行子数组合并的时候，我们可以设置当元素大小相等时，先将前半部分的数据放入临时数组，这样就可以保证相等元素在排序后依然保持原来的顺序。
不仅递归求解的问题可以写成递推公式，递归代码的时间复杂度也可以写成递归公式。
如果我们对 $n$ 个元素进行归并排序所需要的时间是 $T(n)$ ，那分解成两个子数组排序的时间都是 $T(\frac{n}{2})$ ，而合并两个子数组的时间复杂度为 $O(n)$ 。所以，归并排序的时间复杂度计算公式为：

$T(1) = C$
$T(n) = 2*T(\frac{n}{2}) + n, n>1$

n = 1 时，只需要常量级的执行时间，所以表示为 C。

$T(n) = 2*T(\frac{n}{2}) + n$
$= 2*[2*T(\frac{n}{4}) + \frac{n}{2}] + n = 4*T(\frac{n}{4}) + 2*n$
$= 4*[2*T(\frac{n}{8}) + \frac{n}{4}] + 2*n = 8*T(\frac{n}{8}) + 3*n$
$......$
$= 2^k * T(\frac{n}{2^k}) + k * n$
$......$
当 $\frac{n}{2^k} = 1$ 时， $k = log_2n$ ，代入上式得：
$T(n) = n * C + nlog_2n$
用大 O 标记法来表示，归并排序的时间复杂度为 $O(nlogn)$ 。

从我们的分析可以看出，归并排序的执行效率与原始数据的有序程度无关，其时间复杂度是非常稳定的，不管是最好情况、最坏情况，还是平均情况，时间复杂度都是 $O(nlogn)$ 。
归并排序有一个缺点，那就是它不是原地排序算法。在进行子数组合并的时候，我们需要临时申请一个数组来暂时存放排好序的数据。因为这个临时空间是可以重复利用的，因此归并排序的空间复杂度为 $O(n)$ ，最多需要存放 $n$ 个数据。

2. 快速排序（Quick Sort）？

1.1. 快速排序算法实现

快速排序的思想是这样的，如果要对数组区间 [p, r] 的数据进行排序，我们先选择其中任意一个数据作为 pivot（分支点），一般为区间最后一个元素。然后遍历数组，将小于 pivot 的数据放到左边，将大于 pivot 的数据放到右边。接着，我们再递归对左右两边的数据进行排序，直到区间缩小为 1 ，说明所有的数据都排好了序。

快速排序

递推公式：
quick_sort(p…r) = quick_sort(p…q-1) + quick_sort(q+1, r)

终止条件：
p >= r

归并排序是由下向上的，先处理子数组然后再合并。而快速排序正好相反，它的过程是由上向下的，先分出两个子区间，再对子区间进行排序。归并排序是稳定的时间复杂度为 $O(n)$ ，但它是非原地算法，而快排则是原地排序算法。

归并排序和快速排序

快速排序的分区过程如下所示，从左到右依次遍历数组，如遇到小于 pivot 的元素，则进行数据交换，否则继续往前进行，最后再放置 pivot。

快排分区
代码实现

// O(n(logn))
void Quick_Sort(float data[], int left, int right)
{
    if (left < right)
    {
        int i = left, j = left;
        int pivot = data[right];

        for (j = left; j < right; j++)
        {
            if (data[j] < pivot)
            {
                int temp = data[i];
                data[i] = data[j];
                data[j] = temp;
                i++;
            }
        }

        data[j] = data[i];
        data[i] = pivot;
        Quick_Sort(data, left, i-1);
        Quick_Sort(data, i+1, right);
    }
}

快速排序的另一种实现方式如下所示，先取出一个元素作为 pivot（假设是最后一个），这时 pivot 位置可以看作为空，然后从左到右查找第一个比 pivot 大的元素放在 pivot 的位置，此时空的地方变成了这第一个比 pivot 大的元素位置。然后从右到左查找第一个比 pivot 小的元素放在刚才空的位置，依次循环直到从左到右和从右到左都查找到了同一位置，这时候再把 pivot 放置在最后一个空位。这个过程可以形象的被称为“挖坑填坑”。

快速排序

代码实现

// O(n(logn))
void Quick_Sort(float data[], int left, int right)
{
    if (left < right)
    {
        int i = left, j = right;
        int pivot = data[j];
        while(i < j)
        {
            while(i < j && data[i] <= pivot) // 从左往右找到第一个比 pivot 大的数
            {
                i++;
            }
            if(i < j)
            {
                data[j--] = data[i];
            }
            while(i < j && data[j] >= pivot) // 从右往左找到第一个比 pivot 小的数
            {
                j--;
            }
            if(i < j)
            {
                data[i++] = data[j];
            }
        }
        data[i] = pivot; // i=j
        Quick_Sort(data, left, i-1);
        Quick_Sort(data, i+1, right);
    }
}

2.2. 快速排序算法分析

如果快速排序每次都将数据分成相等的两部分，则快排的时间复杂度和归并排序相同，也是 $O(nlogn)$ ，但这种情况是很难实现的。如果数据原来已经是有序的，则每次的分区都是不均等的，我们需要进行 n 次分区才能完成整个排序，此时快排的时间复杂度就退化成了 $O(n^2)$ 。
平均时间复杂度的求解也可以通过递归树来分析，这个问题留待我们以后再解决。我们现在只需要知道，在大部分情况下，快速排序的时间复杂度都可以做到 $O(nlogn)$ ，只有在极端情况下，才会退化成 $O(n^2)$ 。
快速排序是一个原地排序算法，是一个不稳定的排序算法，因为其在数据交换过程中可能会改变相等元素的原始位置。

3. 小结

归并排序和快速排序都是利用分治的思想，代码都通过递归来实现，过程非常相似。
归并排序非常稳定，时间复杂度始终都是 $O(nlogn)$ ，但不是原地排序；快速排序虽然最坏情况下时间复杂度为 $O(n^2)$ ，但平均情况下时间复杂度为 $O(nlogn)$ ，最坏情况发生的概率也比较小，而且是原地排序算法，因此应用得更加广泛。

参考资料-极客时间专栏《数据结构与算法之美》

获取更多精彩，请关注「seniusen」!

seniusen

最后编辑于：2019.12.03 22:14:26

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 159,835评论 4赞 364
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 67,598评论 1赞 295
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 109,569评论 0赞 244
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 44,159评论 0赞 213
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 52,533评论 3赞 287
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,710评论 1赞 222
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,923评论 2赞 313
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,674评论 0赞 203
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,421评论 1赞 246
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,622评论 2赞 245
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 32,115评论 1赞 260
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,428评论 2赞 254
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 33,114评论 3赞 238
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 26,097评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,875评论 0赞 197
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,753评论 2赞 276
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,649评论 2赞 271

排序算法之——归并排序和快速排序

1. 归并排序（Merge Sort）？

1.1. 归并排序算法实现

1.2. 归并排序算法分析

2. 快速排序（Quick Sort）？

1.1. 快速排序算法实现

2.2. 快速排序算法分析

3. 小结

推荐阅读更多精彩内容