Crack the Fxxking QuickSort

做题做到 QuickSelect,结果感觉已经有点记不清 QS 了……在此用力复习一下 QS。

本文解答所有关于 QS 的疑难杂症。

首先上代码,来自 Sedgewick 的 Algorithm:

public class Quick
{
    public static void sort(Comparable[] a)
    {
        StdRandom.shuffle(a);          // Eliminate dependence on input.
        sort(a, 0, a.length - 1);
    }

    private static void sort(Comparable[] a, int lo, int hi)
    {
        if (hi <= lo) return;
        int j = partition(a, lo, hi);    // Partition (see page 291).
        sort(a, lo, j - 1);              // Sort left part a[lo .. j-1].
        sort(a, j + 1, hi);              // Sort right part a[j+1 .. hi].
    }

    private static int partition(Comparable[] a, int lo, int hi)
    {  // Partition into a[lo..i-1], a[i], a[i+1..hi].
        int i = lo, j = hi + 1;          // left and right scan indices
        Comparable v = a[lo];            // partitioning item
        while (true)
        {  // Scan right, scan left, check for scan complete, and exchange.
            while (less(a[++i], v)) if (i == hi) break;
            while (less(v, a[--j])) if (j == lo) break;
            if (i >= j) break;
            exch(a, i, j);
        }
        exch(a, lo, j);    // Put v = a[j] into position
        return j;          // with a[lo..j-1] <= a[j] <= a[j+1..hi].
    }
}

1. QuickSort 的总体思路:

在要排序的序列中选定一个 pivot(这里选最左边的元素),将序列进行 partition,使得所有位于pivot 左边的元素都小于 pivot,位于右边的元素都大于 pivot,但此时左右两部分被视为无序状态:

[……(无序的左边部分)……],[(pivot)],[……(无序的右边部分)……]

这样还不足以排序, 但我们发现,只要分别 sort 一下左边和右边部分,整个序列就有序了:

function sort(a[])
{
  partition(a[]);
  sort(a[]左边部分);
  sort(a[]右边部分);
}

到此QuickSort 已经结束了,EOF

——“然鹅,sort 左边部分和右边部分不还是要 sort 吗?我们还是没有实现 sort 啊!”

不过可能你已经发现了,上面那个 function sort(a[]) 是一个递归函数!也就是说,每次我们分成左右两个子序列,都要进行 parttition,直到这个子序列只有一个元素!这样仅靠 partition,我们就完成了排序,sort()函数作为递归体,不断调用 partition()来处理子序列

2. partition()

到此,我们已经知道 partition 要达到什么目的,只需要再实现 partition 的功能:首先先要选取一个 pivot,关于 pivot 的选取至关重要,因为会极大地影响复杂度,稍后详细分析时间复杂度。

public class QuickSort
{
    public static int partition(int[] a, int low, int high)
    {
        int pivot = int[low];
        int i = low, j = high + 1;
        while(true)
        {
            while(a[++ i] < pivot)  // pointer i keeps going if pointed element is less than pivot
            {
                if(i >= high)   break;
            }
            while(a[-- j] > pivot)  // pointer j keeps going if pointed element is larger than pivot
            {
                if(j <= low)    break;
            }
            if(i >= j)  // if two pointer cross
                break;
            swap(a, i , j);
        }
        swap(a, low, j);    // put pivot between two partitions
        return j;           // return the index of pivot
    }

    public static void sort(int[] a, int low, int high)
    {
        int pivotIndex = partition(a, low, high);
        sort(a, low, pivot - 1);
        sort(a, pivot + 1, high);
    }
}

*为什么与 pivot 比较的时候是“<”、">"?为什么还要交换两个相同的元素?
理想状态下我们希望每次切分都得到两个规模相同的子序列,也就是说 i,j 两个指针能停下来的时候就停下来,从而使最后 Pivot 的位置保持一个比较靠中间的位置。否则,pivot 最终的 index 过于偏向一边,就会增大递归的深度(best case是logN,而 worst case 则是 N)。

3. 3-way-partition

如果元素大量重复,上述办法则还有可以提高的空间,因为我们交换了大量重复的元素,还可以压榨这部分的复杂度:

Sedgewick 配图相当好,注意 lt 、gt 和 i 三个指针的位置(相当精确);灰色部分是当前还没扫描到的部分

对于每次切分:从数组的左边到右边遍历一次,维护三个指针,其中lt指针使得元素(arr[0]-arr[lt-1])的值均小于切分元素;gt指针使得元素(arr[gt+1]-arr[N-1])的值均大于切分元素;i指针使得元素(arr[lt]-arr[i-1])的值均等于切分元素,(arr[i]-arr[gt])的元素还没被扫描,切分算法执行到i>gt为止。每次切分之后,位于gt指针和lt指针之间的元素的位置都已经被排定,不需要再去处理了。之后将(lo,lt-1),(gt+1,hi)分别作为处理左子数组和右子数组的递归函数的参数传入,递归结束,整个算法也就结束。

public class Quick3way
{
     private static void sort(Comparable[] a, int lo, int hi)
     {  
        if (hi <= lo) return;
        int lt = lo, i = lo+1, gt = hi;
        Comparable v = a[lo];
        while (i <= gt)
        {
           int cmp = a[i].compareTo(v);
           if      (cmp < 0) exch(a, lt++, i++);
           else if (cmp > 0) exch(a, i, gt--);
           else              i++;
        }  // Now a[lo..lt-1] < v = a[lt..gt] < a[gt+1..hi].
        sort(a, lo, lt - 1);
        sort(a, gt + 1, hi);
     }
}

这里就没有一个单独的 partition(),而是将其整合进了 sort() 里面。

4. pivot 的选取

pivot 的选取至关重要,理想状态是每次都取到位于中间的 pivot,这样就能保证递归深度为 LogN。如果对一个一定程度上有序的序列使用这种快排,复杂度则是 O(n)。

改进:虽然我们每次都取最左边的当 pivot,但只要在取之前对 array 进行 shuffle,将有序性去除,就能很好的避免掉进 O(N)递归深度的坑里。

至于 shuffle 的方式有好几种,比如 kunth-shuffle 等等,another story。我们也可以直接用 API。

5. 复杂度分析

(鸽)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,219评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,363评论 1 293
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,933评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,020评论 0 206
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,400评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,640评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,896评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,597评论 0 199
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,327评论 1 244
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,581评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,072评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,399评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,054评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,083评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,849评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,672评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,585评论 2 270

推荐阅读更多精彩内容

  • 算法简介 是一种分治的排序算法,特点就是快,而且效率高。 基本思路 通过一趟排序将待排元素分隔成独立的两部分,其中...
    TinyDolphin阅读 3,346评论 0 3
  • 选择排序 选择排序是一种简单直观的排序算法,无论什么数据进去都是 O(n?) 的时间复杂度。所以用到它的时候,数据...
    无沣阅读 1,244评论 0 0
  • 代码虽源自抄袭,自己重写时改了一下变量名,消化更好了_ 冒泡排序(Bubble Sort) 1. 算法步骤 比较相...
    _july77阅读 177评论 0 1
  • 昨晚得知老弟脱单,我开心到吼起来,感慨这个围绕在我们家几年的话题梗终于破解了。我是家里第一个知道的,这个秘密我是守...
    明小神阅读 554评论 0 0
  • 相见欢·午后东湖 尝踱凌波门前,小舟闲。醉其白云在水水接天。 今风过,黄叶落,烟雨寒。愁若花少长放月少圆。
    一只有了思想的猴子阅读 207评论 4 3