排序算法

排序算法

基本方法,交换和比较:

public abstract class Sort<T extends Comparable<T>> {
    public abstract void sort(T[] nums);
    protected boolean less(T v, T w) {
        return v.compareTo(w) < 0;
    }

    protected void swap(T[] nums, int i, int j) {
        T tmp =  T[i];
        T[i] = T[j];
        T[j] = tmp;
    }
}

选择排序

public class Selection<T> extends Sort< T> {
    @Override
    public void sort(T[] nums) { 
        int size = nums.length;
        for (int i = 0; i < size; i++) {
            int less = i;
            for (int j = i; j < size; j++) {
                if (less(nums[j], nums[less])) {
                    less = j;
                }
            }
            swap(nums, i, less);
        } 
    }
}

不稳定。{5,5,2}就不稳定。

插入排序

public class Insertion<T> extends Sort<T> {
    @Override
    public void sort(T[] nums) {
        int size = nums.length;
        for (int i = 1; i < size; i++) {
            for (int j = i; j > 0 & less(T[j], T[j - 1]); j--) {
                swap(nums, j, j - 1);
            }
        } 
    }
}

可稳定。等于不再交换,所以可稳定。

冒泡排序

public class Bubble<T> extends Sort<T> {
    @Override
    public void sort(T[] nums) {
        int size = nums.length;
        boolean hasSorted = false;
        for (int i = 0; i < size && !hasSorted; i++) {
            hasSorted = true;
            for (int j = 0; j < size - i - 1; j++){
                if (less(T[j+1], T[j])) {
                    hasSorted = false;
                    swap(nums, j+1, j);
                }
            }
        }
    }
}

可稳定。等于不再交换,所以可稳定。

合并排序

方法解析:
https://blog.csdn.net/u010853261/article/details/54894057

public class Merge<T> extends Sort<T> {
    @Override
    public void sort(T[] nums) {
        
    }

    // recursive, from top to bottom.
    public void sort(T[] nums, int l, int r) {
        if (l >= r>) {
            return;
        }

        int m = (l + r) / 2;

        sort(nums, l, m);
        sort(nums, m, r);
        merge(nums, l, m, r);
    }

    public void merge(T[] nums, int l, int m, int h) {
        T[] tmps = new T[nums.length];
        //Arrays.copyOf();

        int i = l;
        int j = m + 1;
        int k = 0;
        while (i < m && j < h>) {
            if (less(tmps[i], tmps[j])) {
                nums[k++] = tmps[i++];
            } else {
                nums[k++] = tmps[j++];
            }
        }

        while (i < m) {
            nums[k++] = tmps[i++]; 
        }

        while (j < h) {
            nums[k++] = tmps[j++];
        }
    }


    // none recursive. from bottom to top
    @Override
    public void sort(T[] nums) {
        int N = nums.length;
        aux = (T[]) new Comparable[N];
        for (int sz = 1; sz < N; sz += sz)
            for (int lo = 0; lo < N - sz; lo += sz + sz)
                merge(nums, lo, lo + sz - 1, Math.min(lo + sz + sz - 1, N - 1));
    }
}

可稳定。合并过程中我们可以保证如果两个当前元素相等时,我们把处在前面的序列的元素保存在结果序列的前面,这样就保证了稳定性。

快速排序

快速排序几种写法:
https://blog.csdn.net/wusecaiyun/article/details/47862897

int mypartition(vector<int>&arr, i nt low, int high)  
 {  
     int pivot = arr[low];//选第一个元素作为枢纽元  
     int location = low;//location指向比pivot小的元素段的尾部  
     for(int i = low+1; i <= high; i++)//比枢纽元小的元素依次放在前半部分  
        if(arr[i] < pivot)  
            swap(arr[i], arr[++location]);  
     swap(arr[low], arr[location]);//注意和前面的区别,是为了保证交换到头部的元素比pivot小  
     return location;  
   
 }  
void quicksort(vector<int>&arr, int low, int high)  
{  
    if(low < high)  
    {  
        int middle = mypartition(arr, low, high);  
        quicksort(arr, low, middle-1);  
        quicksort(arr, middle+1, high);  
    }  
}  
public class Quick<T> extends Sort<T> {
    @Override
    public void sort(T[] nums) {
        sort(nums, 0, nums.length - 1);
    }

    public void sort(T[] nums, int l, int r) {
        if (l >= r>) {
            return;
        }

        int j = partition(nums, l, r);
        sort(nums, i, j - 1);
        sort(nums, j + 1, r);
    }

    public void partition(T[] nums, int l, int r) {
        T v = nums[l];
        int i = l;
        int j = r + 1;
        while (true) {
            while (less(nums[++i], v) && i != r);
            while (less(v, nums[--j]) && j != l);
            if (i > j) break;
            swap (nums, i, j);
        }
        swap (nums, l, j);
        return j;
    }
}

不稳定。因为后边的数字可能会被交换到前边。

如果元素较少,那么采用插入排序可以节省性能。

为避免元素基准点选择不均匀,那么可以采用三数取中作为基准。有关枢纽值的选取有很多种思路,随机选取

public class ThreeMidQuick<T> extends Quick<T> {

    @overide
    public void sort(T[] nums, int l, int r) {
        if (l >= r>) {
            return;
        }

        selectMidToFirst(nums, l, r);

        int j = partition(nums, l, r);
        sort(nums, i, j - 1);
        sort(nums, j + 1, r);
    }

    private void selectMidToFirst(T[] nums, int l, int r) {
        int mid = (l + r) > 2;
        if (less(nums, mid, l) && less(nums, l, r)) {
            return; //mid->l, no swap.
        }

        if (less(nums, l, mid) && less(nums, mid, r)) {
            swap(nums, l, mid); // mid -> mid, swap(l, mid)
            return;
        }

        swap(nums, l, r); // mid -> r, swap(l, r)
    }
}

如果有很多重复的元素,那么可以使用三分法,如下讲数组分拆为三部分,< = >的部分。然后对< 和 > 再进行quicksort即可,如下:

public class ThreeWayQuickSort<T extends Comparable<T>> extends QuickSort<T> {
    @Override
    protected void sort(T[] nums, int l, int h) {
        if (h <= l)
            return;
        int lt = l, i = l + 1, gt = h;
        T v = nums[l];
        while (i <= gt) {
            int cmp = nums[i].compareTo(v);
            if (cmp < 0)
                swap(nums, lt++, i++);
            else if (cmp > 0)
                swap(nums, i, gt--);
            else
                i++;
        }
        sort(nums, l, lt - 1);
        sort(nums, gt + 1, h);
    }
}

查找数组的第K大元素

快速排序的 partition() 方法,会返回一个整数 j 使得 a[l..j-1] 小于等于 a[j],且 a[j+1..h] 大于等于 a[j],此时 a[j] 就是数组的第 j 大元素。

可以利用这个特性找出数组的第 k 个元素。

public T select(T[] nums, int k) {
    int l = 0, h = nums.length - 1;
    while (h > l) {
        int j = partition(nums, l, h);
        if (j == k)
            return nums[k];
        else if (j > k)
            h = j - 1;
        else
            l = j + 1;
    }
    return nums[k];
}

该算法是线性级别的,因为每次正好将数组二分,那么比较的总次数为 (N+N/2+N/4+..),直到找到第 k 个元素,这个和显然小于 2N。

堆排序

http://www.cnblogs.com/penghuwan/p/7894728.html

构建堆

从左到右,依次上浮;
从右一半到左, 依次下沉。(更高效, 因为“下沉”需要遍历的节点数比“上浮”需要遍历的节点数少了一半)

int N = nums.length;
for (int i = N/2; i >= 1; i--) {
    sink(nums, i, N); //大根堆
}

单个堆节点的有序化有两种情况:
当某个节点变得比它的父节点更大而被打破(或是在堆底加入一个新元素时候),我们需要由下至上恢复堆的顺序
当某个节点的优先级下降(例如,将根节点替换为一个较小的元素)时,我们需要由上至下恢复堆的顺序
实现这两种有序化的操作,分别叫做“上浮”(swim)和“下沉” (sink)

选择元素,每次确定一个N, N-1,然后交换到顶端,从1开始下沉。所以最终只需要使用下沉操作即可。算法如下:

public class HeapSort<T extends Comparable<T>> extends Sort<T> {
    /**
     * 数组第0个位置不能有元素
     */
    @Override
    public void sort(T[] nums) {
        int N = nums.length;
        for (int i = N/2; i >= 1; i--) {
            sink(nums, i, N); //大根堆
        }

        while (N > 1) {
            swap(nums, 1, N--); // 每一次确定一个N, N-1, N-2...1
            sink(nums, 1, N);
        }
    }

    private void sink(T[] nums, int k, int N) {
        while (2 * k <= N) {
            int j = 2 * k;
            if (j < N && less(nums, j, j + 1))
                j++;
            if (!less(nums, k, j))
                break;
            swap(nums, k, j);
            k = j;
        }
    }

    private boolean less(T[] nums, int i, int j) {
        return nums[i].compareTo(nums[j]) < 0;
    }

    private void swim(int k) {
        while (k > 1 && less(k / 2, k)) {
            swap(k / 2, k);
            k = k / 2;
        }
    }

    public void insert(Comparable v) {
        heap[++N] = v;
        swim(N);
    }

    public T delete() {
        swap(nums, 1, N--); // 每一次确定一个N, N-1, N-2...1
        sink(nums, 1, N);
    }
}

堆排序的复杂度

一个堆的高度为 logN,因此在堆中插入元素和删除最大元素的复杂度都为 logN。

对于堆排序,由于要对 N 个节点进行下沉操作,因此复杂度为 NlogN。

堆排序时一种原地排序,没有利用额外的空间。

现代操作系统很少使用堆排序,因为它无法利用缓存,也就是数组元素很少和相邻的元素进行比较。

排序稳定性和复杂度问题

  1. 排序算法的比较
算法  稳定  时间复杂度   空间复杂度   备注
选择排序    no  N2  1   
冒泡排序    yes N2  1   
插入排序    yes N ~ N2  1   时间复杂度和初始顺序有关
希尔排序    no  N 的若干倍乘于递增序列的长度 1   
快速排序    no  NlogN   logN    
三向切分快速排序    no  N ~ NlogN   logN    适用于有大量重复主键
归并排序    yes NlogN   N   
堆排序 no  NlogN   1   

快速排序是最快的通用排序算法,它的内循环的指令很少,而且它还能利用缓存,因为它总是顺序地访问数据。它的运行时间近似为 ~cNlogN,这里的 c 比其他线性对数级别的排序算法都要小。使用三向切分快速排序,实际应用中可能出现的某些分布的输入能够达到线性级别,而其它排序算法仍然需要线性对数时间。

  1. Java 的排序算法实现
    Java 主要排序方法为 java.util.Arrays.sort(),对于原始数据类型使用三向切分的快速排序,对于引用类型使用归并排序。

稳定行分析:

https://blog.csdn.net/DeepLies/article/details/52593597
https://blog.csdn.net/weiwenhp/article/details/8621049

其他种排序思路

https://www.cnblogs.com/ECJTUACM-873284962/p/6935506.html#autoid-1-1-0
https://www.cnblogs.com/ttltry-air/archive/2012/08/04/2623302.html

桶排序

分成若干个有序的区间桶,每个区间单独排序,然后串联起来即可。
[图片上传失败...(image-eb7532-1533265888436)]

基数排序

看基数,比如10进制数那么就有10个数组链表,类似hashmap,然后进行个位数,十位数,百位数...等k次全数组遍历,每次都从0-10数组链表开始遍历,每个万位到最大数即可。

1 pass #0: 170 45 75 90 2 24 802 66 
2 pass #1: 170 90 2 802 24 45 75 66 
3 pass #2: 2 802 24 45 66 170 75 90 
4 pass #3: 2 24 45 66 75 90 170 802 

计数排序

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,736评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,167评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,442评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,902评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,302评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,573评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,847评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,562评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,260评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,531评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,021评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,367评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,016评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,068评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,827评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,610评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,514评论 2 269

推荐阅读更多精彩内容

  • 总结一下常见的排序算法。 排序分内排序和外排序。内排序:指在排序期间数据对象全部存放在内存的排序。外排序:指在排序...
    jiangliang阅读 1,269评论 0 1
  • 概述 排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部...
    蚁前阅读 5,101评论 0 52
  • 转载自:https://egoistk.github.io/2016/09/10/Java%E6%8E%92%E5...
    chad_it阅读 947评论 0 18
  • 概述:排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部...
    每天刷两次牙阅读 3,706评论 0 15
  • 文:若木菡 摄影:京京京杭 谁在水中央 独依大石旁 玉环凝脂非细腰 飞燕身轻非樱桃 虽无寒江雪 分明一钓翁 蓑衣...
    若木菡阅读 771评论 7 13