希尔排序及其优化

算法简介

希尔排序的由来:1959 年 Shell 发明;第一个突破 O(n^2) 的排序算法;是简单插入排序的改进版;它与插入排序的不同之处在于,它会优先比较距离较远的元素。希尔排序又叫缩小增量排序

基本思路

希尔排序为了加快速度简单的改进了插入排序,交换不相邻的元素以对数组的局部进行排序,并最终用插入排序局部有序的数组排序。(局部有序的数组很适合插入排序)

Q:希尔排序的思想?
A:使数组中任意间隔为 h 的元素都是有序的。这样的数组被称为 h 有序数组,也就是说:一个 h 有序数组就是 h 个相互独立有序数组编织在一起组成的一个数组。

Q:它的一种实现方法?
A:在插入排序的代码中将移动元素的距离由 1 改为 h 即可。

Q:h 的取值?
A:增幅 h 的初始值是数组长度乘以一个常数因子,最小为 1 。 例如: while( h < arr.length/3 ) h = 3 * h + 1 ; //(1、4、13、40、121、364、1093…)
尝试使用 while( h < arr.length/5 ) h = 5 * h + 1 ;// 1、6、31、156、781... ,速度会变快。

优点:希尔排序对于中等大小的数组,运行时间是可以接受的,代码量少,且不需要使用额外的内存空间。

运行轨迹

增幅 h 的初始值是数组长度乘以一个常数因子,最小为 1 。
当 h = 4 时,4-sort;
当 h = 1 时,1-sort;


h 的增幅:1、4、13、40、121、364、1093…
希尔排序,仅供参考,递增数列与本文不同

代码实现

根据排序算法类的模板实现希尔排序(提醒:点蓝字查看详情)

import java.util.Random;

/**
 * 希尔排序
 *
 * @author TinyDolphin
 *         2017/5/30 22:33.
 */
public class Shell {
    /**
     * 排序实现
     *
     * @param arr 待排序数组
     */
    public static void sort(Comparable[] arr) {
        int length = arr.length;
        int h = 1;
        while (h < length / 3) {
            h = 3 * h + 1;  // 1 , 4 , 13 , 40 , 121 , 364 , 1093...
        }
        while (h >= 1) {
            // 将数组变为 h 有序
            for (int indexI = h; indexI < length; indexI++) {
                for (int indexJ = indexI; indexJ >= h && less(arr[indexJ], arr[indexJ - h]); indexJ -= h) {
                    exch(arr, indexJ, indexJ - h);
                }
            }
            h = h / 3;
        }
    }

    /**
     * 比较两个元素的大小
     *
     * @param comparableA 待比较元素A
     * @param comparableB 待比较元素B
     * @return 若 A < B,返回 true,否则返回 false
     */
    private static boolean less(Comparable comparableA, Comparable comparableB) {
        return comparableA.compareTo(comparableB) < 0;
    }

    /**
     * 将两个元素交换位置
     *
     * @param arr    待交换元素所在的数组
     * @param indexI 第一个元素索引
     * @param indexJ 第二个元素索引
     */
    private static void exch(Comparable[] arr, int indexI, int indexJ) {
        Comparable temp = arr[indexI];
        arr[indexI] = arr[indexJ];
        arr[indexJ] = temp;
    }

    /**
     * 打印数组的内容
     *
     * @param arr 待打印的数组
     */
    private static void show(Comparable[] arr) {
        for (int index = 0; index < arr.length; index++) {
            System.out.print(arr[index] + " ");
        }
        System.out.println();
    }

    /**
     * 判断数组是否有序
     *
     * @param arr 待判断数组
     * @return 若数组有序,返回 true,否则返回 false
     */
    public static boolean isSort(Comparable[] arr) {
        for (int index = 1; index < arr.length; index++) {
            if (less(arr[index], arr[index - 1])) {
                return false;
            }
        }
        return true;
    }

    public static void main(String[] args) {
        Integer[] arr = new Integer[100000];
        for (int index = 0; index < 100000; index++) {
            arr[index] = new Random().nextInt(100000) + 1;
        }
        long start = System.currentTimeMillis();
        sort(arr);      //耗费时间:480ms
        long end = System.currentTimeMillis();
        System.out.println("耗费时间:" + (end - start) + "ms");
        assert isSort(arr);
    }
}

性能分析

最佳情况:T(n) = O(nlog²n)
最坏情况:T(n) = O(nlog²n)
平均情况:T(n) = O(nlogn)

算法的性能不仅取决于 h , 还取决于 h 之间的数学性质,比如它们的公因子等。

使用递增序列 1、4、13、40、121、364… 的希尔排序所需的比较次数不会超过 N 的若干倍乘以递增序列的长度。

Q:如何通过h递增序列优化?
A:在实际应用中,h 的取值使用以上递增序列基本就足够了。但是我们为了追求性能的提升,也使用以下的序列,使性能提高 20%-40%1、5、19、41、109、209、505、929、2161、3905、8929、16001、36289、64769、146305、260609(这是通过 9×4k-9×2k+1(k=1,2,3,4,5…) 和 4k-3×2k+1(k=2,3,4,5,6…) 综合得到的)

Q:希尔排序为什么更加高效?
A:它权衡了子数组的规模和有序性。

Q:和选择排序以及插入排序形成对比的是:
A:希尔排序也可以用于大型数组。它对任意排序(不一定是随机的)的数组表现也很好。希尔排序比插入排序选择排序要快的多,并且数组越大,优势越大。【提示:点击蓝色字体,可以查看其详细信息。】

Q:什么时候用希尔排序?
A: 当你需要解决一个排序问题而又没有系统排序函数可用(例如直接接触硬件或是运行于嵌入式系统中的代码)时,可用先用希尔排序,然后再考虑是否值得将它替换为更加复杂的排序算法。

※ 研究算法的设计和性能的主要原因之一:通过提升速度来解决其他方式无法解决的问题。

优化方案

NO.1

使用更为复杂的递增序列,性能可以提高 20%-40% 。(这里就不说了,上述的递增序列够用)

NO.2

因为是基于插入排序的,所以可以使用其插入排序及其优化中给出的优化方案。即:进行了预处理操作,并在内循环中,总是将较大的元素向右移动。原方案是交换。

优化之后运行轨迹
希尔排序优化方案
优化之后代码
   public static void sortPlus(Comparable[] arr) {
        int length = arr.length;
        int h = 1;
        while (h < length / 3) {
            h = 3 * h + 1;  // 1 , 4 , 13 , 40 , 121 , 364 , 1093...
        }
        int exchanges = 0; //交换次数
        //若 arr[index] < arr[index - 1],则交换两数
        for (int index = length - 1; index > 0; index--) {
            if (less(arr[index], arr[index - 1])) {
                exch(arr, index, index - 1);
                exchanges++;
            }
        }
        //若交换次数为0(即数组有序),则无需进行下一步排序。
        if (exchanges == 0) return;
        //若有交换次数,表明目前的数组无序。
        while (h >= 1) {
            // 将数组变为 h 有序
            for (int indexI = h; indexI < length; indexI++) {
                Comparable temp = arr[indexI];  //记录一下arr[indexI]的值
                int indexJ = indexI;            //indexI 的代替品
                //若 indexJ 的前 h 位元素小于 temp,则将小于temp的元素向右移动 h 位
                //需要注意:可能会出现 indexJ < h 的情况。而一般的插入排序不会出现。
                while (indexJ >= h && less(temp, arr[indexJ - h])) {
                    arr[indexJ] = arr[indexJ - h];
                    indexJ -= h;
                }
                arr[indexJ] = temp; //将记录的值放在 indexJ 的位置上
            }
            h = h / 3;
        }
    }
测试代码

高效复制数组的方法】,提示:点击蓝色字体查看方法详情。

    public static void main(String[] args) {
        int length = 1000000;  // 百万数据量级别
        Integer[] arr = new Integer[length];
        Integer[] arr2 = new Integer[length];
        for (int index = 0; index < length; index++) {
            arr[index] = new Random().nextInt(length) + 1;
        }
        //高效复制数组的方法
        System.arraycopy(arr, 0, arr2, 0, arr.length);

        long start = System.currentTimeMillis();
        sort(arr);  
        long end = System.currentTimeMillis();
        System.out.println("耗费时间:" + (end - start) + "ms");
        assert isSort(arr);

        start = System.currentTimeMillis();
        sortPlus(arr2);
        end = System.currentTimeMillis();
        System.out.println("耗费时间:" + (end - start) + "ms");
        assert isSort(arr2);
    }
测试结果
百万数据量级别测试结果

注意:编译器默认不适用 assert 检测(但是junit测试中适用),所以要使用时要添加参数虚拟机启动参数-ea
具体添加过程,请参照eclipse 和 IDEA 设置虚拟机启动参数

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 160,227评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,755评论 1 298
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,899评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,257评论 0 213
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,617评论 3 288
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,757评论 1 221
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,982评论 2 315
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,715评论 0 204
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,454评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,666评论 2 249
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,148评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,512评论 3 258
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,156评论 3 238
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,112评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,896评论 0 198
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,809评论 2 279
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,691评论 2 272

推荐阅读更多精彩内容

  • 1.插入排序—直接插入排序(Straight Insertion Sort) 基本思想: 将一个记录插入到已排序好...
    依依玖玥阅读 1,179评论 0 2
  • 概述 排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部...
    蚁前阅读 5,102评论 0 52
  • 概述:排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部...
    每天刷两次牙阅读 3,706评论 0 15
  • 一、 单项选择题(共71题) 对n个元素的序列进行冒泡排序时,最少的比较次数是( )。A. n ...
    貝影阅读 8,671评论 0 10
  • 染色过的记忆 已无法分辨真伪 更无力分拣 只能胡乱的装在麻袋里 丢弃在阴暗的角落 任其发霉,腐烂 春天来的时候 从...
    冷冬年阅读 355评论 4 7