排序算法原理与Python实现

一，冒泡排序

原理：遍历数列，每个过程，比较当前值与下一位置的值，通过交换位置，将较大的数置后；像冒泡一样
总的比较次数为（n-1）+（n-2）+…+1≈ $\frac{n^2}{2}$ 。复杂度为 $O（n^2）$

# code utf-8
def up_sort(lis:list, n:int):
    for i in range(n):
        for j in range(0, n-i-1):
            if lis[j] < lis[j+1]:
               lis[j], lis[j+1] = lis[j+1], lis[j]
               print(lis) # 通过这一行打印排序步骤，直接看到冒泡效果

a = [i for i in range(10)]
a.reverse()

print(a)  # [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
up_sort(a, len(a))
print(a)  # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

二，选择排序

原理：从左至右（or从上到下）遍历，寻找遍历最小值，放在数列最左端；递归；
总的比较次数为（n-1）+（n-2）+…+1≈ $\frac{n^2}{2}$ 。复杂度为 $O（n^2）$

# code utf-8
def selec_sort(lis:list, n:int):
    for i in range(n):
        # 寻找i~n区间的最小值
        min_index = i
        for j in range(i+1, n):
            if lis[j] < lis[min_index]:
                min_index = j
        # swap函数交换位置，如果是C++ 11以上版本，std中即包含swap
        lis[i], lis[min_index] = lis[min_index], lis[i]

a = [i for i in range(10)]
a.reverse()

print(a)  # [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
selec_sort(a, len(a))
print(a)  # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

三，插入排序（✳️ 有应用价值）

插入排序，是优化版的冒泡排序，在于提前终止循环，节省资源；排序目标有序性越高，插入排序的性能就越优于冒泡和选择
原理：从左至右（or从上到下）遍历，将当前值，插入到左端已排序序列的合适位置；
总的比较次数为（n-1）+（n-2）+…+1≈ $\frac{n^2}{2}$ 。复杂度为 $O（n^2）$
对于完全有序的数组，插入排序的复杂度为 $O（n）$

# code utf-8
# 方法一：根据自己的理解写的，把握好index的理解，否则容易出错
def insert_sort(lis:list, n:int):   # 
    for i in range(1,n): # 最左侧第一个数字不用排序，默认是已排序列
        for j in range(0, i):
            if lis[i] < lis[j]:
                a = lis[i]
                lis.remove(lis[i])
                lis.insert(j, a)
                break
        print(lis)

# 方法二：根据某教程
def insert_sort(lis:list, n:int):   # 借鉴
    for i in range(1,n): # 最左侧第一个数字不用排序，默认是已排序列
        for j in range(i, 0, -1):
            if lis[j] < lis[j-1]:
                lis[j], lis[j-1] = lis[j-1], lis[j]
            else:
                break
        print(lis)

# 方法三，优化
def insert_sort(lis:list, n:int):
    for i in range(1,n): # 最左侧第一个数字不用排序，默认是已排序列
        temp = lis[i]
        target_index = i
        for j in range(i, 0, -1):
            if temp < lis[j-1]:
                lis[j] = lis[j-1] # 赋值代替交换
                target_index = j - 1 # 当前位置
            else:
                break
        lis[target_index] = temp
        print(lis)

a = [4,7,2,8,3,9,1,6,0]
if __name__ == "__main__":
    insert_sort(a, len(a))

按照原理和代码的说明，可以看到，插入排序在迭代次数上，比较次数上，都要少于冒泡和选择排序；
问题：但是实际测试运行时间，会发现选择排序优于插入排序优于冒泡排序
原因：这是因为，选择排序比较计算多，但是交换位置操作少，而插入排序和冒泡排序存在大量数组元素位置交换，操作内存的IO时间开销是很大的；

优化思路：
1，使用方法一，只交换一次，（效率未测试）
2，使用方法三，通过赋值替代交换；此方法同样可用于优化冒泡排序（这样优化后，冒泡排序就变成了选择排序）

四，堆排序

略

五，归并排序一：自顶向下递归（先分组，后merge）（合并排序 merge_sort）

原理：将排序序列分半，两组排序后再合并成有序序列。递归。
实现：上的细节就是：将序列无限二分，最终分为每组两个元素的很多小组，小组内排序后，两个a级别小组合并排序为b界别，两个b级别再继续合并排序，直至合为一个有序的序列。
复杂度分析：由于是二分法分组，如果总元素是N个，那么序列分裂行为次数（即递归层数） $logn$ 级别的

核心算法->合并两组有序序列逻辑：例如要归并[4,6]，[3,7]两个小组；
1，首先创建一个新的空数组lis_new
2，比较两个序列首位，然后将较小的推入lis_new中。递归。
3，关键点：三个索引，两个待合并小组当前值的索引和新数组的索引(通过比较，赋值，移动索引，而不是删除小组内容，推入新数组这种有更大IO开销的操作)
合并两组序列的复杂度与序列元素个数有关，很简单这个算法是 $O(n)$ 的。
结合上面归并算法的理解，归并算法有两部分，分裂：复杂度 $O(logn)$ ，合并：复杂度 $O(n)$ ;
所以归并排序的复杂度是 $O(n*logn)$ 的

归并排序的缺点：占用内存大，典型的空间换时间

以下代码是我根据理解和参考自己实现的，虽然完成了示例中的排序，不保证完全正确。

# code utf-8
import math

def merge_lis(lis, i, j, mid):
    arr1 = [item for item in lis]
    index1, index2 = i, mid+1
    for k in range(j-i+1):
        if index1>mid:
            lis[k+i] = arr1[index2]
            index2 += 1
        elif index2>j:
            lis[k+i] = arr1[index1]
            index1 += 1
        elif arr1[index1] < arr1[index2]:
            lis[k+i] = arr1[index1]
            index1 += 1
        else:
            lis[k+i] = arr1[index2]
            index2 += 1

    print(lis)

def merge_sort(lis:list, n:int):
    def split(lis:list, i:int, j:int): # 要处理的数据段的开始位置，结束位置；前闭后闭
        if (i >= j):
            return
        # 第一步：数组二分
        mid = math.floor((i+j)/2)  # 存在数据过大，溢出风险;向上取整
        split(lis, i, mid)
        split(lis, mid+1, j)
        # 第二步：merge两段，排序核心
        merge_lis(lis, i, j, mid)

    split(lis, 0, n-1)

a = [4,7,2,8,3,9,1,6,0]
if __name__ == "__main__":
    merge_sort(a, len(a))

思考：对于近乎有序的数组，归并排序与插入排序效率比较如何？答案是插入排序更快，大概是 $logn$ 倍，这从两者的复杂度上就能计算得出，因为对于近乎有序的数组，优化后的插入排序，复杂度是接近 $O(n)$ 的。
优化：
方法一：判断。同样的，对于归并排序优化后，对于近乎有序的数组，也可以是接近 $O(n)$ 复杂度的，优化方法，仅需增加一行代码；如下代码示例（提升效率数十倍，当n=50000）
方法二：结合。当归并递归到底的时候（分组足够小的时候，比如每组元素少于10个），此时可使用插入排序来提高性能。（提升效率一倍，当n=50000）

# 只需在上面的程序基础上，增加一行；仅对于无序的进行归并，有序的不归并
if lis[mid] > lis[mid+1]:  
     merge_lis(lis, i, j, mid)

五，归并排序二（自底向上，迭代）

原理不变，优化方式相同；仅逻辑相反；

#此部分由于python的循环语法限制，不易实现，后面补C++实现

六，快速排序

原理：随机选一个数作为基准；将其余的数字与基准比较，分为比基准大和比基准小的两组；递归即可。
。平均复杂度为 $O（nlogn）$ ，如果运气较差，每次都选最小值为基准，复杂度为 $O（n^2）$ ，本质同选择排序
关键：如何分出两组，并找出基准值的合理索引值。

1，基础版(效率即优于归并)

# 第一版，原理实现
def partation(lis, start, end):
    p = lis[start]
    p_index = start
    for i in range(start+1, end+1):
        if lis[i] < p:
            lis[i], lis[p_index+1] = lis[p_index+1], lis[i]# 较小的数swap到前面
            p_index += 1 # 记录正确索引位置
    lis[start], lis[p_index] = lis[p_index], lis[start]
    return p_index

def _quick_s(lis, start, end):
    if start > end:
        return
    index = partation(lis, start, end)  # 选择基准值，以基准值分组，并返回基准值索引
    _quick_s(lis, start, index-1)
    _quick_s(lis, index+1, end)

def quick_sort(lis:list, n:int):
    _quick_s(lis, 0, n-1)
    pass

a = [4,7,2,8,3,9,1,6,0]
if __name__ == "__main__":
    quick_sort(a, len(a))
    print(a)

问题：
优化：
2，随机化，双路，三路
3，其他问题

六，希尔排序（高级插入排序）

原理：
复杂度为 $O（n^ \frac{3}{2}）$

最后编辑于：2021.03.21 23:30:53

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 159,569评论 4赞 363
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 67,499评论 1赞 294
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 109,271评论 0赞 244
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 44,087评论 0赞 209
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 52,474评论 3赞 287
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,670评论 1赞 222
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,911评论 2赞 313
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,636评论 0赞 202
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,397评论 1赞 246
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,607评论 2赞 246
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 32,093评论 1赞 261
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,418评论 2赞 254
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 33,074评论 3赞 237
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 26,092评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,865评论 0赞 196
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,726评论 2赞 276
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,627评论 2赞 270

排序算法原理与Python实现

排序算法原理与Python实现

目录

一，冒泡排序

二，选择排序

三，插入排序（✳️ 有应用价值）

四，堆排序

五，归并排序一：自顶向下递归（先分组，后merge）（合并排序 merge_sort）

五，归并排序二（自底向上，迭代）

六，快速排序

六，希尔排序（高级插入排序）

推荐阅读更多精彩内容