快速排序
快速排序(英语:Quicksort),又称划分交换排序(partition-exchange sort),通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。
步骤为:
- 从数列中挑出一个元素,称为"基准"(pivot),重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区结束之后,该基准就处于数列的中间位置。这个称为分区(partition)操作。
- 递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。
- 递归的最底部情形,是数列的大小是零或一,也就是永远都已经被排序好了。虽然一直递归下去,但是这个算法总会结束,因为在每次的迭代(iteration)中,它至少会把一个元素摆到它最后的位置去。
快速排序的分析
如图所示,这是一个无序的列表,如何实现快速排序呢?
代码实现的思路
一旦交换位置立马就轮到移动low的游标了,思路同high游标一样,high完成位置交换后,又轮到high了,开始轮回。
没包含等于情况的时候
我们接着看代码,当low和high重合的时,如下图,55是刚从low那边移动过来,这是要开始移动high了,也就是重新开始新一轮轮回,high-=1,是不是直接就与high重合了,然后,low+=1是不是就low的游标前移了,high-=1,high的游标左移了,就不再满足大while的条件了,也无法控制mid_value。
只进行互换游标不再左右移动
。此时,我们找到了中间值,并以中间值作为界限,划分成了两个子列,两个子列还要重复上述操作,进行快速排序。
这是课件上的快速排序图示
完整代码实现:
def quick_sort(li,start,end):
if start >= end:
return
low = start
high = end
mid_value = li[start]
while low < high:
#先从移动high游标开始
while li[high] >= mid_value and low < high:
high -= 1
li[low] = li[high]
#开始移动low游标
while li[low] < mid_value and low < high:
low += 1
li[high] = li[low]
#这个时候游标low和high均指向mid_value
li[low] = mid_value
quick_sort(li,start,low-1)
quick_sort(li,low+1,end)
if __name__ == '__main__':
ali = [12,23,11,33,4,55,12,44,52,21]
print(ali)
quick_sort(ali,0,len(ali)-1)
print(ali)
时间复杂度
最优时间复杂度:O(nlogn)
最坏时间复杂度:O(n^2)
稳定性:不稳定
从一开始快速排序平均需要花费O(n log n)时间的描述并不明显。但是不难观察到的是分区运算,数组的元素都会在每次循环中走访过一次,使用O(n)的时间。在使用结合(concatenation)的版本中,这项运算也是O(n)。
在最好的情况,每次我们运行一次分区,我们会把一个数列分为两个几近相等的片段。这个意思就是每次递归调用处理一半大小的数列。因此,在到达大小为一的数列前,我们只要作log n次嵌套的调用。这个意思就是调用树的深度是O(log n)。但是在同一层次结构的两个程序调用中,不会处理到原来数列的相同部分;因此,程序调用的每一层次结构总共全部仅需要O(n)的时间(每个调用有某些共同的额外耗费,但是因为在每一层次结构仅仅只有O(n)个调用,这些被归纳在O(n)系数中)。结果是这个算法仅需使用O(n log n)时间。如果每次找到的中间都是开头第一个那就是最坏的时间复杂度了。