Python数据结构与算法44：排序与查找：二分查找

注：本文如涉及到代码，均经过Python 3.7实际运行检验，保证其严谨性。

本文阅读时间约为5分钟。

上一节我们介绍过顺序查找算法。顺序查找算法对于有序表能节省一些比对次数，但并不改变其数量级。

那么问题来了，对于有序表而言，有没有办法利用其有序的特性，用一些更好的算法来完成有序表的查找？

答案是肯定的：有办法。我们今天要介绍的二分查找法就是其中之一。

二分查找算法

二分查找，我们拿待查找项与列表中间的数据项进行比对，比对的结果有2种可能：

待查找项与列表中间的数据项匹配，则完成查找。
待查找项与列表中间的数据项不匹配。此时又有2种情况：
1. 列表中间数据项比待查找项大，那么待查找项只可能出现在列表的前半部分。
2. 列表中间数据项比待查找项小，那么待查找项只可能出现在列表的后半部分。

可以看到，最坏的结果是我们将比对范围缩小到原来的1/2。

继续采用上述方法查找，每次下来，比对范围都会被缩小到原来的1/2。

根据上面的算法分析，很容易得到二分查找的代码，参考如下：

# 有序表的二分查找算法。

def binarySearch(alist, item):
    first = 0
    last = len(alist) - 1
    found = False
    
    while first <= last and not found:
        midpoint = (first + last) // 2
        if alist[midpoint] == item:  # 待查找项与列表中间的数据项比对。
            found = True
        else:  # 以下是待查找项与列表中间的数据项不匹配的2种情况。
            if item < alist[midpoint]:
                last = midpoint - 1
            else:
                first = midpoint + 1
    return found

testlist = [0, 1, 2, 8, 13, 17, 19, 32, 42]

print(binarySearch(testlist, 3))
print(binarySearch(testlist, 13))

<<<
False
True
<<<

二分查找算法实际上体现了解决问题的典型策略：分而治之。

正如我们“递归”部分说到的那样，分而治之是将问题分为若干个更小规模的部分，并通过解决每一个小规模部分问题和将结果汇总，来得到原问题的解。

可以看出，二分查找和递归都是基于分而治之的思想。两者之间显然有某种内在联系。

二分查找算法也适合用递归算法来实现：

# 二分查找算法的递归版本。

def binarySearch(alist, item):
    if len(alist) == 0:
        return False
    else:
        midpoint = len(alist) // 2
        if alist[midpoint] == item:
            return True
        else:
            if item < alist[midpoint]:
                return binarySearch(alist[:midpoint], item)
            else:
                return binarySearch(alist[midpoint+1:], item)
                
testlist = [0, 1, 2, 8, 13, 17, 19, 32, 42]

print(binarySearch(testlist, 3))
print(binarySearch(testlist, 13))

<<<
False
True
<<<

二分查找的算法分析

二分查找算法的每次比对都将下一步的比对范围缩小至此前的1/2。

当比对次数足够多之后，比对范围就会只剩下1个数据项。无论剩下的这个数据项是否能匹配待查找项，比对过程都将结束。比对的次数i和列表数据项的个数n有以下关系：

i = log2(n)，也就是2^i = n。

也就是说，二分查找的算法复杂度是O(logn)。它显然优于上一节介绍的顺序查找算法，后者的算法复杂度是O(n)。

进一步思考二分查找的算法复杂度，递归版本有一个因素要引起注意：

binarySearch(alist[:midpoint], item)这个递归调用使用了列表切片，而切片操作的复杂度是O(k)——k的大小取决于切片多长——这样会使整个算法的时间复杂度稍有增加；
当然，我们采用切片是为了让程序的可读性更好；实际上切片操作不必一定出现在代码中，如在前面一个非递归版本的代码中。

算法的选择问题

既然二分查找的算法复杂度明显优于顺序查找，那么，是不是遇到查找问题一定要摒弃顺序查找而选择二分查找呢？

答案是：不一定。

这是因为，二分查找是有隐性成本的，它建立在一个前提下：有序。既然是有序，表明列表已经排好序了。然而，排序并非毫无代价，它也有时间开销。

因此，综合权衡利弊才能做出更好的选择：

如果一次排序后可以进行多次查找，那么排序的代价开销就能得到摊薄，此时选择二分查找是十分合算的。
但是如果数据集经常变动，查找次数相对较少，那么使用顺序查找显然更合算。

所以，在算法选择的问题上，光看明面上时间复杂度的优劣可能还不够，要根据实际情况，既要考虑显性成本，也要看到隐性成本，综合衡量做出取舍。

To be continued.

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 159,569评论 4赞 363
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 67,499评论 1赞 294
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 109,271评论 0赞 244
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 44,087评论 0赞 209
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 52,474评论 3赞 287
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,670评论 1赞 222
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,911评论 2赞 313
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,636评论 0赞 202
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,397评论 1赞 246
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,607评论 2赞 246
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 32,093评论 1赞 261
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,418评论 2赞 254
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 33,074评论 3赞 237
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 26,092评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,865评论 0赞 196
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,726评论 2赞 276
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,627评论 2赞 270

Python数据结构与算法44：排序与查找：二分查找

二分查找算法

二分查找的算法分析

算法的选择问题

推荐阅读更多精彩内容