Python数据结构与算法44:排序与查找:二分查找

:本文如涉及到代码,均经过Python 3.7实际运行检验,保证其严谨性。

本文阅读时间约为5分钟

上一节我们介绍过顺序查找算法。顺序查找算法对于有序表能节省一些比对次数,但并不改变其数量级。

那么问题来了,对于有序表而言,有没有办法利用其有序的特性,用一些更好的算法来完成有序表的查找?

答案是肯定的:有办法。我们今天要介绍的二分查找法就是其中之一。

二分查找算法

二分查找,我们拿待查找项与列表中间的数据项进行比对,比对的结果有2种可能:

  1. 待查找项与列表中间的数据项匹配,则完成查找。
  2. 待查找项与列表中间的数据项不匹配。此时又有2种情况:
    1. 列表中间数据项比待查找项大,那么待查找项只可能出现在列表的前半部分。
    2. 列表中间数据项比待查找项小,那么待查找项只可能出现在列表的后半部分。

可以看到,最坏的结果是我们将比对范围缩小到原来的1/2。

继续采用上述方法查找,每次下来,比对范围都会被缩小到原来的1/2。

根据上面的算法分析,很容易得到二分查找的代码,参考如下:

# 有序表的二分查找算法。

def binarySearch(alist, item):
    first = 0
    last = len(alist) - 1
    found = False
    
    while first <= last and not found:
        midpoint = (first + last) // 2
        if alist[midpoint] == item:  # 待查找项与列表中间的数据项比对。
            found = True
        else:  # 以下是待查找项与列表中间的数据项不匹配的2种情况。
            if item < alist[midpoint]:
                last = midpoint - 1
            else:
                first = midpoint + 1
    return found

testlist = [0, 1, 2, 8, 13, 17, 19, 32, 42]

print(binarySearch(testlist, 3))
print(binarySearch(testlist, 13))

<<<
False
True
<<<

二分查找算法实际上体现了解决问题的典型策略:分而治之。

正如我们“递归”部分说到的那样,分而治之是将问题分为若干个更小规模的部分,并通过解决每一个小规模部分问题和将结果汇总,来得到原问题的解。

可以看出,二分查找和递归都是基于分而治之的思想。两者之间显然有某种内在联系。

二分查找算法也适合用递归算法来实现:

# 二分查找算法的递归版本。

def binarySearch(alist, item):
    if len(alist) == 0:
        return False
    else:
        midpoint = len(alist) // 2
        if alist[midpoint] == item:
            return True
        else:
            if item < alist[midpoint]:
                return binarySearch(alist[:midpoint], item)
            else:
                return binarySearch(alist[midpoint+1:], item)
                
testlist = [0, 1, 2, 8, 13, 17, 19, 32, 42]

print(binarySearch(testlist, 3))
print(binarySearch(testlist, 13))

<<<
False
True
<<<
二分查找的算法分析

二分查找算法的每次比对都将下一步的比对范围缩小至此前的1/2。

当比对次数足够多之后,比对范围就会只剩下1个数据项。无论剩下的这个数据项是否能匹配待查找项,比对过程都将结束。比对的次数i和列表数据项的个数n有以下关系:

i = log2(n),也就是2^i = n。

也就是说,二分查找的算法复杂度是O(logn)。它显然优于上一节介绍的顺序查找算法,后者的算法复杂度是O(n)。

进一步思考二分查找的算法复杂度,递归版本有一个因素要引起注意:

binarySearch(alist[:midpoint], item)这个递归调用使用了列表切片,而切片操作的复杂度是O(k)——k的大小取决于切片多长——这样会使整个算法的时间复杂度稍有增加;
当然,我们采用切片是为了让程序的可读性更好;实际上切片操作不必一定出现在代码中,如在前面一个非递归版本的代码中。

算法的选择问题

既然二分查找的算法复杂度明显优于顺序查找,那么,是不是遇到查找问题一定要摒弃顺序查找而选择二分查找呢?

答案是:不一定。

这是因为,二分查找是有隐性成本的,它建立在一个前提下:有序。既然是有序,表明列表已经排好序了。然而,排序并非毫无代价,它也有时间开销。

因此,综合权衡利弊才能做出更好的选择:

  • 如果一次排序后可以进行多次查找,那么排序的代价开销就能得到摊薄,此时选择二分查找是十分合算的。
  • 但是如果数据集经常变动,查找次数相对较少,那么使用顺序查找显然更合算。

所以,在算法选择的问题上,光看明面上时间复杂度的优劣可能还不够,要根据实际情况,既要考虑显性成本,也要看到隐性成本,综合衡量做出取舍。

To be continued.

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,569评论 4 363
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,499评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,271评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,087评论 0 209
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,474评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,670评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,911评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,636评论 0 202
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,397评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,607评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,093评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,418评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,074评论 3 237
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,092评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,865评论 0 196
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,726评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,627评论 2 270

推荐阅读更多精彩内容