Python数据结构与算法43：排序与查找：顺序查找

注：本文如涉及到代码，均经过Python 3.7实际运行检验，保证其严谨性。

本文阅读时间约为5分钟。

什么是顺序查找(Sequential Search)

如果数据项保存在如列表这样的集合中，我们会称这些数据项具有线性或者顺序关系。

在Python List中，这些数据项的存储位置称为下标(index)，这些下标都是有序的整数，正向从固定的0开始，1、2、3、……，或者反向从固定的-1开始，-2、-3、……。

通过这些下标，我们就可以那招顺序来访问和查找数据项。这种技术称为顺序查找(Sequential Search)。

要确定列表中是否存在需要查找的数据项，首先从列表的第1个数据项开始，按照下标增长(index+1)的顺序，逐个比对数据项。如果到最后一个都未发现要查找的目标，那么表示查找失败。

一般的顺序查找算法的代码如下：

# 无序表查找的算法代码。

def sequentialSearch(alist, item):
    pos = 0  # 初始位置index为0。
    found = False
    
    while pos < len(alist) and not found:
        if alist[pos] == item:
            found = True
        else:
            pos = pos + 1  #  下标逐渐增长。
            
    return found

testlist = [1, 2, 32, 8, 17, 3, 9, 87]
print(sequentialSearch(testlist, 3))
print(sequentialSearch(testlist, 32))

<<<
False
True
<<<

顺序查找的算法分析

根据上述代码可知，要对查找算法进行分析，首先要确定其中的基本计算步骤。

回顾此前我们介绍过的算法分析的要点，这种基本计算步骤必须要足够简单，并且在算法中反复执行。

在查找算法中，这种基本计算步骤就是进行数据项的比对。

当前数据项等于还是不等于要查找的数据项，比对的次数决定了算法复杂度。

在顺序查找算法中，为了保证是讨论的通用的方法，需要假定列表中的数据项并没有按某种规则（如值的大小或字母顺序等）排列顺序，而是随机放置在列表中的各个位置；换句话说，数据项在列表中各处出现的概率是相同的。

在各数据项随机放置于列表的各个位置这种情况下，顺序查找的比对次数是多少呢？

这就要看数据项是否存在于列表当中了。

若数据项不存在于列表中，需要比对完所有的数据项（比对次数为n），才能得知结果。

若数据项存在于列表中，要比对的次数就比较复杂了：最好的情况是第一次比对就查找成功（比对次数为1），最坏的情况是查找到最后一个数据项才查找成功（比对次数为n）。

让我们着眼于数据项在列表中这种情况。若是如此，比对的一般情形如何？
考虑到前提是，数据项在列表中各个位置出现的概率是相同的，所以平均状况下，比对的次数是n/2。

所以，顺序查找的算法复杂度是O(n)。

有序顺序查找算法的复杂度

上面讨论的结论是建立在假定列表中的数据项是无序的这一前提之下的。
我们想进一步知道：

如果列表中的数据项是排好序的，顺序查找算法的复杂度又是怎样的呢？

此前我们在介绍基本结构有序表时介绍过顺序查找。当数据项存在于列表当中时，比对查找过程与无序表完全相同。不同之处在于，如果数据项不存在于列表当中，比对可以提前结束。

下图就是一个例子。

Pic-501-1 有序表顺序查找的示例

假设我们要在上图的列表当中寻找50这个数。当我们顺序查找到54时，依然没有找到50，那么，可以肯定50这个数不存在于这个列表当中。因此我们可以提前结束查找过程，而不必一一比对完剩下的数据项。

有序表的顺序查找算法相比无序表，多了一个提前停止的情况。代码如下：

# 有序表的查找代码。

def sequentialSearch(alist, item):
    pos = 0  # 初始位置index为0。
    found = False
    stop = False  # 相比无序表的顺序查找多出的部分。
    
    while pos < len(alist) and not found and not stop:
        if alist[pos] == item:
            found = True
        else:
            if alist[pos] > item:
                stop = True  # 相比无序表查找，可以提前退出。
            else:
                pos = pos + 1  #  下标逐渐增长。
            
    return found

就算法复杂度而言，有序表的顺序查找的算法复杂度依然是O(n)。

只是在数据项不存在的时候，有序表的查找能节省一些比对次数，但并不改变其数量级。

To be continued.

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 159,569评论 4赞 363
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 67,499评论 1赞 294
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 109,271评论 0赞 244
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 44,087评论 0赞 209
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 52,474评论 3赞 287
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,670评论 1赞 222
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,911评论 2赞 313
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,636评论 0赞 202
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,397评论 1赞 246
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,607评论 2赞 246
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 32,093评论 1赞 261
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,418评论 2赞 254
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 33,074评论 3赞 237
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 26,092评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,865评论 0赞 196
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,726评论 2赞 276
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,627评论 2赞 270

Python数据结构与算法43：排序与查找：顺序查找

什么是顺序查找(Sequential Search)

顺序查找的算法分析

有序顺序查找算法的复杂度

推荐阅读更多精彩内容