随机算法总结

随机算法涉及大量概率论知识,有时候难得去仔细看推导过程,当然能够完全了解推导的过程自然是有好处的,如果不了解推导过程,至少记住结论也是必要的。本文总结最常见的一些随机算法的题目,是几年前找工作的时候写的。需要说明的是,这里用到的随机函数都假定它能随机的产生范围[a,b]内的整数,即产生每个整数的概率相等。(虽然在实际中并不一定能实现,不过,谁在乎呢?这个世界都是这么随机)

1 随机排列数组

假设给定一个数组A,它包含元素1到N,我们的目标是构造这个数组的一个随机排列。

一个常用的方法是为数组每个元素A[i]赋一个随机的优先级P[i],然后依据优先级对数组进行排序。比如我们的数组为A={1, 2, 3, 4},如果选择的优先级数组为P={36, 3, 97, 19},那么就可以得到数列B={2, 4, 1, 3},因为3的优先级最高(为97),而2的优先级最低(为3)。这个算法需要产生优先级数组,还需使用优先级数组对原数组排序,这里就不详细描述了,还有一种更好的方法可以得到随机排列数组。

产生随机排列数组的一个更好的方法是原地排列给定数组(in-place),可以在O(N)的时间内完成。伪代码如下:

RANDOMIZE-IN-PLACE ( A , n ) for i ←1 to n do swap A[i] ↔ A[RANDOM(i , n )]

如代码中所示,第i次迭代时,元素A[i]是从元素A[i]到A[n]中随机选取的,在第i次迭代后,我们就再也不会改变A[i]。

A[i]位于任意位置j的概率为1/n。这个是很容易推导的,比如A[1]位于位置1的概率为1/n,这个显然,因为A[1]不被1到n的元素替换的概率为1/n,而后就不会再改变A[i]了。而A[1]位于位置2的概率也是1/n,因为A[1]要想位于位置2,则必须在第一次与A[k]交换(k=2...n),同时第二次A[2]与A[k]替换,第一次与A[k]交换的概率为(n-1)/n,而第二次替换概率为1/(n-1),所以总的概率是(n-1)/n * 1/(n-1) = 1/n。同理可以推导其他情况。

当然这个条件只能是随机排列数组的一个必要条件,也就是说,满足元素A[i]位于位置j的概率为1/n不一定就能说明这可以产生随机排列数组。因为它可能产生的排列数目少于n!,尽管概率相等,但是排列数目没有达到要求,算法导论上面有一个这样的反例。

算法RANDOMIZE-IN-PLACE可以产生均匀随机排列,它的证明过程如下:

  • 首先给出k排列的概念,所谓k排列就是从n个元素中选取k个元素的排列,那么它一共有n!/(n-k)!个k排列。
  • 循环不变式:for循环第i次迭代前,对于每个可能的i-1排列,子数组A[1...i-1]包含该i-1排列的概率为(n-i+1)! / n!。
  • 初始化:在第一次迭代前,i=1,则循环不变式指的是对于每个0排列,子数组A[1...i-1]包含该0排列的概率为(n-1+1)! / n! = 1。A[1...0]为空的数组,0排列则没有任何元素,因此A包含所有可能的0排列的概率为1。不变式成立。
  • 维持:假设在第i次迭代前,数组的i-1排列出现在A[1...i-1]的概率为(n-i+1) !/ n!,那么在第i次迭代后,数组的所有i排列出现在A[1...i]的概率为(n-i)! / n!。下面来推导这个结论:

考虑一个特殊的i排列p = {x1, x2, ... xi},它由一个i-1排列p' =�{x1, x2,..., xi−1�}后面跟一个xi构成。设定两个事件变量E1和E2:

  • E1为该算法将排列p'放置到A[1...i-1]的事件,概率由归纳假设得知为Pr(E1) = (n-i+1)! / n!

  • E2为在第i次迭代时将xi放入到A[i]的事件。
    因此我们得到i排列出现在A[1...i]的概率为Pr {E2 ∩ E1} = Pr {E2 | E1} Pr {E1}.而Pr {E2 | E1} = 1/(n − i + 1),所以
    Pr {E2 ∩ E1} = Pr {E2 | E1} Pr {E1}= 1 /(n − i + 1) * (n − i + 1)! / n! = (n − i )! / n!

  • 结束:结束的时候i=n+1,因此可以得到A[1...n]是一个给定n排列的概率为1/n!。

扩展

如果上面的随机排列算法写成下面这样,是否也能产生均匀随机排列?

PERMUTE-WITH-ALL( A , n ) for i ←1 to n do swap A[i] ↔A[RANDOM(1 , n )]

注意,该算法不能产生均匀随机排列。假定n=3,则该算法可以产生3*3*3=27个输出,而3个元素只有3!=6个不同的排列,要使得这些排列出现概率等于1/6,则必须使得每个排列出现次数m满足m/27=1/6,显然,没有这样的整数符合条件。而实际上各个排列出现的概率如下,如{1,2,3}出现的概率为4/27,不等于1/6。

2 随机选取一个数字

题目

给定一个未知长度的整数流,如何随机选取一个数?(所谓随机就是保证每个数被选取的概率相等)

解法1

如果数据流不是很长,可以存在数组中,然后再从数组中随机选取。当然题目说的是未知长度,所以如果长度很大不足以保存在内存中的话会很麻烦。这种解法有其局限性。

解法2

如果数据流在第1个数字后结束,那么必选第1个数字。
如果数据流在第2个数字后结束,那么我们选第2个数字的概率为1/2,我们以1/2的概率用第2个数字替换前面选的随机数,得到新的随机数。
.........
如果数据流在第n个数字后结束,那么我们选择第n个数字的概率为1/n,即我们以1/n的概率用第n个数字替换前面选的随机数,得到新的随机数。

一个简单的方法就是使用随机函数f(n)=bigrand()%n,其中bigrand()返回很大的随机整数,当数据流到第n个数时,如果f(n)==0,则替换前面的已经选的随机数,这样可以保证每个数字被选中的概率都是1/n。如当n=1时,则f(1)=0,则选择第1个数,当n=2时,则第2个数被选中的概率为1/2,以此类推,当数字长度为n时,第n个数字被选中的概率为1/n。

3 随机选取M个数字

题目

程序输入包含两个整数m和n,其中m<n,输出是0~n-1范围内的m个随机整数的有序列表,不允许重复。从概率角度来说,我们希望得到没有重复的有序选择,其中每个选择出现的概率相等。

解法1

先考虑个简单的例子,当m=2,n=5时,我们需要从0~4这5个整数中等概率的选取2个有序的整数,且不能重复。如果采用如下条件选取:bigrand() % 5 < 2,则我们选取0的概率为2/5。但是我们不能采取同样的概率来选取1,因为选取了0后,我们应该以1/4的概率来选取1,而在没有选取0的情况下,我们应该以2/4的概率选取1。选取的伪代码如下:

select = m
remaining = n
for i = [0, n)
    if (bigrand() % remaining < select)
         print i
         select--
    remaining--

只要满足条件m<=n,则程序输出m个有序整数,不多不少。不会多选,因为每选择一个数,select--,这样当select减到0后就不会再选了。同时,也不会少选,因为每次都会remaining--,当select/remaining=1时,一定会选取一个数。每个子集被选择的概率是相等的,比如这里5选2则共有C(5,2)=10个子集,如{0,1},{0,2}...等,每个子集被选中的概率都是1/10。更一般的推导,n选m的子集数目一共有C(n,m)个,考虑一个特定的m序列,如0...m-1,则选取它的概率为m/n * (m-1)/(n-1)*....1/(n-m+1)=1/C(n,m),可以看到概率是相等的。C++语言实现代码如下,该算法时间复杂度为O(n)。

void genknuth(int m, int n)
{
    for (int i=0; i<n; i++)
    if (bigrand() % (n-i) < m) {  //n-i中i每次加1,相当于remaining每次减1
      cout << i << endl;
      m--;  //选取的数目减1
    }
}

解法2

在初始为空的集合中插入随机整数,直到数目达到m。由于每次插入操作需要O(logm)的时间,遍历集合需要O(m)的时间,该算法总共需要O(mlogm)的实际。代码:

void gensets(int m, int n)
{
     set<int> S;
     while (S.size() < m)
          S.insert(bigrand() % n);
     set<int>::iterator it;
     for (it = S.begin(); it != S.end(); it++)
          cout << *it << endl;
}

解法3

采用前面随机排列数组的思想,先对前m个数字进行随机排列,然后排序这m个数字并输出即可。代码省略。

4 rand7()生成rand10()问题

请参见http://blog.csdn.net/sgbfblog/article/details/7753012

5 趣味概率题

1)生男生女问题:在重男轻女的国家里,男女的比例是多少?在一个重男轻女的国家里,每个家庭都想生男孩,如果他们生的孩子是女孩,就再生一个,直到生下的是男孩为止。这样的国家,男女比例会是多少?

  • 答案:还是1:1。在所有出生的第一个小孩中,男女比例是1:1;在所有出生的第二个小孩中,男女比例是1:1;.... 在所有出生的第n个小孩中,男女比例还是1:1。所以总的男女比例是1:1。

2)约会问题:两人相约5点到6点在某地会面,先到者等20分钟后离去,求这两人能够会面的概率。

  • 答案:设两人分别在5点X分和5点Y分到达目的地,则他们能够会面的条件是|X-Y| <= 20,而整个范围为S={(x, y): 0 =< x <= 60, 0=< y <= 60},所以会面的情况为图中表示的面积,概率为(60^2 - 40^2) / 60^2 = 5/9。

3)帽子问题:有n位顾客,他们每个人给餐厅的服务生一顶帽子,服务生以随机的顺序归还给顾客,请问拿到自己帽子的顾客的期望数是多少?

  • 答案:使用指示随机变量来求解这个问题会简单些。定义一个随机变量X等于能够拿到自己帽子的顾客数目,我们要计算的是E[X]。对于i=1, 2 ... n,定义Xi =I {顾客i拿到自己的帽子},则X=X1+X2+...Xn。由于归还帽子的顺序是随机的,所以每个顾客拿到自己帽子的概率为1/n,即Pr(Xi=1)=1/n,从而E(Xi)=1/n,所以E(X)=E(X1+X2+...Xn)=E(X1)+E(X2)+...E(Xn)=n*1/n = 1。即大约有1个顾客可以拿到自己的帽子。4)生日悖论:一个房间至少要有多少人,才能使得有两个人的生日在同一天?答案:对房间k个人中的每一对(i, j)定义指示器变量Xij = {i与j生日在同一天} ,则i与j生日相同时,Xij=1,否则Xij=0。两个人在同一天生日的概率Pr(Xij=1)=1/n。则用X表示同一天生日的两人对的数目,则E(X)=E(∑ki=1∑kj=i+1Xij) = C(k,2)*1/n = k(k-1)/2n,令k(k-1)/2n >=1, 可得到k>=28,即至少要有28个人,才能期望两个人的生日在同一天。

5)如果在高速公路上30分钟内看到一辆车开过的几率是0.95,那么在10分钟内看到一辆车开过的几率是多少?(假设常概率条件下)

  • 答案:假设10分钟内看到一辆车开过的概率是x,那么没有看到车开过的概率就是1-x,30分钟没有看到车开过的概率是(1-x)3,也就是0.05。所以得到方程(1-x)3 = 0.05 ,解方程得到x大约是0.63。

参考资料

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 162,710评论 4 376
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 68,839评论 2 308
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 112,295评论 0 255
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,776评论 0 223
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 53,198评论 3 297
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 41,074评论 1 226
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,200评论 2 322
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,986评论 0 214
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,733评论 1 250
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,877评论 2 254
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,348评论 1 265
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,675评论 3 265
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,393评论 3 246
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,209评论 0 9
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,996评论 0 201
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 36,212评论 2 287
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 36,003评论 2 280

推荐阅读更多精彩内容