《信息简史》导读(第6期)

我还活着!
哈哈,大家是不是以为这个导读已经半途而废了?不,我一直在想着,只是一直没有时间去写。这让我的心情很沉重,联想到我太多太多一开始雄心勃勃到后来无果而终的事情,愈加羡慕那些能够坚持做一件事情的人们。不论如何,这个导读我会写完!即使可能拖得长一些。
我曾经写过2016年的读书总结,眼看2017就要过半了,估计今年的读书量肯定低于去年了,回归工作和家庭之后,读书的时间少了很多。搞个读书会的初衷,也是逼着自己多读书,但现实有些差强人意,咋办?其实也亏了这个读书会,只我自己的话,肯定又不了了之了。

言归正传吧。

第12章 认识随机性(僭越之罪)

这一章读起来挺痛苦的。但是我前面说过,过了第9章,就一路欢歌了,是不是打脸了?

不要被这一章所吓倒。文字难读,道理其实不难理解,关键是跟第9章建立联系。第9章解释“熵”,其实就涉及了随机性,随机状态其实就是最混乱的状态,也就是信息量最大的状态。

这一章之所以命名为认识随机性,其实就是在第9章的基础上,让我们对随机性有一个更深刻的认识。我们往往认为随机就是乱七八糟,是最没有价值的东西,是最不值得一提的东西,第9章让我们认识到了随机性与信息的重要联系(也就是这一章326页黑体的“随机程度如何与含有多少信息其实是同一个问题”),这一章则让我们对随机性心生敬畏。括号里的“僭越之罪”点破了这一目的,从这个意义上讲,随机性是人类思维难以企及的——先不说认识和揭示随机性的本质,单就制造真正的随机数而言就是难以做到的——这能不让人对随机性心生敬畏么?

P323页讲到一本书的名字叫《一百万个随机数字》,这也许是人类迄今为止制造的最大规模的随机数序列,尽管人类为此费尽心机,它依然不符合理论意义上严格的随机数!这的确算得上一本奇书,最奇的是,它可能是“越校对越不好”的唯一的一本书,因为编辑过程中的错误,相比这些随机数的制造过程而言,更接近严格意义上的随机!

《一百万个随机数字》封面

我怀着好奇加崇敬的心情,在亚马逊上搜了一下,发现这本书现在依然在售。看了几条评论,也非常有意思,摘录如下:

A very engrossing book with historical importance, it keeps you guessing until the end.

还有更好玩的:

I can't understand all the negative reviews! This book literally contains everything I could ever ask for in a book. Recipe for spanokopita? Check! Name of every person ever born? Check! Next week's powerball, bingo, MLB, and NASCAR results? Check! By randomly combining and recombining the contents at random, I have read the works of Shakespeare, Harry Potter 8: the Tomb of Crying Stilton (to be released in 2014), the Bible AND the REAL Bible. I threw out my other books when I realized I could just jump around in this book and derive any other book I wanted. I think Borges wrote a story about this, but it's taking me a while to find that story in my book. I did find some steamy erotica this morning, though, so who's complaining?

这其实说出了跟第9章类似的意思:随手扔一支粉笔在黑板上,完全有可能写出一句莎士比亚的十四行诗,只不过概率极低,但你不能否认它不存在。

冯·诺伊曼承认:“当然,任何考虑用算术方法来生成随机数的人都犯下了僭越之罪。因为,正如已经被多次指出的,不存在一个随机数这样的东西——有的只是生成随机数的方法,而一种严格的算术方法显然不属于其中之一。”(P324)

其实这就是这一章的核心思想。我们可以不用深究关于随机性的高深理论,但也许思考这样一个问题更有趣:

这一章和《信息简史》这本书的主线“编码”是什么关系?

我的理解是:对随机性的深刻认识,让人类意识到“编码”对于信息处理的局限性。

古希腊的毕达哥拉斯学派认为“万物皆数”,香农的信息论则建立了数学这一“形而上”的学科与物理这一关于物质世界的学科之间的一致性联系,可谓是把毕达哥拉斯学派的理想变为了现实,由此开启了信息社会的新纪元。更有道金斯等人,将生命也与信息建立了联系,似乎不仅是整个物质世界,连生命世界也全部被统一到“信息”——实质即编码——的完美世界之中。这场景,简直就是《圣经》中描绘的通天塔——巴别塔——即将建成的feel!

此时,只听上帝一声冷笑,小样儿!

其实,是哥德尔替上帝发出了这样一声冷笑。

库尔特·弗雷德里希·哥德尔(Kurt Friedrich Gödel,1906年4月28日-1978年1月14日),该照片摄于1925年。

这个长得有点像哈利波特的奥地利裔数学家、逻辑学家和哲学家,用他的“哥德尔不完备性定理”给了人类自信心一个极大的打击。

对哥德尔不完备性定理的一个人话解释是:

一个包含自然数的体系下,存在着一个问题,在该体系的基础公理下永远也不能证明该问题是对的,同时也永远无法证明该问题是错的。

这个可能很容易让人联想到量子力学中的“不确定性原理”,过去国人有一个很萌的翻译叫“测不准”原理,人话版本就是“不可能同时知道一个粒子的位置和它的速度”。

如果说量子力学的“不确定性原理”让人类意识到也许我们无法准确认知物理世界,哥德尔的不完备性定理则让人类即使是在完全由自己的心智建构的数理逻辑世界中也丧失了确定性,这对人类自信心的打击可想而知!

量子力学的“测不准”是理论的,而非是由当前技术的局限造成的,这就好比说,一个人先天没有腿,跑步的梦想对他来说永将是梦想,这是极其残酷的。同样道理,借助于计算机,人类成功征服了诸如“四色地图”这样的曾经的数学难题,于是乎不免雄心勃勃地设想在计算机的帮助下去征服所有数学难题,哥德尔兜头一盆冷水,证明了存在一些无法证实亦无法证伪的数学命题,那么,像哥德巴赫猜想这样的“数学王冠上的明珠”,对人类来说,是否永远都是梦想呢?

不仅是数学定理,有些数本身就是“不可描述”的,更准确的说法叫“不可计算数”。

本章反复提到了π,到目前为止并没有发现构成它的数字呈现出任何模式或规律,这看起来已经是非常“随机”的了,既然这样,那本《一百万个随机数字》干嘛不改成《一百万位圆周率》呢?

这正是因为,π是可计算的,从这种意义上来说,只要有足够的时间,任何位数的圆周率都是确定的,所以这种意义上来看,π一点都不随机!

难道还有不可计算的数?

本章开头的那个孩子——格雷戈里·蔡廷,就是不可计算数的提出者。

格雷戈里·蔡廷Gregory Chaitin (1947-)算法信息论创始人

就在1975年,蔡廷研究了一个很有趣的问题:任意指定一种编程语言中,随机输入一段代码,这段代码能成功运行并且会在有限时间里终止(不会无限运行下去)的概率是多大?

他把这个概率值命名为了“蔡廷常数”(Chaitin's constant)。这听起来有点不可思议,但事实上确实如此——蔡廷常数是一个不可计算数(uncomputable number)。也就是说,虽然蔡廷常数是一个确定的数字,但现已在理论上证明了,它是永远无法被求出来的……

不要以为到此就为止了,蔡廷常数虽是不可计算的,但它仍然是可定义的

那么,谁发现了第一个“不可定义数”(undefinable number)呢?答案是,从没有人发现过不可定义的数,以后也不会有人找到不可定义的数。因为不可定义数是无法用语言描述的,我们只能用非构造的方式证明不可定义数的存在性,但却永远没法找出一个具体例子来。

这一章是很“毁三观”的,当然,如果你的三观已经被量子力学毁过(我是在读《上帝掷骰子吗?》这本书时被毁的),那么再毁一次也就无妨了。从小接受的唯物主义可知论的教育,也曾天真地认为世界是可以被认识的,现在,我越来越倾向于不可知论了。

科学总是不断发展的,科学理论也是被不断推翻和修正的,这是科学的本质,也许随着科学的发展,现在的未知会变成已知,现在的已知也会变成新的未知,但不论如何,人类在宇宙面前永远应该保持谦卑和敬畏的姿态,毕竟我们太渺小啦!

推荐阅读更多精彩内容