说说概率的故事(二)

在上一篇说说概率的故事(一)中,我们聊了聊随机性,大家明白了绝对的随机性是很难实现的。接下来我们来聊概率。

Chance.jpg

概率一直以来是一个很让我头疼的概念,因为它的含义十分丰富,在不同场合都有区别。大家有空可以认真阅读维基百科上Probability interpretation这一词条。

普遍地讲,概率是一个事件发生可能性大小的度量。那么关键问题是,这个度量是客观的吗?换句话说,这个度量表达的是事物的固有属性,还是人们的主观推测?我们国内的教科书上都没有仔细讨论过这个问题,它们大都直接给出了概率的两个定义:统计定义和公理化定义,然后就让你开始算...算...算,所以我们根本没时间思考。

实际上,正如维基百科上所说,对概率的解释大体上分为两种:频率主义(Frequency probability)和贝叶斯主义(Bayesian probability),频率主义实际上就给出了概率的统计定义,概率=频率在试验次数趋于无穷的极限。而在贝叶斯体系中,概率=你相信某事件发生的程度。

当然还有更细的划分方式,这里给出维基百科中关于各种概率解释的总结:


interpretations of probability.png

可以看到,确实有主观的概率。实际上,在日常生活中我们经常用到主观概率。例如我们常说:“今天90%会堵车”、“我80%能通过考试”。当你在做出这样的推断时,甚至都没有数学计算,它完全基于你的经验和知识。主观性体现在,每个人的经验和知识可能是不同的,因此每个人的推断可能不同。

但是,贝叶斯概率不是一定等于主观概率。如果某种推断是基于一种知识体系,而这种知识非常普遍,普遍到“如果你不了解它你就没法推断,而所有了解它的人都一定会做出一致的推断”,那么我们可以认为这种贝叶斯概率是客观的,我姑且把这种概率称为基于普遍认知的贝叶斯概率

著名的贝叶斯定理(Bayes' theorem)在这里也不得不提一下,它允许我们用新的认知来更新旧的推断。

Bayes'_Theorem.jpg

正如Wiki上的例子,已经知道一个人患癌症的概率,后来我们又获得了新的信息--这个人65岁,这时,依据已有的几项统计数据,我们就可以对此人患癌症的概率做出更详尽的推断。

前面说了这么多,其实我想引出的一个核心问题是:在量子力学和统计力学中用到的概率应该符合哪种解释呢?

我认为它们是基于普遍认知的贝叶斯概率,如上面所表述的那样。当你求一个量子体系的波函数时,或者求一个热力学系统的Boltzmann分布时,你做的其实都相当于这样一件事情:根据普遍的物理知识和观测到的宏观量(在量子力学中如势能,在统计力学中如总内能、温度、压强等)做一个统计推断(Statistical inference),以求获取系统的信息。这个信息之所以表现为概率分布的形式,在量子力学中是因为物理规律蕴含本质概率性,而在统计力学中是因为我们对系统信息(普遍地)的匮乏,像第一部分说的那样。

(为什么要这么在意客观性?因为在科学中当概念都是客观的时候,我们才感到比较安全。)

因此,如果统计力学中的概率分布是客观的(这很重要,不然热力学熵的概念就很难立足),那就要求这种对系统信息的匮乏是十分普遍的。普遍到不管是地球人还是外星人,是有机生命还是机器人都一样才行。实际上我认为这很勉强。

最后,我们来说一下概率论和统计的关系。粗糙地讲,它们是相反的过程。当你已经知道系统的性质,来预测观测结果时,玩的是概率论。而通过一些观测结果,来推断系统的性质,玩的是统计。这里必须引用这张形象的图:

probability v.s. stat.jpg

在下一部分中,我们将讨论“信息”这一概念,会越来越有趣哦~

推荐阅读更多精彩内容