学习笔记《Information Entropy》

信息熵(Information Entropy)的定义是:

对信息随机性的量度,指信息能被压缩的极限

信息熵能够被如此等价的一个预设是:在依据信息做预测的时候,对预测毫无帮助的信息我们称为无信息量,比如「今天太阳升起来了」,但是对于预测有极大帮助的信息,则称为含有很高的信息量,比如招聘某个员工时候的履历(预测此员工未来的表现),在提供「信息量」的过程中,「信息熵」表示的就是信息可以被压缩的极限

“熵”是信息论中最基本最重要的一个概念,香农最初想用“信息” (information) 来表达这一概念,但这个词当时已经被用滥了。香农便放弃用信息这个词。冯·诺依曼建议香农用“熵”;并给出二个理由:一是香农原本想用的“不确定性”(uncertainty)这个概念已经用于统计力学,二是没人知道“熵”倒底是什么,用它不会引起争论。不过冯·诺依曼毕竟见多识广,他早就知道“熵”已被用于热力学系统,但却仅是一个可以通过热量改变来测定的物理量,其本质仍没有很好地得到解释。正如所料,“熵”这一概念被延伸到信息论后,其本质才逐渐被解释清楚,信息论对熵的本质的解释就是“系统内在的混乱程度”。汉语中本无“熵”字,1923年德国物理学家普朗克(M. Planck)来华讲学时用到entropy这个词,由于entropy在表达形式上是两个量相除的商,我国著名物理学家胡刚复教授在现场口译时,把这个词翻译成“商”字加“火”旁创造了汉语的一个新术语“熵”。

Claude Shannon 是一个非常有趣的家伙,用10年左右创建和完善 information theory 以后,用余下的几十年造各种有趣的小玩意(杂耍机器人、自动魔方机、The Ultimate Machine 等等),Shannon 最伟大的地方,是构建了信息学和数学之间的桥梁,从而让信息学成为一门可以被换算的学科

创建信息论时候的论文《A Mathematical Theory of Communication》:
http://math.harvard.edu/~ctm/home/text/others/shannon/entropy/entropy.pdf

这篇论文非常厉害,在创立一个领域的时候就对这个领域进行了完备的证明:

《The Idea Factory》: It was one of the rare memonts in history, where somebody founded a field, stated all the major results, and proved most of them all pretty much at once.

文章发表的过程也颇为有趣:

香农的关于信息论的文章于1948年分二期发表在《贝尔系统技术期刊》上。这份出版物几乎没有什么图书馆订阅,类似于我们今天某单位的内部参考之类。当时的研究人员几乎是靠口口相传的蠢笨方式获知香农的工作。于是就纷纷给香农直接写信索要该文的复印本。即便如此,也没几个人能读懂香农的文章。原因是工程师认为该文数学内容太深了;数学家又对文章中的工程学背景缺乏了解。可是,毕竟还是有慧眼识金的人物。时任洛克菲勒基金会自然科学部主任的韦弗(W. Weaver)认识到该文的价值。他告诉基金会的主席,香农之于通信理论的贡献,就如同“吉布斯之于物理化学”。1949年,韦弗在《科学美国人》杂志发表了一篇不是很技术化的赞誉香农工作的普及文章,深入浅出地介绍了香农工作的重要性。之后韦弗的文章和香农的论文被集结成书,以《通信的数学理论》(The Mathematical Theory of Communication)为题公开出版。请注意,香农的论文题目用的是不定冠词“A”,而韦弗与他合著的书却用了定冠词“The”。在英语中,从不定冠词变为定冠词马上就从谦虚变为自负!难道香农的信息论不是自负的一种理论吗?它的问世改变了一个时代!

Shannon 诞辰100周年时候的介绍:
https://www.youtube.com/watch?v=pHSRHi17RKM

公式:

b一般取2

对公式的解释:
https://www.youtube.com/watch?v=2s3aJfRr9gE
https://www.youtube.com/watch?v=9r7FIXEAGvs

我的理解:
信息量,不和信息的长度相关,而是和信息获取以后的解压时间成正比,这个解压时间可以理解成一种人大脑中的思考行为(大脑只适合思考长度很短的信息),也可以理解成电脑的解压次数(电脑只有全解压以后才能读取使用)

信息熵主要的价值就在于建立了数学和这种解压之间的关系,从而可以计算出信息的压缩极限

信息量和信息的重要性是没有关系的(信息和意义无关),所以「信息量」更适合作为一个通信行业内的概念

不同的人之间,对信息的理解能力差别也是非常大的,比如爱因斯坦和普通人对于某些梳理现象的理解,所以对于接收方对信息的有效接受量,是无法通过「信息熵」来评估的

《一个理论改变了一个时代 ——香农诞辰百年纪念》:
http://blog.sciencenet.cn/blog-105489-1015851.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,560评论 4 361
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,104评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,297评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,869评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,275评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,563评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,833评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,543评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,245评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,512评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,011评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,359评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,006评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,062评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,825评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,590评论 2 273
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,501评论 2 268

推荐阅读更多精彩内容