上一讲介绍了改变世界的3比特信息,希望大家能体会到信息的重要,也认识到它其实比我们了解的,要复杂得多。但是信息论真的是一门复杂深奥的学科吗?这一讲会再介绍3篇获得诺贝尔奖的论文,大家会感受到信息的简洁之美,以及传递效率的重要性。
要介绍的第一篇论文和宇宙诞生有关。当今这一代人非常幸运,因为在这一代生活的世界,人类搞清楚了三个非常本源的问题,也就是宇宙是如何产生的,地球生命的共性和起点,以及人类文明的起点。
那么,宇宙到底是如何诞生的呢?现在知道,宇宙是从一个体积无限小,温度近乎无限高的质点爆炸产生的,这就是今天大家认可的宇宙大爆炸理论。
根据这个理论,在大约138亿年前,那个质点发生了大爆炸。在随后大约一个普朗克的时间里(普朗克时间是能够度量的最小时间单位,大约是10的负44次方秒),重力场开始形成。
到了大爆炸后的0.02秒,宇宙中出现了第一丝光。接着,宇宙中的一部分能量就变成了物质。几乎同时间,大量的能量转化为质子和中子,在这个过程中,宇宙中能量减少,物质增加。
然后,随着宇宙的膨胀、冷却,原子核、原子相继出现。引力又让这些原子形成星云和天体。再往后进化出生命,背后也有一套规律在起作用。
也就是说宇宙在诞生的同时,就有了各种物理的法则(Law)在起作用,后来又有了化学和生物学的法则,它们都是宇宙固有的信息。
如果有人问:“能量是世界固有的,是它诞生之初就存在的,那么信息从哪里来?”
回答是:“信息和能量一样,都是宇宙本身固有的特性。”
可能又有人要问,上述这些描述没有人看见,人们是怎么知道的呢?物理学家们主要是通过两种方法推断出当时的场景的。
当然,有些推断可信度高一些,有些低一些,世界上没有绝对的可靠,只有可靠性的高和低,信号和噪音比率的高和低。从信息论上说,信息的可靠性就叫做置信度,会在后面详细讲解。
物理学家采用的第一种方法就是寻找宇宙大爆炸存留至今的信息,其中最著名的发现是3K背景辐射,这是一种温度约为3K,也就是-270摄氏度,而且充满整个宇宙的电磁辐射。
在大爆炸大约1秒的时候,宇宙中最初形成的中子因为不带电,率先冲出宇宙这个大火球,弥散到宇宙的四周,它们所携带的能量形成了今天宇宙的背景辐射。当然随着时间越来越长,宇宙越来越冷,背景辐射的温度会越来越低。
如果宇宙大爆炸理论是正确的,那么应该在宇宙的任何方向都能测量到宇宙形成时的这些背景辐射,而且今天它们的温度不应该太高。
1964年,贝尔实验室的工程师阿诺·彭齐亚斯和罗伯特·威尔逊在无意中发现了这种宇宙背景辐射。他们架设了一个天线,本来是要接收卫星发回的信号的。为了检测这个天线的性能,他们将天线对准天空中没有卫星的方向进行测量,结果发现有一种7厘米左右的微波在各个方向都存在,而且这个信号与地球的公转和自转都无关。
起初彭齐亚斯和威尔逊怀疑是他们的天线系统有问题。1965年初,他们对天线进行了彻底检查,甚至把天线上的鸽子窝和鸟粪都清除了一遍,然而这个噪声仍然存在。于是他们发表论文,正式宣布了这个发现,整篇论文只有两页纸。人类后来又根据背景辐射的温度,以及扩张的速度等信息,倒推出宇宙有138亿年的历史。
1978 年,彭齐亚斯和威尔逊因为那个偶然的发现和那篇两页纸的论文,“幸运地”获得了诺贝尔物理学奖。
有时候有价值的论文并不需要啰里啰唆地写很长,它们里面的信息量很重要,正如上一讲讲到的,对于一件过去大家不知道的事情,现在知道了,信息量就大,对于一件大家基本上了解的事情,即使文章写得再长,信息量都有限。
提出问题比解决问题更重要,因为提出问题的人,开创了一个重要的却是完全未知的领域,回答问题并且给出最初解答的人,由于通常只是在某种认识阶段上对未知的领域提供一些有限的信息,因此贡献有限,被认可的程度不高。
物理学家推测宇宙早期状态的第二个方法,就是用空间换时间。
大家知道宇宙有138亿年的历史,在离我们非常遥远的宇宙空间,光传递到我们这里需要很多很多年,因此这其实记录的就是很多很多年前的信息。事实上今天看到的很多星辰,它们可能已经不存在了,只不过看到的是它们的快照和化石。
所以,只要观测到138亿年前的星系,就能知道宇宙早期的情况,事实上人们也做到了。这就是用空间换时间,在信息论上,这实际是信息等价性的体现,关于信息的等价性后面会讲到。
好,刚才介绍了两种推断宇宙诞生的方法,一是寻找3K背景辐射,二是以空间换时间。其中提到了两个要点:第一,信息是宇宙本身固有的属性;第二,在一个领域的贡献大小,不在于提供了多少材料,而在于提供了多少信息量。
但事实上,今天对于最早期宇宙状态的描述是使用各种理论模型推导出来的,要证实它们还需要后人的努力。
人类一方面对外部世界很好奇,比如设法去了解宇宙起源和演变的信息,另一方面对自身也很好奇,试图去了解生命起源和传承的信息,这些信息本身,也是世界所固有的。
接下来,从信息论的角度出发,介绍遗传和DNA这篇诺奖论文。
首先,沃森和克里克获得诺贝尔奖的论文也只有一页半纸,把它附在了课程的后面,有兴趣阅读英文原文的朋友可以读一读。
当然有人可能会问,这么高深的论文能读懂吗?只要有比较好的大学教育基础,就能读懂。这也就是说,一篇好的论文,一方面需要信息量高,另一方面需要在信息传播上效率高。大家都读不懂的论文,信息传递的效率就低。
怎样利用信息论原理,做到信息传播的高效率,是这门课要讲的重要内容。
这里给大家一些建议就是,不要啰里啰唆地唠叨很长时间,要精简,要保证对方听懂自己最核心的想法,这就够了。有人在读过几十篇的诺贝尔奖的论文,很少有超过10页纸的。
其次,沃森和克里克这篇论文的逻辑很清晰,他们首先否定了鲍林之前的三螺旋结构,因为和一些已知的信息不相符。
然后,他们提出了自己的双螺旋模型,那一段关键描述只有105个单词(包括the,a ,so这些虚词)。最后,他们说明了自己的模型同威尔金森、富兰克林观察到的信息相吻合。
沃森和克里克等人提供了一个“利用能够看到的信息,解释看不到的信息”的绝佳案例。他们的论文和理论也验证了信息论中一条被称为“奥卡姆剃刀”的原则。
这条原则用牛顿的话讲,就是“我们需要承认,自然事物各种现象的真实而有效的原因,除了它自身以外再无须其他”。这是在认识世界时应该有的态度。关于奥卡姆剃刀原则,后面会专门讲。
在了解了和DNA相关的信息之后,人类后来发现DNA会通过复制出RNA传递生命所需的信息,RNA会在指导合成蛋白质时,继续将这些信息传递下去。
但是有人可能还有一个疑问,就是有了蛋白质后,生命体是如何工作的?比如细胞是如何接受有益的物质,拒绝有害的物质,保护自身细胞,杀死有害的细胞的。
细胞里显然没有大脑,不是通过思考作出理性判断。但是蛋白质本身会对外部的刺激信号作出反应,这些反应维持着人们生命的活动,并且保护我们自身。用诺贝尔奖获得者科比尔卡的话讲,这涉及到G蛋白之间的通信。
有人可能会奇怪蛋白质不是基本的生命单元,怎么还能通信?其实我们的细胞膜上有G蛋白偶联受体(GPCRs),它们可以探测荷尔蒙、气味、化学神经传递,和其它外界刺激,在解码后激活细胞内不同的G蛋白,转而引发各种生命活动,这便是生物体工作的原理之一。
下面这一张图,是G蛋白偶联受体的工作示意图,G蛋白偶联受体(蓝色)被外界信号,也就是紫色的小球入侵时,激活相应的G蛋白(金色的和红色的)。
G蛋白是蛋白质中最大的家族,有多达800种蛋白质,在搞清楚了它们的通信原理之后,对了解人的生命现象,治疗疾病有极大意义。
事实上,世界上1/3到一半的药物靶标都和G蛋白有关。科比尔卡在2007年完成了上述研究,并且在《科学》杂志上发表了一篇8页纸的论文,并因此获得了2012年的诺贝尔奖。
从这个例子可以看出,控制生命活动的信息,其实并不被人们主观控制,但是我们可以发现它们。
到这里,三篇诺奖论文都介绍完了。
要点总结
1.那些影响世界的重大科学发现其实都是在极短的论文中发表出来的,因为世界上最关键的信息(知识)其实是非常简洁的,也就是说一条信息的信息量可能和信息的长度无关。那信息量和什么有关?关于这一点会在后面仔细讲。
2.本文的三个例子,都说明了信息是世界固有的属性。
上讲介绍了信息是什么,它的作用有多大。本讲阐述了信息是世界固有的属性,并且预告了信息论中很多内容。下一讲,讲讲信息论和方法论的关系。
论文地址:
https://wenku.baidu.com/view/ab260629bcd126fff7050bb1.html
本文来自投稿,不代表人工智能艾特立场,如若转载,请注明出处:https://www.xaiat.com/02%ef%bd%9c%e8%a7%a3%e5%bc%80%e4%b8%96%e7%95%8c%e4%b9%8b%e8%b0%9c%e7%9a%84%e4%b8%89%e7%af%87%e8%af%ba%e8%b4%9d%e5%b0%94%e5%a5%96%e8%ae%ba%e6%96%87/