《基因传》读书笔记

0.929字数 185091阅读 7865
图片发自简书App

书名
基因传
作者
(美)悉达多·穆克吉(Siddhartha Mukherjee)
译者
马向涛
豆瓣
http://douban.com/book/subject/27168433/
目录

序言 骨肉同胞
第一部分 “遗传科学昙花一现”——遗传物质重见天日(1865―1935)
第一章 围墙花园
第二章 “谜中之谜”
第三章 “空中楼阁”
第四章 他爱之花
第五章 “名叫孟德尔”
第六章 优生学
第七章 “三代智障已经足够”
第二部分 “化零为整,化整为零”——揭秘遗传机制(1930─1970)
第一章 “身份”
第二章 真相与和解
第三章 转化
第四章 没有生存价值的生命
第五章 “愚蠢的分子”
第六章 DNA 双螺旋
第七章 “变幻莫测的难解之谜”
第八章 基因的调控、复制与重组
第九章 基因与生命起源
第三部分 “遗传学家的梦想”——基因测序与基因克隆(1970─2001)
第一章 “交叉互换”
第二章 现代音乐
第三章 海边的爱因斯坦
第四章 “克隆或死亡”
第四部分 “人类是最 适合的研究对象”——人类遗传学(1970─2005)
第一章 父亲的苦难
第二章 诊所诞生
第三章 “干预,干预,再干预”
第四章 基因定位
第五章 基因组时代
第六章 基因地理学家
第七章 人之书(共23卷)
第五部分 镜中奇遇——遗传一致性与“常态”(2001─2015)
第一章 “不分彼此”
第二章 遗传算法
第三章 最 后一英里
第四章 冬日饥荒
第六部分 后基因组时代——遗传学的命运与未来(2015─ )
第一章 未来的未来
第二章 基因诊断:“预生存者”
第三章 基因治疗:后人类时代
后记 辨别身份
致谢
词汇表
译者注记


序言 骨肉同胞

“基因”既是遗传物质的基本单位,也是一切生物信息的基础。
在整个20世纪中,“原子”“字节”以及“基因”这三项极具颠覆性的科学概念得到迅猛发展,并且成功引领人类社会进入三个不同的历史阶段。截至目前,这三项概念在结构上竟有惊人的相似之处,其框架均由最基本的组织单元构成:例如原子是物质的最小单元,字节(或比特)是数字信息的最小单元,而基因则是遗传与生物信息的最小单元。为什么这些最小可分单元聚沙成塔的属性充满了独特的魅力?其实答案非常简单——由于物质、信息与生物均具有固定的内在结构,因此只要理解最小单元组成就可以把握整体情况。任何一个有机体的结构都要比组成它的基因复杂,但是你只有先了解这些基因才能领悟其玄妙之处。
原子、字节以及基因概念问世后,人们对于它们各自相关的领域从科学性与技术性上都有了新的认识。但是新概念的应用也会带来潜在的风险。
随着我们对基因概念的了解不断加深,人类在尝试操纵有机体的技术和能力方面都有了长足进展。我们发现遗传密码的本来面貌竟然如此简单:人类的遗传信息仅通过一种分子并按照单一编码规律即可世代相传。著名遗传学家托马斯·摩尔根(Thomas Morgan)曾经这样写道:“遗传学的基本原理是如此简明扼要,我们相信可以实现改变自然的梦想。而人们以往对于遗传规律的神秘感不过是一种错觉罢了。”
目前人们对于基因的理解已经日臻完善,并且由此摆脱了实验室阶段的束缚,我们开始有目的地在人类细胞中进行研究与干预工作。鉴于基因技术在过去20年间得到迅猛发展,因而我们能够从时间与空间上破解部分基因发挥上述复杂功能的机制。不仅如此,我们偶尔也会通过定向改造基因来影响它们的功能,最终使身体状态、生理机能甚至人类本身发生改变。这种从理论到实践的飞跃使遗传学在科学界产生了巨大的反响。起初我们在研究基因时只是想了解它们在影响人类特征、性别或者性格时起到的作用。但是当我们开始设法通过改造基因来影响人类特征、性别或者行为的时候,其意义已经截然不同了。前者的意义可能只局限于心理学与神经学进展,而充满挑战与风险的后者才应该万众瞩目。
原子理论是现代物理学的重大发现,我们朝思暮想试图去驾驭这种控制物质与能量的本领。基因理论则是现代生物学的重要基础,我们努力找寻这种主宰灵魂与肉体的方法。

第一部分 “遗传科学昙花一现”——遗传物质重见天日(1865―1935)

第一章 围墙花园

实际上,如果仔细观察周围的事物,那么你会发现,世界上所有纷繁复杂的现象都是自然规律高度集成的结果。只有在个别情况下,我们才可以仅凭直觉与感知来了解这些自然规律。当然在通常情况下,我们仍然需要通过人工实验来说明某个复杂问题,例如多普勒邀请乐队在火车上演奏就是一个典型案例,而这些方法对于理解与说明某些规律十分重要。

18世纪中期,瑞典植物学家卡尔·林奈(Carl Linnaeus)创建的生物命名法为分类学奠定了基础,那时它还只是用于形态描述而并非机制研究。换言之,虽然这种系统对地球上的生物进行了分类,但是并未归纳出分类学的逻辑规律。

自古以来,“相似性”始终是科学家与哲学家关注的话题。毕达哥拉斯注意到父母与子女之间具有相似性,于是率先提出解释这种现象的理论并且得到了人们的广泛认可。毕达哥拉斯理论的核心观点认为,男性精液是携带遗传信息(“相似性”)的主要物质。该理论后来被称为“精源论”,它强调了精子在决定胎儿各种特征中的核心作用。
毕达哥拉斯学派在观察世界的时候也离不开三角形,他们认为遗传规律是三角形理论和谐作用的结果。如果将父母看作生物三角形的两条直角边,那么孩子就是这个直角三角形的斜边。
《理想国》(The Republic)是柏拉图重要的对话体作品之一。柏拉图认为,如果根据父母的特征可以推算出孩子的天性,那么至少从理论上来说,我们可以对该公式进行人为干预:只有对父母进行精挑细选才能塑造完美的后代。政治乌托邦的物质基础必定来自遗传乌托邦。
亚里士多德根据来自生物界的实验数据剖析了“精源论”的优劣之处,并且以精练的语言创作出不朽名著《动物志》(Generation of Animals)。如果说柏拉图的作品《理想国》是政治哲学的理论基础,那么《动物志》就是人类遗传学的奠基之作。
亚里士多德拒绝接受遗传信息只存在于男性精液或精子的观点。他敏锐地指出孩子可以遗传来自母亲或祖母的特征(就像他们可以遗传来自父亲和祖父的特征一样),并且这些特征还可以表现为隔代遗传,它们会悄然无息地在某一代消失而在下一代出现。亚里士多德质疑毕达哥拉斯的“移动图书馆”说法,他不相信精液通过在体内流动就可以收集遗传信息,并且从身体各部位获得秘密“指令”。随后亚里士多德提出了替代理论:或许女性与男性具有相似的功能,她们将以女性“精液”的形式向胎儿提供遗传物质。或许男女双方在胎儿形成过程中彼此均贡献了物质基础。
亚里士多德将男女对胎儿的贡献分为“信息”与“材料”的观点并不正确,但是他在不经意中发现了遗传规律的基本事实。就像亚里士多德意识到的那样,传递信息才是遗传物质的核心功能。信息从开始就参与了生物体的孕育过程,并且最终实现了信息转化成为物质的过程。当生物体发育成熟后,其体内会再次生成男性或者女性精液,此时材料又将转化为信息。其实,“毕达哥拉斯三角”承载的信息非常有限,而遗传规律更像是沿着某个圆圈或者循环在发挥作用:形式可以承载信息,信息可转化为形式。
但是如果遗传物质是以信息的形式传递的,那么信息是如何被编码的呢?其实解决此类复杂问题的方法非常简单,那就是把所有代表遗传信息的代码进行分类整理。该理论认为,“缩微人”已经存在于精子中,其外形就像一个体型微小但五脏俱全的胎儿,仿佛努力地收缩并蜷曲在某个极小的包裹内,等待时机然后逐渐发育成婴儿。有关这种理论的各种版本不断出现在中世纪的神话与民间传说中。上述理论并不涉及遗传信息密码,缩微人只是当时人们异想天开的产物。
预成论(preformation)观点中无限递归的特性让人们浮想联翩。对于中世纪的基督徒来说,这种人类繁衍的轨迹为原罪理论提供了非常具有说服力的证据。根据预成论的观点,我们每个人都是亚当的后代,正如一位神学家描述的那样,新生命的形成正赶上亚当犯罪的关键时刻。
预成论观点中第二处引人注目的地方是不涉及解密问题。缩微人理论回避了这一敏感问题。如果按照预成论的观点理解,那么人体生长发育实际相当于充气娃娃扩张膨胀,并且在解密人体信息过程中无须钥匙或密码,因此人类起源在预成论的解释下变得易如反掌。
预成论描绘的前景生动逼真令人无法抗拒,显微镜的发明也未能撼动缩微人理论的地位。
但是并非所有人都接受缩微人遍布人体内部的理论。预成论观点面临的主要挑战在于,人们认为胚胎发育过程中会形成全新的部分。人类繁殖与预成论中描述的缩小和膨胀毫无关系。胚胎会从精子与卵子中获得特殊指令并逐渐发育,而四肢、躯干、大脑、眼睛、面部,甚至脾气或者性格等遗传特征将在新生命中得到体现。生命起源……始于创造。
无论是胚胎还是最终的人体,它们到底从精子与卵子中获得了何种动力或者指令呢?1768年,柏林胚胎学家卡斯帕·沃尔夫(Caspar Wolff)试图从研究基本原理入手找到答案,他将其称为原动力体(vis essentialis corporis),意思就是逐渐引导受精卵发育成熟并长大成人。与亚里士多德相同,沃尔夫也认为胚胎中存在某种经过加密的信息(密码),其中包含着引导胚胎从头发育的指令,而这个过程用缩微人理论根本无法解释。除了用拉丁文创造了一个模棱两可的概念之外,沃尔夫再没有做出其他贡献。他认为这些指令应该存在于受精卵内部,原动力(vis essentialis)就像一只无形的手将其塑造成人。
在18世纪的大部分时间里,预成论与“无形的手”是生物学家、哲学家、基督教学者以及胚胎学家之间激烈辩论的焦点,而作为旁观者对此没留下什么印象也情有可原。实际上,这些都是经不起推敲的陈词滥调。19世纪某位生物学家曾直截了当地说道:“当今这些矛盾的观点在很久以前就存在。”实际上,预成论基本上是毕达哥拉斯理论的重述,其核心还是精子携带着制造新生命的全部信息。而“无形的手”则是亚里士多德思想的华丽转型,它强调遗传是以信息创造物质的形式进行的(“无形的手”携带着指令塑造出胚胎)。在此期间,支持与反对两种理论的声音此起彼伏。从客观角度来说,亚里士多德和毕达哥拉斯的理论既包含有正确的内容也有错误的地方。但是在19世纪早期,整个遗传学与胚胎发育领域似乎都陷入了僵局。当时世界上涌现出许多伟大的生物学思想家,尽管他们一直试图解开遗传学的秘密,但是除了那两位生活在两千年前的古希腊学者提出的神秘观点之外,人们在这个领域没有取得任何实质性进展。

第二章 “谜中之谜”

对于学生时代的达尔文来说,有两本书对于他的想象力产生了重要影响。第一本书是1802年出版的《自然神学》(Natural Theology),其作者是达尔斯顿教区的前任牧师威廉·佩利(William Paley),他的作品让达尔文内心产生了强烈的共鸣。佩利在书中写到,假设某个人在穿越荒野时刚好发现地上有一块手表,他把手表捡了起来然后把它打开,表的内部结构由制作精细的齿轮与发条组成,从而控制该机械设备准确报时。那么认为这块手表只能由钟表匠制造岂不是很符合逻辑?佩利据此推断,同样的逻辑也适用于自然界。生物体与人类器官具有同样精细的结构,例如“头部转动的支点、髋臼中的韧带”,而所有事实都指向同一个答案:只有上帝才是创造世间万物的主宰。
第二本书是1830年出版的《试论自然哲学研究》(A Preliminary Discourse on the Study of Natural Philosophy),其作者是天文学家约翰·赫歇尔爵士(Sir John Herschel),他在作品中提出了一个完全不同的观点。赫歇尔认为,自然界乍看起来似乎非常复杂,但是科学可以将看似复杂的现象简化为原因和结果:运动是力作用于物体的结果,温度是能量转移的过程,声音是空气振动的反映。赫歇尔坚信无论是化学还是最终的生物学现象都可归结为这样的因果机制。
赫歇尔对生物有机体的起源非常感兴趣,他系统地将这个问题分成两个基本部分。第一个问题是从非生命中创造生命的秘密,就像《圣经》中提到的世界从无到有。然而,他并不敢去挑战神创论的权威地位。
赫歇尔认为第二个问题比较容易回答:是什么力量让自然界的生命如此丰富多彩?例如在动物界,某个新物种产生于其他物种的机制是什么?人类学家在研究语言的时候发现,旧语言经过单词转换后可以升级为新语言。梵文和拉丁文单词演变自古代印欧语系,英语和佛兰芒语在起源上也是同宗同源。地质学家认为目前地球的形态(岩石、峡谷和山脉)是由过去的元素演化而来。赫歇尔写道:“岁月留下破旧的遗迹,而就在这些不可磨灭的证据中包含着……诠释大千世界的浅显道理。”这是一种深刻的洞察力:科学家可以通过发掘“破旧的遗迹”来温故知新。赫歇尔并未破解物种起源之谜,但是他找到了问题所在,并因此将其称为“谜中之谜”。

那时,描述自然观在社会上十分流行,例如对动植物进行鉴定、命名以及分类:人们在描述自然界的奇迹时,实际上是在颂扬万能的上帝创造出了千姿百态的生物。但是,机械自然观却因为怀疑神创论的基本理论而受到威胁:坚持该观点的学者会去追问神创造动物的方式与时间,并且还要了解其作用机制或者动力源泉,因此这种近乎异端的学说简直就是挑战神创论的权威。当然这也并不意外,在18世纪末期,自然史这门学科主要被那些所谓的神职博物学家把持,其中就包括教区牧师、本堂牧师、修道院院长、教会执事以及修士,他们在花园里对各种动植物进行繁育,然后通过收集它们的标本向神创论天造地设的奇迹致敬,但是总体来说,他们都刻意回避讨论有关神创论基础的话题。教堂为这些科学家提供了某种庇护的天堂,而这种做法也有效地抑制了他们的好奇心。由于教会对背离正统神学研究的禁令极其苛刻,因此这些神职博物学家根本不敢质疑神创论,这样神学就可以完全掌控人们的思想活动,其结果就是在该领域经常出现令人匪夷所思的怪事。即便是当时蓬勃发展的分类学(对动植物种属进行分类)也不例外,其中探索生物起源属于被禁止的领域。最终自然史也沦落为只研究自然而无历史的学科。
正是这种静止自然观令达尔文感到进退维谷。博物学家本可以根据因果关系来描述自然界的状态,就像物理学家可以描述球体在空中运动的轨迹。达尔文这位旷世奇才的与众不同之处在于,他对自然的理解不仅限于事物的表象,而是从过程、进展以及历史的角度进行思考。当然,这也是他与孟德尔共同具备的品质。他们都曾担任神职并且热衷园艺,同时也是勇于探秘自然的先锋。达尔文与孟德尔发现了同一个具有划时代意义的问题:“自然”到底来自何方?孟德尔的问题源自微观:单个有机体如何才能将信息传递给下一代?达尔文的问题则来自宏观:有机体如何让它们的特征信息世代相传?最后,这两位巨匠的努力殊途同归,从而诞生了现代生物学上最重要的理论,并且对于人类遗传学进行了最为深入的阐述。

达尔文的吊床就在那张被海水浸湿的测量图上方,他平时蜷缩在里面全神贯注于随身携带的那几本书,其中就包括弥尔顿(Milton)的作品《失乐园》(Paradise Lost,似乎非常适合他的处境),以及查尔斯·赖尔(Charles Lyell)在1830年至1833年间发表的《地质学原理》(Principles of Geology)。赖尔的工作给达尔文留下了深刻的印象。赖尔认为(在他那个时代具有颠覆意义)复杂地质(例如岩石和峡谷)的形成与岁月变迁有关,而与上帝之手毫无关系,这只是个缓慢的自然过程(例如侵蚀、沉淀与沉积)。赖尔认为自然界经历过的洪水袭击数不胜数,并非只有《圣经》中记载的那一次大洪水暴发;上帝为塑造地球进行的雕琢不计其数,不是一蹴而就那么简单。对达尔文来说,赖尔的核心思想是,地球在某种作用平缓的自然力量驱动下不断被塑造和重塑,而其中就蕴含着雕刻自然的智慧。

达尔文发现嘲鸫有两到三个变种,但是每种亚类的区别都非常明显,而且它们只会出现在某个特定的岛屿。于是他写下了此生中最重要的一句科学论断:“每个变种在各自的岛屿上均保持稳定。”

孟德尔曾经在维也纳参加教师资格考试的时候感到十分困惑,为什么地球上的生物要按照传统方式进行分类?其实早在1836年,达尔文也遇到了相同的问题。

就在那年,有两项重要发现浮出水面。第一项发现是,欧文与赖尔在研究化石期间注意到标本具有某种潜在的规律。在那些已经灭绝的巨型动物骨骼发现地,仍然有某些“体型硕大”的动物出没。第二项奇怪的发现则来自古尔德。在加拉帕戈斯群岛,到处都是各种各样的雀类。似乎每个地方都有自己独特的物种,而眼前这些小鸟就是每座岛屿的条形码。那么达尔文是如何将这项发现进行整合的呢?其实,他在脑海中已经勾勒出解决方案的雏形,虽然这个想法非常简单,但是却具有颠覆性的力量,以至于没有哪位生物学家敢涉足:如果全部雀类均源自同一种原始祖先呢?如果现在的小型犰狳是远古巨型犰狳的后代呢?根据之前赖尔的观点,目前的地貌是大自然力量作用几百万年的结果。如果现在各种动物的形态也是大自然力量千百万年作用的结果呢?

达尔文笔记的内容比较隐晦,有些只是不经意间萌发的想法。在其中的某页上,他画了一幅插图来表达萦绕在心头的想法:并非所有物种都是以神创论为中心产生的,也许它们起源的路径就像发自“树木”的嫩枝或者汇入河流的小溪,而这些有机体的祖先经过多次分化与再分化后会形成繁枝细节,然后才演化为具有现代形态的后代。就像语言、地貌以及逐渐冷却的宇宙一样,动植物可能在繁衍过程中也经历了这种循序渐进的变化。
达尔文清楚地意识到,这幅图完全否定了神创论的观点。在基督教物种形成的概念中,上帝具有至高无上的核心地位,他创造的宇宙万物中就包括这些动物。但是在达尔文的笔下,根本不存在所谓的中心。加拉帕戈斯群岛上的13种雀类与神念创造无关,它们源自共同的祖先并且历经了不断分化的“自然繁衍”过程。其实现代羊驼亦有类似的进化方式,而它们的祖先也曾是体型硕大的动物。达尔文不假思索地在笔记本上方写下了“我认为”这几个字,似乎将其作为生物学与神学思想分道扬镳的暗号。

达尔文在什鲁斯伯里与赫里福德农场度过了儿童时代,其实他苦苦寻觅的部分答案就在眼前,但是却在远涉重洋8000千米后才重新发现这种现象。而这就是我们所说的变异,即动物有时会产生与亲本类型特征不同的后代。长期以来,农民们一直在利用这种现象对动物进行繁育和杂交,并且通过多次传代从发生自然变异的后代中进行选择。在英格兰,农场饲养员把繁育新品种与变异体当成一门高深的学问。所有人都知道赫里福德短角牛与克莱文长角牛外表差距悬殊。作为一名充满好奇心的博物学家,当达尔文从遥远的加拉帕戈斯群岛回到英格兰时,他出乎意料地发现每个地区都拥有自己的奶牛品种。不过达尔文与那些饲养员都明白,动物的繁育过程绝非偶然事件。虽然这些奶牛来源于共同的原始祖先,但是人们却可以通过选择育种创造出新的品种。
达尔文知道,将物种变异与人工选择进行巧妙地组合将产生惊人的效果。鸽子可以看起来像公鸡或孔雀,而狗可以有短毛、长毛、杂色、花斑、弓形腿、无毛、直立尾、凶狠、温顺、胆小、谨慎以及好斗等性状。但是,最终改变奶牛、狗与鸽子性状的力量还是掌握在人类手中。

1798年,马尔萨斯以笔名发表了《人口论》(An Essay on the Principle of Population)这篇颇具煽动性的文章,他认为人口增长与有限资源之间的矛盾无法调和。马尔萨斯据此推断,随着人口不断增长,生活资料将逐渐耗尽,个体之间的竞争将变得更加激烈。人口本身的扩张倾向必然会与有限的资源发生严重对抗,自然界将无法满足人类日益增长的需求。随后人类社会将面临世界末日的考验,“各种流行病和瘟疫肆意泛滥,数以万计的生命会因此终结”,最后“食物将在人口之间”重新分配。那些侥幸逃过“自然选择”的人会再次面对这种残酷的循环,就像希腊神话中绝望的西西弗斯(Sisyphus),而人类也将在饥荒的胁迫下四处流浪。
在马尔萨斯的文章中,达尔文终于找到了他梦寐以求的答案。而这种为生存而进行的斗争就是塑造之手。死亡不仅是自然界的指挥官,同时也是残忍的刽子手。达尔文写道:“我突然想到,在这种环境下(自然选择),有利变异将被保留而无利变异将被清除。其结果就是形成某个新的物种。”
现在达尔文的主要理论框架已经粗具规模。动物在繁殖过程中会产生不同于亲代的变异。而某个物种内的个体总是在稀缺资源领域展开竞争。当这些资源成为关键瓶颈时,例如在发生饥荒后,某个能更好适应环境的变异体将被“自然选择”。最能够适应环境的个体,也就意味着最“适合”生存(“适者生存”这句话源自马尔萨斯主义经济学家赫伯特·斯宾塞)。然后这些幸存者将会产生更多类似的后代,并且推动物种内部发生进化。
达尔文仿佛目睹了发生在蓬塔阿尔塔盐滩与加拉帕戈斯群岛上的演变过程,似乎只要快进播放就可以了解这部反映历史变迁的电影。岛上成群的雀类在数量暴增之前以水果为食,当咆哮的季风或炎热的夏季来临,整座岛屿就会陷入无尽的凄凉,同时水果的产量也会急剧下降。在茫茫的鸟群中,产生了某种雀类的变异体,它外形奇特的喙可以撬开种子。当饥荒蔓延至整个雀类世界时,蜡嘴雀的变异体却可以食用硬粒种存活下去,并且经过不断繁殖形成数量庞大的新型雀类物种,并且数量日益增多。随着新马尔萨斯极限(疾病、饥荒、寄生虫)的出现,新型雀类物种占据了主导地位,此时种群的结构再次发生改变。现在蜡嘴雀成为主流,而原来的雀类则逐渐灭绝。自然界的进化过程就在这种艰难险阻中缓慢前行。

1854年,华莱士经历了一次海难,虽然在经济上损失不大,但是全部标本均无法找回。最后华莱士狼狈不堪地逃离亚马孙盆地辗转来到了另一处火山岛,这里就是位于东南亚边缘的马来群岛。华莱士在此也像达尔文一样有了重要收获,他发现不同河道内近缘物种之间的差异令人吃惊。1857年冬季,华莱士开始构思这些岛屿上推动突变产生机制的理论基础。次年春季,他躺在床上忍受着高热与幻觉的折磨,并且坚持完成了该理论遗漏的最后一部分。华莱士重新回顾了马尔萨斯的文章。“答案显而易见……适者生存……只要通过这种方式,动物机体的任意部分都可以根据需要发生改变。”甚至于他的思想语言(变异、突变、生存与选择)都与达尔文的著述存在惊人的相似。尽管加拉帕戈斯与马来群岛相距遥远,但是这两位背景迥异的科学家最终却殊途同归。

达尔文原本打算将所有发现整理完成后一并发表,可是他现在只能在仓促之间完成这部具有重要意义的著作。达尔文的理论在受到热捧的同时也招致了多方的批判。或许达尔文颇有先见之明,他谨慎地表达了该理论对于人类进化的意义:《物种起源》通篇只有一行叙述涉及人类祖先,“人类的起源与历史终将得以阐明”,这也许是那个时代谦卑的科学表述。

第三章 “空中楼阁”

达尔文在科学领域勇于探索的精神在于,他并不排斥类人猿是人类祖先的观点。但是由于达尔文需要证实自身理论内在逻辑的完整性,因此他在科学诚信上感到强烈的紧迫感。而遗传学是其中一个亟须完善的“巨大空白”。
达尔文意识到,遗传学理论并不从属于进化论,它的重要性无可替代。对于加拉帕戈斯群岛上某种经过自然选择的蜡嘴雀变异体来说,两种看似矛盾的现象实际上都是必不可少的环节。首先,“正常”短喙雀必须能偶尔产生蜡嘴样变异体,也可以将它们称为异类(达尔文认为此类现象就是“突变”,这个形象的描述令人联想到自然界风云变幻的多样性。达尔文觉得,推动进化的关键在于大自然的幽默感,而并非源自其内在的使命感)。其次,一旦变异体产生,蜡嘴雀必须能将相同的性状传递给它的后代,并且在传代的时候维持变异稳定。假设上述两点中有任何一点无法满足,例如繁殖或者遗传过程中无法产生变异体或者传递变异性状,那么大自然将深陷泥潭而无法自拔,并且最终导致进化链条中断。如果达尔文的理论成立,那么遗传机制必须具备以下特征:恒定性与变化性、稳定性与变异性。
达尔文对于这种具有相互制约特征的遗传机制展开了长时间的思考。在达尔文活跃的那个时代,18世纪法国生物学家让—巴蒂斯特·拉马克(Jean-Baptiste Lamarck)提出的遗传学机制是最为人们普遍接受的理论。根据拉马克的观点,遗传性状从亲代传递给子代的方式与消息或故事散播的方式相同,即这些过程都是通过传授来完成的。拉马克认为动物通过强化或弱化某些特定性状以适应周围环境,“这种影响与其作用时间成正比”。被迫以硬粒种为食的雀类通过“强化”其喙以适应环境。随着时代变迁,这种雀类就成为具有坚硬钳状喙的新物种。此类性状将通过遗传传给雀类的子代,而在其亲代预先适应硬粒种的基础上,它们的喙也会变得坚硬。按照相似的逻辑,羚羊为了觅食必须伸长脖子才能够到高处的树叶。根据拉马克提出的“用进废退”观点,这些羚羊的颈部会尽量伸展并拉长,而且它们的子代也将保持长颈的性状,因此产生了长颈鹿(请注意拉马克理论与毕达哥拉斯遗传理论的相似之处,前者认为机体向精子提供指令,后者认为精子从所有器官收集信息)。
拉马克理论的魅力在于它描述了一个令人信服的进化过程:所有的动物都在逐渐适应环境,然后它们会沿着进化的阶梯缓慢趋向完善。进化与适应彼此相互融合成为一个连续的整体:适应环境是进化的基础。该理论并非靠直觉产生,它的内容既适合神创论,同时也非常符合生物学家的研究现状。尽管神创论认为所有动物最初均由上帝创造,但是它们在错综复杂的自然界中仍有逐渐完善的机会,神圣的存在之链依然在发挥着作用。总而言之,上述观点的作用甚至变得更为突出:人类作为所有哺乳动物中最完美的代表位于适应性长链的末端,具有顺应环境以及直立行走的特点。
拉马克理论认为,羚羊的祖先在某种循序渐进的自然力(饥荒)的作用下产生了长颈变异体,但是达尔文认为长颈鹿的祖先并非那些伸长脖子且戴着颈部支架的羚羊。他坚持用遗传机制来解释问题:最早出现的长颈羚羊来自何方?
达尔文试图归纳出某个可以与进化论匹配的遗传理论。由于他在实验领域并不具备天赋,因此在这里遇到了关键的技术瓶颈。
但事实证明,观察自然与改造自然是完全不同的概念。从表面上看,自然界中缺乏支持基因存在的证据;而实际上,人们还被迫通过错综复杂的实验来解释遗传过程中离散微粒的作用。由于达尔文无法通过实验手段证验遗传理论,因此他只能从纯理论角度进行推断。达尔文为了弄清楚这个概念花了近两年的时间,他在获得充足的论据之前精神已经濒临崩溃。达尔文认为生物体细胞会产生名为泛子(gemmules)的微粒,而这些含有遗传信息的泛子就存在于亲代体内。当动物或者植物达到生殖年龄时,泛子中的信息将传递至生殖细胞(精子与卵子)。因此,关于机体“状态”的信息将在受精时从亲代传递到子代。如果按照毕达哥拉斯的理论,那么在达尔文的泛子模型中,每个生物体都应该以缩微形式携带构建器官和结构的信息。然而在达尔文收集的动物标本中,遗传信息都是以离散状态存在的。似乎生物体的构建由议会投票决定。手掌分泌的泛子携带着形成新手的指令,而来自耳朵的泛子则传递着产生新耳的密码。
那么如何把这些泛子中来自父母的指令应用到胎儿发育呢?达尔文在此延续了既往的传统观点:来自男女双方的指令在胚胎中相遇的过程非常简单,就像是不同的涂料或者颜料相互混合在一起。大多数生物学家对于此类混合遗传的概念耳熟能详,其实这就是亚里士多德关于男女特征混合理论的重述。看起来达尔文再次将两个完全不同的生物学理论整合在了一起,他借鉴了毕达哥拉斯的缩微人(泛子)理论和亚里士多德的信息与混合的概念,然后再将它们融合在一起打造成全新的遗传理论。
达尔文将该理论命名为泛生论,意思就是“源自万物”(因为所有器官均贡献泛子)。

达尔文提到的“如释重负”并未持续很久,他很快就会从“疯狂的梦想”中惊醒。那年夏季,当《动物和植物在家养下的变异》被编撰成书时,《北英评论》(North British Review)发表了一篇对于达尔文早期作品《物种起源》的述评,字里行间充满了对泛生论的质疑,而这也是达尔文此生中遇到的最为严峻的挑战。该文作者的本意并不是要对达尔文的工作进行批评:他名叫弗利明·詹金(Fleeming Jenkin),是一名来自爱丁堡的数学工程师与发明家,其作品极少涉及生物学内容。当时詹金只是偶然看到达尔文的著作,他不仅仔细通读了全文,而且还对其中的暗示进行了论证,很快他就在争论中发现了该理论的致命缺陷。
詹金质疑达尔文的核心问题是:如果遗传性状在传代中彼此之间始终遵循“混合”理论,那么怎样才能阻止变异被杂交迅速稀释呢?詹金写道:“(变异)的数量会被迅速超越,而这种性状将在几代之后彻底消失。”为了举例说明,詹金虚构了某个故事,其内容多少带有那个时代的种族歧视色彩:“如果某位白人因海难流落到一个黑人居住的岛屿……我们这位落难的英雄可能成为国王,他会为了生存杀死很多黑人,并且将妻妾成群,子孙满堂。”但是如果男女双方基因发生相互混合,那么至少从遗传的角度而言,詹金所描述的“白人”将注定遭受厄运。这位白人与黑人妻子的孩子大概会继承他1/2的遗传信息,他的孙子将继承1/4,他的重孙将继承1/8,他孙子的孙子将继承1/16,然后依次类推直到被彻底稀释,而他的遗传物质用不了几代就会消失殆尽。根据达尔文的理论,即使“白人基因”是最优越(“适合”)的遗传物质,可是在经过不断混合后仍将导致其原有性状出现衰退。最终,虽然白人国王比同代人具有更多的后代,并且他的基因也符合适者生存的要求,但是这位孤家寡人的性状很快就会淡出人们的视线。
詹金所述故事的具体情节并不高雅,当然他也有可能是故意舞文弄墨,但是其中的观点不言而喻。如果变异在遗传过程中无法维系,或者说不能让改变的性状“固定”下来,那么所有这些性状最终会在混合作用下消失得无影无踪。除非他们能保证将其性状传给子代,否则无法打破这个怪圈。画家有时会把画笔在水中蘸一下稀释颜料,此时水的颜色也会开始变成蓝色或者黄色。但是随着水中稀释的颜料增多,最后它必将变成浑浊的灰色。以后无论再加入何种颜料,它仍将保持凝重的灰色。如果动物界也适用于相同的遗传法则,那么是何种力量保留了变异生物体的独特性状呢?詹金或许会问,为什么达尔文雀没有都逐渐变成灰色呢?
达尔文被詹金的推理深深吸引。他写道:“弗利明·詹金斯(原文如此)给我制造了巨大的麻烦,但是他的观点要比任何其他论文或评论都更具建设意义。”没有人在詹金无可辩驳的逻辑面前还表示质疑,而达尔文为了挽救岌岌可危的进化论,迫切需要一个能够自圆其说的遗传理论。
但是遗传学需要具备何种特征才能解决达尔文的问题呢?如果达尔文的进化论确实成立,那么遗传机制必须拥有某种内在能力,从而保证遗传信息不被稀释或者分散,即便遗传物质发生混合也不会影响其性状。那么必然存在某种信息原子,它具有相互独立、不可溶解以及永久不灭的特点,并且这种微粒可以从父母传递到孩子体内。
那么是否有证据表明遗传物质具有这种稳定性呢?达尔文仔细阅读了自己收藏的大量书籍,他可能从某处被引用的参考文献中得到了启示。这篇晦涩难懂的文章原著者来自布尔诺,是一位鲜为人知的植物学家。如果达尔文确实阅读了这篇文章,尤其是在他撰写《动物和植物在家养下的变异》与构思泛生论之时阅读,那么该研究将为理解进化论提供最为关键的意见。而这位作者就是奥古斯丁派修士格雷戈尔·约翰·孟德尔。

第四章 他爱之花

孟德尔发现纯种豌豆植株所具有的不同性状可以遗传并发生变异。当同株豌豆进行纯育时,高茎株的子代全为高茎,矮茎株的子代则全为矮茎。有些品系只能产生圆粒种子,而另外一些只能得到皱粒种子。未成熟的豆荚表现为绿色或者黄色,而成熟的豆荚表现为平滑或者皱缩。
孟德尔注意到,每种性状至少会出现两种变异体。就像某个单词会有两种拼法或者某款夹克具有两种颜色(尽管在自然界中可能存在更多变异类型,例如分别开着白色、紫色、淡紫色和黄色花朵的植株,但是孟德尔在实验中只选取了相同性状的两种变异体)。后来生物学家将控制这些变异体的序列命名为“等位基因”(alleles),该词根在希腊语中是“其他”(allos)的意思,在此指的是某种性状的两种不同亚型。紫色与白色分别由两个控制颜色的等位基因支配,而高茎与矮茎则是由两个影响高度的等位基因操纵。
培养纯育植株只是孟德尔实验的开始。为了揭开生物遗传的奥秘,他深知繁育杂合体的重要性,而只有应用“杂种”(德国植物学家常用该词描述实验杂合体)才能揭开纯合的面纱。孟德尔与后人的不同之处在于,他当时就十分清楚自己从事的研究意义深远,正如孟德尔在书中记述的那样,他提出的问题对于阐明“有机体进化历史”的作用至关重要。在短短的两年之内,孟德尔就出人意料地构建出一套完整的实验模型,并且可以满足他研究某些重要遗传特性的需求。简而言之,孟德尔提出的问题如下:如果将高茎植株与矮茎植株进行杂交,那么子代中是否会出现中等高度的植株?控制植株高矮的两个等位基因是否会相互融合?
构建杂合体是件枯燥无味的差事。豌豆是典型的自花传粉植物,花药与雄蕊在位于花瓣根部龙骨状的联合部位发育成熟,而花药中的花粉会直接散播在自身的雌蕊柱头上。异花传粉则与之完全不同。为了构建杂合体,孟德尔首先需要通过“去雄”来摘除豌豆花的雄蕊,然后再把橙色的花粉人工传授给其他花朵。虽然他经常独自一人忙得连腰都直不起来,但却总是攥着笔刷与镊子重复着去雄与授粉的工作。
1857年夏末,修道院花园里的第一批杂交豌豆开花了,这里简直就是紫色与白色的花海。孟德尔将豌豆花的颜色记录在案,随后当藤蔓上挂满豆荚时,他会剥开豆荚检查种子的性状。他设计了新的杂交方案:高茎植株与矮茎植株杂交,黄色种子植株与绿色种子植株杂交,圆粒种子植株与皱粒种子植株杂交。此时孟德尔又突发灵感,他将某些杂合体相互杂交,进而构建出“杂合体的杂合体”。整个实验按照上述模式进行了8年。
哲学家路德维希·维特根斯坦(Ludwig Wittgenstein)写道:“一个微不足道的想法,就足以占据某个人的一生。”确实,一眼看去孟德尔的人生充满了繁杂琐碎的念头。他整天周而复始地沉浸在播种、授粉、开花、采摘、剥壳与计数的工作里。尽管整个过程极度枯燥乏味,但是孟德尔却深信天下大事必作于细。18世纪兴起的科学革命遍及欧洲大地,这场变革最深刻的意义在于,人类意识到自然法则具有同一性与普适性。众所周知,牛顿根据苹果从树上坠落的事实发现了万有引力,而其本质与控制天体环绕轨道运行的驱动力毫无二致。如果遗传规律也存在某种通用的自然法则,那么我们就可以从豌豆生长发育的过程来了解人类繁衍生息的奥秘。或许孟德尔进行豌豆研究的场地十分有限,但是狭小的面积并不能干扰他投身科学的雄心壮志。
孟德尔写道:“实验开始阶段进展缓慢。不过早期确实需要有些耐心,当我同时进行几项实验之后,结果也就愈发清晰起来。”当孟德尔开展了多项平行杂交实验后,他收集实验数据的速度也越来越快。孟德尔逐渐从这些数据里辨别出豌豆的生长模式,其中就包括植株稳定性、性状比例以及数值规律。经过不懈的努力,他现在终于敲开了遗传学领域的大门。
第一种模式理解起来比较简单。在子一代杂合体中,单个可遗传性状(高茎植株与矮茎植株、绿色种子与黄色种子)完全不会发生融合。高茎植株与矮茎植株杂交产生的子代全部为高茎。圆粒种子植株与皱粒种子植株杂交产生的子代全部表现为圆粒。而在豌豆中,所有七种性状均遵循该模式。孟德尔写道,“杂交性状”无中间形态,只能“遵循某种亲本类型”。孟德尔将具有压倒性优势的性状称为显性性状(dominant),而将在子一代中消失的性状称为隐性性状(recessive)。即使孟德尔此时终止实验,他对于遗传学理论的贡献也具有划时代意义。某种性状同时存在显性与隐形基因的事实与19世纪流行的混合遗传理论相悖:孟德尔培育的杂合体并不具有介于两种性状之间的中间形态。如果子一代杂合体中携带显性基因,那么隐性基因控制的性状就会消失不见。
可是隐性基因控制的性状去哪里了呢?难道是被显性等位基因吞噬或是清除了吗?孟德尔在第二阶段实验中又进行了深入研究。他将高茎与矮茎植株的子一代杂合体进行杂交,构建出子二代杂合体。由于高茎是显性性状,因此本轮实验中所有亲代均为高茎植株(未见到隐性性状植株)。但是当杂交工作完成以后,孟德尔发现其结果远远超出预期。他在某些子二代杂合体中发现了完整的矮茎植株,而矮茎作为隐性性状曾经消失了整整一代。除此之外,其余六种性状经过实验论证后也表现为相同的模式。白花性状在子一代杂合体中消失了,而在某些子二代中却再度出现。孟德尔意识到,“杂合”生物体是一种由等位基因组成的复合物,其中包括可见的显性等位基因与潜伏的隐性等位基因(孟德尔在描述这些变异体时原本使用的是“形状”一词,直到20世纪遗传学家才提出等位基因的概念)。孟德尔仔细研究了每项杂交实验的结果,他根据豌豆植株不同子代数目之间的比例关系,初步构建出一个可以解释各种性状遗传模式的模型。在孟德尔构建的模型中,每种性状由某些独立且不可分割的信息微粒决定。这些信息微粒可以产生两种变异体,或者说代表了两种等位基因:矮茎与高茎(茎高)或白色与紫色(花色),而其他性状也可以依此类推。在豌豆中,每一植株均可从亲代获取一份基因拷贝。而在人体中,精子与卵子将分别从父亲与母亲体内获得一个等位基因。当杂合体形成后,尽管只有显性基因控制的性状可以表达,但是所有控制其他性状的信息仍将保持完整。
1857年至1864年之间,孟德尔曾经剥开过不计其数的豆荚,他执着地将每种杂合体的杂交结果数据制成表格(“黄色种子,绿色子叶,白色花瓣”),并且最终发现所有结果都惊人的一致。就在修道院花园中这一小块空场上,孟德尔获得了数量众多且可供分析使用的数据。孟德尔将园艺知识与精准观察的优势结合在一起,在辛勤进行异花授粉之余还仔细绘制记录子叶颜色的表格,很快他就发现了传统遗传学观点不能解释的现象。
孟德尔的研究结果指出,遗传是将不连续的亲代信息传递给子代的过程。其中精子携带一份信息(一个等位基因),卵子携带另一份信息(另一个等位基因),因此生物体可从每一位亲代获得一个等位基因。当该生物体产生精子或者卵子时,等位基因将会再次发生分离,分别进入精子或者卵子,而两个等位基因只有在子代中才能合二为一。当两个等位基因同时存在时,其中一个基因可能会“支配”另外一个基因。当显性等位基因存在时,隐性等位基因就像消失了一样,但是如果植株同时获得两个隐性等位基因,那么隐性等位基因控制的性状将再次出现。在整个过程中,单个等位基因携带的信息不可分割,信息微粒将保持完整。
孟德尔想起了多普勒进行的声波实验:噪声背后隐藏着乐音,看似杂乱无章的背后却暗含着深奥的规律,只有通过精心设计的人工实验,并利用携带简单性状的纯育品系创造杂合体,才能揭示潜在的遗传模式。在自然界中,生物体表现出的变异性状浩如烟海(高茎、矮茎、皱粒、圆粒、绿色、黄色、棕色),而这些携带遗传信息的微粒在悄然无息中世代相传。生物体的性状均由某种独立单位决定,它们具有与众不同的特征以及永不磨灭的属性。尽管孟德尔没有为这个遗传单位命名,但是他实际上发现了基因最基本的特征。

第五章 “名叫孟德尔”

1878年夏季,时年30岁的荷兰植物学家雨果·德·弗里斯赶赴英格兰拜访达尔文。达尔文的做法与费马如出一辙,他也漫不经心地宣称自己发现了遗传规律的解决方案,但是却从未发表相关内容。达尔文十分清楚其中隐含的利害关系。遗传学说对于进化论至关重要:达尔文明白,如果没有能够形成变异的途径,并且使变异在传代过程中保持稳定,那么生物将无法进化出新的特性。然而10年过去了,达尔文承诺的“论有机生物变异”起源的著作依然未见发表。达尔文于1882年去世,而此时距德·弗里斯来拜访已过去了4年。随后新生代生物学家不断涌现,他们继续追随达尔文的足迹苦苦寻觅这一消失理论的线索。
德·弗里斯也曾认真研读过达尔文的著述,他将目光锁定在泛生论上,该理论认为精子与卵子将以某种方式收集并且核对体内的“信息微粒”。这种在细胞中收集然后在精子中装配信息的方式看似简单,可是要把它作为构建生物体的指南却过于牵强附会;仿佛精子只需要接收电报里的信息就可以撰写人类之书。

与此同时,反对泛生论和泛子的实验证据也在不断增多。奥古斯特·魏斯曼(August Weismann)是一位勇于挑战权威的德国胚胎学家,他于1883年完成了一项直接抨击达尔文遗传泛子学说的实验。尽管这项实验非常残酷,但是它证实了达尔文与拉马克理论的谬误之处。
魏斯曼提出一个激进的观点:或许遗传信息只存在于精子和卵子中,并不存在某种直接机制将后天获得的性状传递至精子或卵子。无论长颈鹿的祖先多么热衷于伸长脖颈,它们都不能将该信息转化为遗传物质。魏斯曼将遗传物质称为“种质”,他提出生物体只能通过种质产生后代。实际上,所有进化都可以被理解成种质在代际垂直传播:例如鸡蛋就是鸡传递遗传信息的唯一途径。

可是种质到底是由什么物质组成的呢?这个问题让德·弗里斯陷入了沉思。难道它会像涂料一样被混合与稀释吗?难道种质中各种离散信息会以打包的形式存在,然后再构建成为完整的信息?那时候德·弗里斯还不了解孟德尔论文的内容。但是德·弗里斯与孟德尔也有相通之处:他选择了阿姆斯特丹周边的乡村地区作为实验地点,然后开始搜集和整理各种特殊的植物变异体,其研究对象不仅局限于豌豆,还包括大量千奇百怪的植物标本,其中就包括扭曲的茎秆与分叉的叶子、带有斑点的花朵、毛茸茸的花药以及蝙蝠状种子。当德·弗里斯把这些变异植株与正常植株进行繁育后,他发现了与孟德尔相同的结果,也就是说这些变异体的性状不会融合,它们会以一种离散且独立的形式通过代际传递保留下来。每种植物似乎都具有许多性状,其中就包括花瓣颜色、叶子形状以及种子质地等等,而每种性状似乎都由某条独立且离散的信息片段编码,它们可以在植物体内代代相传。与孟德尔相比,德·弗里斯明显缺乏那种敏锐的洞察力:1865年,孟德尔在文章中大胆运用数学推理阐明了豌豆杂交实验。在德·弗里斯的植物杂交实验中,他只是模糊意识到变异体的性状(例如茎秆尺寸)是由不可分割的信息微粒编码的。可是编码一个变异体性状需要多少信息微粒呢?到底是一个、一百个,还是一千个?
到了19世纪80年代,德·弗里斯还是不了解孟德尔从事的工作,但是他也逐渐采用定量描述的方法来解释自己的植物实验结果。1897年,德·弗里斯完成了《遗传性畸变》(Hereditary Monstrosities)一文,在这篇具有里程碑意义的论文中,他对实验数据进行了系统分析,并且推断每种性状是由单一信息微粒决定的。每个杂合体都继承了两个这样的信息微粒,其中一个来自精子,而另一个来自卵子。然后信息微粒又通过精子和卵子完整地传递给下一代。信息微粒既不会混合,也不会出现信息丢失。尽管德·弗里斯全面否定了达尔文的泛生论,可是为了向导师致以最后的敬意,他给这些信息微粒起名为“泛生子”。
1900年春季,当德·弗里斯依然深陷于植物杂交研究的泥潭时,某位朋友给他寄来一份从自己图书馆里找到的旧论文副本。德·弗里斯迅即找到了一种似曾相识的感觉,仿佛一股让人无法躲避的寒流贯穿他的脊髓:这个“名叫孟德尔的人”无疑比德·弗里斯领先了30年。在孟德尔的论文中,德·弗里斯不仅找到了解决自身问题的答案,而且其内容还可以完美诠释他的实验结果,但是这也对他的原创性构成了挑战。看来达尔文和华莱士的陈年旧事在德·弗里斯身上再次重演:他曾经希望自己才是发现遗传规律的第一人,可是到头来却早已被别人捷足先登。1900年3月,德·弗里斯在恐慌之余赶紧发表了相关论文,并且在内容上刻意回避孟德尔之前取得的任何成果。也许全世界都忘记了这个“名叫孟德尔的人”以及他在布尔诺完成的豌豆杂交工作。德·弗里斯后来写道:“尽管谦虚是一种美德,但是骄傲的人会走得更远。”

除了德·弗里斯以外,还有其他学者也重新发现了孟德尔在遗传结构(具有独立性且不可分割)领域做出的贡献。就在德·弗里斯发表那篇具有里程碑意义的成果(有关植物变异体)当年,蒂宾根大学的植物学家卡尔·科伦斯(Carl Correns)公布了一项关于豌豆和玉米杂交的研究的数据,其结果能够与孟德尔的豌豆杂交实验完全吻合。
此外在维也纳,也就是1856年孟德尔植物学考试受挫的地方,另一位年轻的植物学家埃里希·冯·切尔马克—赛谢涅格(Erich von Tschermak-Seysenegg)也再次发现了“孟德尔定律”。当冯·切尔马克看到孟德尔作品的那一瞬间,他也体会到了那种似曾相识感所带来的恐惧。他后来怀着嫉妒和沮丧的心情写道:“我当时还以为自己发现了新大陆。”
研究成果被重新发现一次可以反映科学家的先见之明,而被重新发现三次则着实是对原创者的一种鄙夷不屑。虽然德·弗里斯故意在首篇论文中忽略了孟德尔,但是他最终还是被迫承认了孟德尔的贡献。
然而德·弗里斯进行的实验在某些方面的确要优于孟德尔的研究。平心而论,孟德尔是发现遗传单位的先驱,但是德·弗里斯在遗传与进化领域的造诣也有目共睹,因此他不解的问题必定也会让孟德尔感到困惑:早期变异体来自何方?为什么豌豆会有高茎和矮茎,或者紫花和白花的区别?
其实答案就在进行杂交实验的花园内。在接下来的几年里,生命力旺盛的月见草大量繁殖,德·弗里斯从中发现了800株野生新型变异体,其中包括巨大叶片、多毛茎秆或是畸形花朵。根据达尔文进化论第一阶段的发生机制,自然界会本能地产生某些罕见的畸形。达尔文曾将这些变异体称为“巨变”,意指变化无常的大千世界。但是德·弗里斯选择了一个更为严谨的词语:他将这种情况称为“突变”(mutants),源自拉丁语“改变”一词。
德·弗里斯很快便意识到自己的观察结果具有重要意义:这些突变体恰好是达尔文之谜中缺失的部分。实际上,如果我们将自发突变体的产生机制(例如大叶月见草)与自然选择相结合,那么达尔文所说的永动机就可以自行运转了。突变是自然界中变异体产生的根源:长颈羚羊、短喙雀与大叶植物均可自发生成于数目庞大的普通种群(该理论与拉马克的观点相反,这些突变体源自随机选择而并非刻意制造)。这些变异体的特征在于其遗传性,它们在精子与卵子内以离散指令形式存在。当动物在自然界中物竞天择的时候,只有那些最能适应环境的变异体,或者说最适合的突变才能世代延续下去。它们的后代在继承这些突变的同时会形成新的物种,并且由此推动物种进化。自然选择不是作用于生物体,而是影响其遗传单位。德·弗里斯意识到,鸡只是鸡蛋自我更新过程中的产物。

德·弗里斯用了20年才成为孟德尔遗传学说的支持者,但是英国生物学家威廉·贝特森只用了一个小时就彻底转变了观念。1900年5月的一个晚上,贝特森从剑桥搭乘夜班火车赶往伦敦,准备在皇家园艺协会就遗传学领域的话题发表演讲。当火车还在黑暗的沼泽地带缓慢前进的时候,贝特森读到一篇德·弗里斯发表的论文副本,他立刻就为孟德尔遗传单位的离散概念所折服。贝特森从此把传播孟德尔定律视为己任,并且确保这位先驱将不再被人们忽视。
贝特森意识到自己正在见证,或者更贴切地说,他是在推动生物学界产生深刻变革。贝特森写道,破译遗传法则将改变“人类的世界观和改造自然的能力”,其作用要远大于“自然科学领域里任何可以预见的进展”。
1905年,就在人们苦思冥想之际,贝特森自己创造出了一个新名词。他将其称为遗传学(Genetics),也就是研究遗传与变异规律的学科,其词根来自希腊语“诞生”(genno)。
贝特森敏锐地觉察到,这门新兴学科具有潜在的社会和政治影响力。
贝特森与此前的任何其他科学家的不同之处在于,他发现遗传信息的不连续性对人类遗传学的未来有着举足轻重的作用。如果基因确实是独立的信息微粒,那么我们就有可能实现定向选择、纯化以及操纵这些微粒。我们可以对优良基因进行选择或者扩增,并将不良基因从基因库中清除出去。从理论上讲,科学家能够改变“个体组成”以及国家组成,甚至在人类身份上留下永久印记。
“人们会自然而然地服从权力的意志。”贝特森悲观地写道,“不久之后遗传学将会为人类社会变革提供强大的推动力,也许就在不远将来的某个国家,这种力量会被用来控制某个民族的组成。然而实现这种控制对某个民族,或者说对人类究竟是福是祸就另当别论了。”由此可见,贝特森早在基因概念普及之前就已经有了先见之明。

第六章 优生学

1883年,也就是达尔文辞世的第二年,他的表弟弗朗西斯·高尔顿出版了《人类才能及其发展的研究》(Inquiries into Human Faculty and Its Development)一书。在这部颇有争议的著作中,高尔顿为优化人种制订了一个战略计划。高尔顿的想法非常简单:他打算模仿自然选择的机制。既然自然界可以通过生存和选择来对动物种群产生显著影响,那么高尔顿设想通过人工干预也可以加速人类进步的过程。高尔顿曾经认为,只要通过“非自然选择”手段选择出最强壮、最聪明以及“最适合”的人类,然后让他们繁殖后代,那么就可以在短短的几十年里赶上自然界亿万年的脚步。
高尔顿需要为这个宏图大略起个名字。他这样写道:“我们迫切需要一个简洁的称谓来诠释这门学科。这门学科能够让优质种族或血统得以延续,并且以较大的优势快速压制劣质的种族或血统。”对高尔顿来说,优生学(Eugenics)这个词的内涵恰如其分,“我曾提出采用‘大力繁殖学’(viriculture),不过似乎优生学更为简洁……”优生学的词根源自希腊语,其中前缀eu的意思是“优秀”,而genesis的意思是“优秀的种族通过遗传获得卓越的品质”。高尔顿从来不会否认自己的天赋,他对于自己创造的新词十分满意:“请与我共同见证人类优生学的未来,此项研究不久将会具有重要的实用价值,我认为现在应该分秒必争……抓紧时间完成个人与家族史的采集。”

1859年,高尔顿拜读了达尔文的名著《物种起源》。更准确地说,高尔顿如饥似渴地“吞下”了这本书:他仿佛在电闪雷鸣中猛然醒悟,内心的激荡更是溢于言表,其中不乏嫉妒、骄傲与钦佩。高尔顿热情洋溢地致信达尔文,告诉表哥他“正在驶向知识王国的彼岸”。
高尔顿感觉在这个“知识王国”中最想去探寻的内容就是遗传学。与弗利明·詹金一样,高尔顿很快也意识到他的表哥发现了正确的原理,但是却得出了错误的结论:遗传定律对于理解达尔文的理论至关重要。遗传与进化相当于阴阳互补。上述两种理论天生就形影不离,它们不仅相互依存而且还需要共同完善。如果“表哥达尔文”解决了谜题的一半,那么另一半就注定交给“表弟高尔顿”来攻克。
19世纪60年代中期,高尔顿开始研究遗传学。但是高尔顿在实验方面毫无建树,他缺乏像孟德尔那样的直觉。不仅兔子死于休克,就连花园里的藤蔓也几近枯萎。高尔顿重新调整了思路,他标新立异地将人类作为研究对象。虽然模式生物未能成功揭示遗传的机制,但是高尔顿推断测量人类变异和遗传性状或许能够揭开这个秘密。事实证明,这个决定成为通向成功的重要标志:这是一条自上而下的研究路径,他首先从那些最为复杂多变的性状(例如智力、性格、体能与身高)入手。从此之后,高尔顿在遗传学领域进行的研究势不可当。
高尔顿并非首位将测量人类变异用于遗传学研究的科学家。在19世纪30年代至40年代,比利时科学家阿道夫·凯特勒(Adolphe Quetelet,由天文学家转为生物学家)开始系统地测量人类的特征,并且使用统计学方法对这些数据进行分析。凯特勒采用的方法兼顾了严谨与全面的原则。他写道:“人类的出生、成长与死亡都遵循某种迄今尚未被阐明的法则。”凯特勒列表统计了5738名士兵胸廓的宽度和高度,结果证实他们的胸廓大小呈正态分布,其形状看起来既光滑顺畅又具有连续性。实际上,无论凯特勒的研究对象如何变换,他总是会注意到这里有某种共同的模式在反复出现:人类的特征甚至是行为均呈钟形曲线分布。
高尔顿受到凯特勒实验方法的启发,随后在测量人类特征差异方面投入了更多精力。然而那些复杂人类特征(例如智力、学术素养与美貌)的变异体也会遵循同样的模式吗?高尔顿明白市面上没有任何设备能够测量上述特征,但是这些问题根本难不倒他(高尔顿写道:“科学计数是攻坚克难的良方。”)高尔顿通过了剑桥大学的数学荣誉考试(聪明才智的象征),然而具有讽刺意味的是,这正是他当年挂科的那门课。根据最佳逼近研究显示,即便是考试能力也遵循钟形曲线分布。在往返于英格兰和苏格兰之间的时候,高尔顿曾经对于女性的“容貌”进行了统计分析,他会偷偷地将遇到的女性按照“迷人”“中等”以及“反感”进行排名,然后用藏在口袋里的细针在卡片上打孔计数。由于高尔顿的观察能力(兼具审视、评估、计数以及统计功能)强大,因此所有观察对象的人类特征均无法逃脱他的眼神:“视觉与听觉敏锐度、色觉、视觉判断力、呼吸力度、反应时间、挤压强度与拉力、击打力度、臂展、身高……体重。”
现在高尔顿的工作重点也从测量转变为机制研究。人类变异性状是通过遗传获得的吗?其具体方式是什么?他在选取研究对象时再次避开简单生物,希望能够直接进行人类研究。高尔顿预计,如果某位成功人士喜得贵子,那么这个孩子日后崭露头角的概率为1/12。相比之下,这个概率在随机选择的普通人中是1/3000。高尔顿认为英雄本色可以遗传,贵族得以世袭的基础在于智慧而不是爵位。
高尔顿认为,成功人士的后代“为了保持优势已经提前布局”,因此他们成功的概率明显增高。他创造了“先天与后天”(nature versus nurture)这句名言并借此区分遗传与环境的影响。然而高尔顿对阶级和地位占据主导的解释并不满意,他无法忍受自己的“聪明才智”只是特权与机遇的附庸。天赋应该由基因编码。高尔顿确信成功模式取决于遗传因素,并且坚决回击任何其他观点的挑战。
高尔顿将大部分数据整理发表在《遗传的天才》(Hereditary Genius)一书中。然而人们对这部内容颠三倒四的作品反应冷淡,就连达尔文读过之后都对其产生了疑虑。高尔顿虚心接受了批评,从此以后再未进行过家谱研究。
高尔顿必定意识到了谱系项目的固有缺陷,因此他迅速重整旗鼓并且启动了另一项重要的实证研究。19世纪80年代中期,他开始给普通百姓邮寄“调查表”,请他们核对家谱后列表汇总各项数据,并将父母、祖父母及子女的身高、体重、眼睛颜色、智力及艺术才能的详细测量结果寄给他(高尔顿继承的家族财富此时发挥了作用,他会为提供合格调查表的人支付一笔可观的报酬)。高尔顿为了揭开神秘的“遗传法则”努力了数十年,而这些内容真实的数据即将让他的梦想实现。
高尔顿使用的大部分研究数据相对直观,当然有时也会出现意料之外的事情。如果这些数据背后隐藏着遗传基本规律,那么它的核心内容应该是:人类性状呈连续曲线形式分布,并且连续变异会继续产生连续变异。
但是会不会有某种法则(某种潜在模式)掌控着变异的起源?19世纪80年代末期,高尔顿将全部观察结果进行统计分类,然后大胆地将它们整合到他已经成熟的遗传假说中。他提出,每种人类性状(例如身高、体重、智力以及容貌)都是祖先遗传的保守模式产生的复合变量。总体来说,孩子的父母分别为其提供了一半的遗传物质,祖父母分别提供1/4的遗传物质,而曾祖父母则分别提供1/8的遗传物质,然后我们可以以此类推,溯源至最遥远的祖先。所有祖先对该性状贡献的总和可以表示为:1/2+1/4+1/8……而最终结果恰好为1。高尔顿将其称为“祖先遗传法则”。其实这是预成论中缩微人(借用了毕达哥拉斯和柏拉图的理论)概念的数学表达方式,只不过是在分子分母的包装下华丽转变为一个时尚的法则。
高尔顿意识到,只有精准预测现实中存在的遗传模式,这种法则才可以登上科学的巅峰。1897年,他找到了理想的测试对象。高尔顿在痴迷于研究英格兰纯种狗的过程中发现了一份珍贵的手稿:在这份由埃弗里特·米莱爵士(Sir Everett Millais)于1896年颁布的《巴吉度猎犬俱乐部守则》(Basset Hound Club Rules)中,详细记载了多代巴吉度猎犬的毛色特征。让高尔顿喜出望外的是,他发现自己总结的法则能够精准预测每一代巴吉度猎犬的毛色。至此他终于揭开了遗传密码的神秘面纱。
虽然该方案令人满意,但是好景不长。在1901年至1905年间,高尔顿与学术上的宿敌威廉·贝特森(剑桥大学的遗传学家)发生了严重的分歧,而贝特森是孟德尔理论最坚定的拥护者。贝特森性格固执且气势逼人,他对于高尔顿的方程根本不屑一顾,就连那副八字胡都会令人感到避之不及。贝特森对此断言,巴吉度猎犬的数据可能存在异常或者错误的情况。美丽的梦想总是要面对残酷的现实,无论高尔顿的无穷级数看起来多么靓丽,贝特森的实验结果都无可辩驳地指向一个事实:遗传指令由独立的信息单位携带,而不是以1/2或者1/4的形式从遥不可及的祖先那里继承。尽管孟德尔的科学精神与德·弗里斯的不拘小节形成了鲜明对比,但是都不会影响他们做出正确的判断。人类的遗传物质组成非常简单:其中一半来自母亲,另一半则来自父亲。父母双方分别贡献一套遗传指令,解码后就能繁衍后代。
其实贝特森的“觉醒”一点都不低调。在1900年至1910年这十年间,随着孟德尔“遗传单位”的证据日渐增多,生物学家不得不面对这一新理论的冲击。这种变革也产生了深远的影响。亚里士多德曾经将遗传定义为信息流,而这条河承载着遗传密码从卵子进入胚胎。2000多年以后,孟德尔在无意中发现了遗传信息的基本结构,也可以说是组成密码的字母表。如果说亚里士多德描述了遗传信息在代与代之间流通的趋势,那么孟德尔则发现了流通中使用的货币。
但是贝特森意识到,他的观点迫切需要得到另外一项更为重要的理论的支撑。生物信息流转并不局限于遗传过程,它实际上遍布生物体内的每个角落。遗传性状的传递仅是信息流运动的一个例子而已,但是如果你穿越想象的空间来仔细端详,那么就不难理解信息在整个生命世界中流转的轨迹。胚胎伸展身体、植物追逐阳光以及蜜蜂结伴起舞分属于不同的生物行为,而我们要想了解其原理就需要对加密的遗传指令进行解码。孟德尔是否也曾无意中发现了这些密码的基本结构?难道是遗传信息单位在指导每一步的进程吗?贝特森提出:“我们每个人在审视自己研究成果的时候都可以看到孟德尔理论的影子。面对眼前这片不为人知的新大陆,我们似乎刚刚踏上探索的征程……鉴于遗传学实验研究具有举足轻重的意义,因此它绝不会成为任何学科的分支。”
我们在定义“新大陆”的时候需要使用全新的术语,现在是给孟德尔的“遗传单位”命名的时候了。1909年夏季,植物学家威廉·约翰森(Wilhelm Johannsen)为遗传单位创造了一个特殊的名词。约翰森将“泛生子”(pangene)的拼写缩短,创造出“基因”(gene)一词。
就像道尔顿和原子的关系一样,无论贝特森还是约翰森根本不理解什么是基因。他们两人对于基因的物质形态、物理与化学结构、体内或者细胞内位置,甚至作用机制等问题一无所知。基因的概念非常抽象,它当时只是被用来标记某种功能。基因是遗传信息的载体,其定义则取决于基因的功能。

弗朗西斯·高尔顿平时就隐居在位于拉特兰门的住所里,可是令人不解的是,他完全不为“激动人心的时代”感到振奋。当生物学家开始争先恐后地接受孟德尔定律,并且忙于为各自的成果自圆其说的时候,高尔顿则表现出无动于衷的样子。高尔顿对于遗传单位的属性并不感兴趣,他关心的问题在于遗传过程是否可控,即操纵人类遗传是否能够造福人类。
对于高尔顿来说,优生学只是遗传学的一种应用形式,就像农业是植物学的应用形式一样。高尔顿写道:“自然选择具有盲目、缓慢与残忍的特点,而人工干预的方式可能更为长远、迅速与温和。当人类拥有上述能力时,他便有义务朝这个方向努力。”早在1869年,高尔顿就在《遗传的天才》这部书中提出了优生学的概念,这比孟德尔定律重新发现的时间提前了30年,可惜他没有在此领域继续探索,转为集中精力从事遗传机制的研究。但是当祖先遗传假说被贝特森和德·弗里斯逐渐颠覆后,高尔顿迅速跻身规范研究的倡导者行列。他可能对遗传学的生物基础存在误解,但是他对于人类遗传学的应用前景充满信心。
1904年春季,高尔顿在伦敦经济学院的一场公开演讲中提出了优生学概念。高尔顿的演讲持续了约10分钟。他提出,应该把优生学“当成某种新型宗教引入国民意识中”。优生学的理论基础源自达尔文,他们将达尔文自然选择理论的逻辑移植到人类社会。“所有生物都应该遵守以下原则:身体健康会胜过体弱多病,精力充沛会胜过虚弱无力,主动适应环境会胜过被动接受生活。简而言之,同类竞争必然会出现优胜劣汰,这种规律适用于任何生物。人类亦在其中。”
优生学的目标是加速选择主动适应与身体健康的对象,同时淘汰那些被动接受与体弱多病的同类。为了实现这个理想,高尔顿建议要选择性繁育身强体壮的后代。他还提出,假设该理论能够被社会认可,那么传统意义上的婚姻将被颠覆:“如果社会禁止那些不能满足优生学要求的婚姻……那么以后就没必要结婚了。”就像高尔顿设想的那样,社会应该记录那些卓越家族中的优秀性状,并且将它们整理成为人类血统档案。高尔顿将其称为“宝典”,而只有从这部“宝典”中挑选出的男女才能繁育出最优秀的后代,从某种意义说这种方式与繁育巴吉度猎犬和赛马没什么区别。
根据会议日程,贝特森是当天最后一个演讲者,尽管他的观点令人悲观,但是却非常科学公正。高尔顿提出要根据身体和心理的性状(表型)来择优进行繁育,但是贝特森认为,真正的遗传信息并不存在于这些性状中,而是隐藏在决定性状的基因组合里(基因型)。那些让高尔顿锲而不舍探索的身体和心理特征,例如身高、体重、容貌与智力,只不过是潜伏其后的基因特征的外在体现。优生学的真正用途在于操纵基因,而不是凭空想象去选择性状。高尔顿看不起那些使用“显微镜”的实验遗传学家,可是他低估了这种工具的强大功能,只有由表及里才能了解遗传规律的内在机制。贝特森警告说,很快人们就会发现,遗传规律将“遵循一种极其简单的精准法则”。如果优生学家熟知这些法则并且掌握了破解手段(实现了柏拉图的梦想),那么他将获得前所未有的能力:优生学家就可以通过操纵基因驾驭未来。
虽然高尔顿的演讲并没能取得预想中的满场喝彩(他后来还抱怨说那些观众简直“生活在40年前”),但他显然涉及了当时颇为敏感的领域。在高尔顿看来,如果放任“傻子”不断繁衍后代,那么将会对整个国家造成严重的遗传威胁。托马斯·霍布斯(Thomas Hobbes)曾担忧人类会堕入一种“贫困、污秽、野蛮、短暂”的自然状态,高尔顿则担心未来国家会被拥有劣质血统的人掌控:也许他们只是一群身材矮小的跳梁小丑。他对日益增长的人口表示担忧,如果任其自行发展下去,那么势必产生大量无知的劣等人群[他将其称为“劣生学”(kakogenics),意为“源自劣等基因”]。尽管高尔顿身边的拥护者对此坚信不已,但是他们并不敢高声谈论这个敏感的话题,实际上威尔斯只不过是说出了他们的心声,即只有满足以下条件时优生学才能起效:增加优质人口选择性繁育(所谓的积极优生学),对劣质人口开展选择性绝育(消极优生学)。
就在高尔顿生命的最后几年,他仍为消极优生学的观点所困扰,并且始终不肯妥协。高尔顿认为“将失败者绝育”的方法隐含着众多道德风险,通过这种手段来清除人类遗传花园中的杂草令他感到惴惴不安。然而直到最后,他将优生学打造成“国教”的渴望还是战胜了对消极优生学的隐忧。
1912年7月24日,第一届国际优生学大会在伦敦塞西尔酒店(Cecil Hotel)开幕,而此时距高尔顿去世正好一年。在全部大会发言中,有两个报告的内容让人不寒而栗。德国学者在第一个报告中用狂热且精准的语言展示了“种族卫生”理论,而这对于即将到来的黑暗年代也是个不祥的预兆。阿尔弗雷德·普洛兹(Alfred Ploetz)既是医生也是科学家,同时他还是种族卫生理论的狂热支持者,他在会议上充满激情地宣布,德国正在启动种族清洗计划。随后美国同行所做的第二个报告则更加有过之而无不及。如果把德国开展的优生运动比喻成家庭小作坊,那么在美国进行的运动就是由国家推动的工业化大生产。动物学家查尔斯·达文波特(Charles Davenport)被誉为美国优生运动之父,他出身贵族家庭并且曾经在哈佛大学获得博士学位。虽然达文波特没有参加1912年的优生学大会,但是他的门生布利克·范·瓦根伦(Bleecker Van Wagenen,美国饲养者协会年轻的主席)却在会上发表了一场激动人心的演讲。凡·瓦根伦的报告全是美国研究人员获得的实践经验,而当时欧洲的同行还在理论和思辨的泥淖中苦苦挣扎。他踌躇满志地讲述着美国国内为清除“缺陷品种”而开展的具体工作。

第七章 “三代智障已经足够”

从孟德尔开始进行豌豆实验,再到卡丽·巴克被法院强制执行绝育手术,这中间只经历了短短的62年。就在这稍纵即逝的60多年间,基因已经从一种植物学实验中的抽象概念演变为操纵社会发展的强大工具。就像1927年在最高法院进行辩论的“巴克诉贝尔案”一样,遗传学和优生学领域也是鱼龙混杂,可是其影响力已经渗透到美国社会、政治和个人生活中。1927年,印第安纳州通过了一项早期法律的修正案,决定为“惯犯、白痴、弱智和强奸犯”实施绝育。而其他州随后也制定了更为苛刻的法律措施,对那些被认定为劣等人的男女进行绝育并收容监禁。
正当这场由国家倡导的绝育工程遍及全美时,一项开展个性化遗传选择的草根运动也开始蓬勃兴起。
当美国的优生运动(监禁、绝育、谋杀)风起云涌时,欧洲的优生学家就剩下“羡慕嫉妒恨”了。到1936年,距离“巴克诉贝尔案”结束还不足10年,“遗传清洗”就像可怕的瘟疫席卷欧洲大陆,而基因与遗传理论也在这场血雨腥风中展现出势不可挡的力量。

第二部分 “化零为整,化整为零”——揭秘遗传机制(1930─1970)

第一章 “身份”

20世纪20年代末期,在所有涉及基因与身份的讨论中,很难找到支持基因存在的证据。如果某位科学家被问到基因的成分是什么,它如何实现自身功能,或者它究竟在细胞内位于何处,那么答案可能很难令人满意。尽管遗传学已经在法律与社会生活中发挥着巨大的作用,但是基因本身仍然是个虚无缥缈的对象,就像是潜伏在生物世界的孤魂野鬼。
揭秘遗传学黑匣子的工作多少带有误打误撞的成分,而人们曾对这位科学家以及他所从事的研究并不看好。1907年,威廉·贝特森到访美国继续宣传孟德尔的发现,他在纽约停留期间与细胞生物学家托马斯·亨特·摩尔根进行了会面。
原先摩尔根最感兴趣的领域是胚胎学。起初,摩尔根甚至对于遗传单位是否存在,以及如何存储或者在何处存储等问题均不感兴趣。他主要关注发育问题,也就是单个细胞成长为生物体的机制。
摩尔根原来也反对孟德尔的遗传理论,他认为复杂的胚胎学信息不可能以离散单位形式存在于细胞中(因此贝特森认为他是个“蠢货”)。然而最终,摩尔根还是被贝特森的证据说服了,贝特森作为“孟德尔斗牛犬”很难对付,他总是凭借图表数据让对手甘拜下风。尽管摩尔根接受了基因的存在,但是他仍旧困惑于基因的物质形式。摩尔根非常希望能够揭示遗传学的物理基础。他写道:“我们对于遗传学的兴趣并不局限于当初的数学公式,而是想要了解它在细胞、卵子以及精子中的作用。”
托马斯·摩尔根十分推崇波弗利、萨顿以及史蒂文斯的工作,不过他仍然希望对基因的形态进行具体描述。波弗利已经发现染色体是基因的物理存在形式,但是基因与染色体结构之间更深层次的关系尚不清楚。基因在染色体上如何排列?它们是像珍珠项链一样分布在染色体丝上吗?是否每个基因在染色体上都有固定的“位置”?基因会发生重叠吗?基因之间到底是依赖物理连接还是化学连接呢?
摩尔根以果蝇这种模式生物作为实验对象着手开始研究。摩尔根的实验室面积和形状都与孟德尔的花园类似,而这里很快也将成为遗传学历史上同样具有标志性意义的场所。
与孟德尔的研究方法类似,摩尔根也是从鉴定遗传性状开始入手的,他通过肉眼可见的变异体来追踪果蝇的代际变化。摩尔根注意到,在常见的红眼果蝇里自发出现了一只罕见的白眼果蝇。此外其他果蝇突变体的性状还包括叉毛、黑体、弯腿、卷翅、腹节以及无眼,简直就是万圣节的僵尸大游行。摩尔根与学生们将正常果蝇与突变体进行杂交,也就是用红眼果蝇与白眼果蝇进行交配,然后可以追踪多代果蝇的遗传性状。最终突变体再次证明了它们对于这些实验举足轻重的意义:只有异常值才能阐释正常遗传的本质。
如果想要理解摩尔根发现的重要性,那么我们还得重温孟德尔的研究。在孟德尔的实验中,每个基因都像自由球员一样是独立存在的个体。例如,花色与种子质地或者茎秆高度没有任何关系。由于每种特征都是独立遗传,因此理论上全部性状可以自由组合。而每次杂交的结果就是一场完美的“遗传赌博”:如果将高茎紫花植株与矮茎白花植株进行杂交,那么你最终将会得到各种类型的杂合体,除了上述两种亲本植株以外,还有高茎白花植株和矮茎紫花植株。
但是摩尔根研究的果蝇基因却经常发生变化。在1910年至1912年间,摩尔根与他的学生们对于上千种果蝇突变体进行了杂交实验,并且最终得到了数以万计的果蝇。每次杂交结果都被详细记录在案:这些性状包括白眼、黑体、刚毛以及短翅。摩尔根据此绘制了几十本图表,他在检查这些杂交结果时发现了一种惊人的模式:某些基因看起来就像彼此相互“连接”在一起。例如,控制产生白眼的基因与Y染色体密不可分:无论摩尔根采取何种方法进行杂交,白眼性状都与该染色体如影随形。与之相似的是,黑体基因与产生某种特定形状翅膀的基因紧密相关。
对于摩尔根来说,这种遗传连锁只能说明一个问题,那就是基因彼此之间存在物理连接。在果蝇中,由于黑体基因与小翅基因均位于相同的染色体上,因此它们绝对不会(或者极少会)表现为独立遗传。如果把两颗串珠穿在同一条细绳上,那么无论怎样摆弄手中的绳子,它们都不会分开。虽然这种规则也适用于相同染色体上的两个基因,但是想要把控制叉毛与体色的基因分开绝非易事。这种不可分割的特征具有某种物质基础:如果把染色体比作一条“细绳”,那么基因就是穿在上面的串珠。
摩尔根的发现是对孟德尔定律的重要修正。基因并不会单独旅行,相反,它们总是结伴而出。染色体分布在细胞核内,它储存着各种被压缩的信息包。但是这项发现具有更重要的意义:从概念上讲,摩尔根不仅将基因连接在一起,他还将两门学科(细胞生物学与遗传学)结合起来。基因不再是一个“纯理论单位”,它是居住在某个特定部位的有形物质,并且以某种特殊的形式存在于细胞中。“现在我们可以将它们(基因)定位于染色体,”摩尔根解释道,“那么我们将基因作为物质单位是否合理?难道它们是比分子更复杂的化学物质吗?”
基因连锁定律确立后又催生出第二项与第三项发现的问世。现在让我们再回顾一下基因连锁的意义:摩尔根通过实验证实,相同染色体上存在物理连接的基因将一起遗传。如果产生蓝眼睛的B基因与产生金发的Bl基因连锁,那么金发的孩子肯定也会遗传蓝眼睛(尽管这个案例源自假设,但是可以用来说明真实的遗传规律)。
但是基因连锁定律也存在例外:在极其偶然的情况下,某个基因可以从其伙伴基因上解除连锁,并且从父本染色体交换到母本染色体,于是就会出现非常罕见的蓝眼睛与黑头发的后代,或者与之相反,出现黑眼睛与金头发的后代。摩尔根将这种现象称之为“基因互换”。最终我们会发现,基因交换将掀起一场生物化学领域的革命,并且为遗传信息混合、配对以及交换夯实了理论基础。这种现象不仅发生在姐妹染色体之间,而且还遍及不同的生物体与不同物种之间。
除此之外,“基因互换”还促成了另一项重要的发现。由于某些基因之间的连接十分紧密,以至于它们从不发生互换。摩尔根的学生认为,这些基因在染色体上的物理位置可能最为接近。而其他位置相距较远的连锁基因则更容易解离。但是无论如何连锁基因都不会出现在完全不同的染色体上。简而言之,遗传连锁的紧密程度反映了染色体上基因物理位置的远近:通过观测两种遗传性状(例如,金发与蓝眼)连锁或者解离的时间,就可以判断控制这些性状的基因在染色体上的距离。
1911年冬季的某个夜晚,当时在摩尔根实验室工作的斯特提万特还只是个20岁的大学生。在天将破晓时,斯特提万特终于绘制出世界上首张果蝇染色体线性遗传图谱(包含有6个基因)。斯特提万特绘制的这张早期遗传图谱意义非凡,它成为20世纪90年代蓬勃兴起的庞大人类基因组计划的序曲。由于通过连锁定律可以确定基因在染色体上的相对位置,因此斯特提万特同样为将来克隆复杂家族性疾病(例如乳腺癌、精神分裂症、阿尔茨海默病等)基因奠定了基础。而他只用了短短的12个小时就在纽约的学生宿舍里勾勒出了人类基因组计划的雏形。
在1905年至1925年间,哥伦比亚大学的蝇室始终是遗传学研究的中心,同时也成为催生新兴学科的发源地。日新月异的科学理念就像原子裂变一样迅速播散开来。基因连锁、基因互换、线性遗传图谱以及基因距离等概念以惊人的速度相继问世,而遗传学也从此进入了跨越式发展的新里程。随后的几十年里,许多曾经在蝇室工作过的学者都成为诺贝尔奖的获得者:其中就包括摩尔根、他的学生以及他学生的学生,甚至就连这些高足的学生也因各自的贡献而频频获奖。
但是除了基因连锁与遗传图谱以外,即便是摩尔根本人有段时间也很难想象或描述出基因的物质形态:在“染色体”与“遗传图谱”中携带信息的化学物质是什么呢?如果科学家能够将抽象的事实融会贯通,那么这将是对他们能力的最好证明。从1865年到1915年间,也就是在孟德尔的论文发表50年后,生物学家仍然只能通过基因的特性来描述它们:例如,基因决定性状、基因发生突变后产生的其他性状、基因之间存在的化学或者物理连接。遗传学家仿佛只能透过朦胧的面纱来揣测一切,他们开始构思基因的空间结构与内在联系:染色体丝、线状结构、遗传图谱、杂交、虚线或实线,其中染色体携带有编码与压缩后的信息。但是没有人实际见过基因或了解它的物理本质。遗传学研究的中心问题似乎只能通过间接证据得到印证,而这种尴尬的局面着实令人着急。

如果说海胆、黄粉虫与果蝇都距离人类世界太过遥远,或者认为孟德尔与摩尔根的重大发现还缺乏具体说服力,那么在1917年多事之春爆发的革命则另当别论。那年3月,摩尔根正在位于纽约的蝇室撰写关于基因连锁的文章,而风起云涌的起义则席卷了整个俄国,最终推翻了沙皇专制并建立起布尔什维克政权。
历史不可能屈尊于医学传记,但是也没有谁能置身事外。俄国革命或许与基因无关,可是却与遗传有很大关系。阿列克谢王子罹患遗传病的事实与其显赫的政治地位大相径庭,这种尴尬的现实令俄国的君主政权备受质疑。阿列克谢病情的隐喻作用不可忽视,他作为帝国的象征却只能靠巫医与祷告来苟且度日。历史上法国人曾经对于贪吃蛋糕的玛丽王后感到厌烦,而俄国人也受够了靠吃草药来抵抗神秘疾病的羸弱王子。
如果能够对于阿列克谢的遗骸进行全基因测序,那么调查者可能会发现导致B型血友病的罪犯基因,而这个突变基因在欧洲大陆整整传递了四代,并且神出鬼没地与20世纪发生的重要政治变革紧密联系在一起。

第二章 真相与和解

基因曾经是生物学范畴“之外”的概念。我的意思是,如果你在思考哪些是发生在19世纪末期生物领域的重大问题,那么遗传学的排名恐怕并不会靠前。研究生物体的科学家显然更关注其他领域,例如胚胎学、细胞生物学、物种起源与进化。那么细胞如何发挥功能?胚胎如何发育成生物体?物种来自何方?又是什么造就了千变万化的自然界呢?
但是人们在试图回答这些问题时却都受阻于相同的节点,其中的共性就是缺乏信息的连接。任何细胞与生物体都需要信息来执行自身的生理功能,可是这些信息源自何方?某个胚胎需要接收消息才能变为成熟的个体,那么又是什么物质来传递此类消息呢?或者就事论事,某个物种成员如何“知道”它应该属于哪个物种呢?
当某个生物体开始繁殖的时候,基因发出的指令在胚胎构建、细胞功能、新陈代谢、交配仪式与复制物种时起到关键作用,并且所有这些重要信息均将以某种相同的模式来进行。遗传学不是生物学领域的次要问题,它一定会跻身于学科排名的前列。
将基因作为解决这些生物学核心问题答案的认识姗姗来迟,而这种滞后导致了一种奇怪的现象:作为事后出现的学科,遗传学将被迫与生物学其他主要领域的观点和解。如果基因是代表生物信息的通用货币,那么它将不仅局限于诠释遗传规律,而且还可以用来解释生物界的主要特征。首先,基因需要解释变异现象。其次,基因需要解释进化过程。第三,基因需要解释发育问题。
现在我们可以从基因的角度来描述上述三项和解,并且据此来阐明自然界的历史、现在与未来。其中进化描述了自然界的历史:即生命从何而来。变异描述了自然界的现在:为什么生物体会是现在的样子。而胚胎发育则是为了把握未来:单个细胞怎样才能创造出继承其衣钵的生物。

罗纳德·费希尔(Ronald Fisher)是一位年轻的数学家。尽管费希尔在中学期间就是个与众不同的数学天才,但是糟糕的视力却成为他在剑桥学习的累赘。
费希尔白天为保险公司审核统计信息。而夜幕降临时,当整个世界几乎从视野里消失后,他就开始从事生物学理论研究。但是这个令费希尔着迷的科学问题同样需要解决基因的形态与功能问题。到了1910年,生物学领域的顶级学者还认为,染色体上携带信息的离散颗粒就是遗传信息的携带者。然而生物界中所能看见的一切都拥有近乎完美的连续性:凯特勒、高尔顿等19世纪的生物统计学家证实,例如身高、体重,甚至智商等人类性状都符合平缓连续的正态分布曲线。即便是生物体的发育(最明显的信息链遗传)似乎也要经历平缓连续的阶段,而不会出现离散爆发的生长模式,正如毛虫化茧成蝶的演变也不会表现为时断时续。如果将雀类喙的尺寸绘制成图,那么这些点同样可以构成连续曲线。那么“信息颗粒”(遗传学像素)如何以可见的方式来反映生物界的平缓变化呢?
费希尔意识到,构建严谨的遗传性状数学模型或许能够解决这个矛盾。他明白,由于孟德尔选择了高度离散的特征并采用纯种植物进行杂交,所以才能在实验中发现基因具有不连续性。单基因只能产生两种状态,也就是高或矮以及是或否,但是如果现实世界中的各种性状(身高或肤色)是由多基因共同调控呢?假设身高由5个基因决定,或者说鼻子形状受到7个基因控制,那么我们又该如何解释呢?
费希尔发现,构建某个多基因(5个或7个)调控单一性状的数学模型并不复杂。如果该模型只涉及3个基因,那么总共应该有6个等位基因或者基因变异体,其中3个来自母亲,而另外3个来自父亲。经过简单的组合数学运算后,这6个基因变异体可以产生27种不同的组合。费希尔发现,如果每种组合都可以对高度产生独特影响,那么根据结果绘制的曲线就会非常平缓。
如果某个性状受到5个基因调控,那么经过排列产生的组合数量将会更多,而这些排列组合导致的身高变化就会趋于连续。如果再把环境因素考虑在内,例如营养对于身高的影响或者日光照射对于肤色的作用,那么费希尔就可以对更为罕见的组合及其影响展开想象的空间,并且最终绘制出完美的平缓曲线。假设使用7张彩色玻璃纸分别对应彩虹的7种基本颜色,然后将它们并排摆放且两两叠加,那么我们可以通过这种手段来展现几乎所有的色彩。而每张玻璃纸所代表的颜色“信息”依旧保持离散。这些颜色并没有真正彼此融合,只是其相互叠加的效果创造出视觉上连续的颜色光谱。
1918年,费希尔将他的分析结果发表在《孟德尔遗传假设下的亲缘相关性》(The Correlation between Relatives on the Supposition ofMendelian Inheritance)一文中。尽管文章标题看上去含混不清,但是其传递的信息简明扼要:如果你将控制某个性状的3个到5个变异基因的效果混合起来,那么所得到的表型连续性将趋于完美。他在文中写道,“人类变异的确切数量”可以由孟德尔遗传学的扩展理论来解释。对于单基因的独立影响而言,费希尔认为就像是点彩派绘画中的某个点。如果你将画面放大到足够倍数,那么展现在眼前的就是许多独立且离散的点。但是在浩瀚的自然界中,我们观察与体验到的性状却是无数散点组成的集合:似乎这幅天衣无缝的画作由密集的像素构成。

第二项和解关乎遗传与进化,其解决方法不仅需要构建数学模型,而且更取决于实验数据的结果。达尔文认为只有通过自然选择才能完成物种进化,但是在开始进行自然选择之前,总得有些自然存在的东西以供选择。对于自然界中的生物种群来说,它们必须具备足够数量的自然变异体才能区分出胜负。我们以某个岛屿上的雀类种群为例,只有喙的尺寸具有充足的本质多样性后,当旱季来临时才可能对其中具有最坚硬或者最长喙的雀类进行选择。假设这种多样性并不存在,即所有的雀类都具有相同的喙,那么自然选择根本无法发挥作用。全部雀类将会一次性灭绝。物种进化至此将戛然而止。
但是在野生状态下发生自然变异的动力是什么呢?雨果·德·弗里斯曾经推测突变是发生变异的原因:基因型发生改变导致表型出现变化,然后再通过自然选择被筛选出来。但是德·弗里斯的猜测要早于基因分子定义提出的时间。那么实验证据能否说明可识别的突变造成了现实中的基因变异?突变是源自瞬间和自发,还是说那些千奇百怪的自然遗传变异早就存在于野生种群中呢?基因在面临自然选择时发生了什么变化呢?
狄奥多西·多布然斯基是一位移民美国的乌克兰裔生物学家。1943年9月,多布然斯基尝试利用某项独立实验来诠释变异、选择与进化的关系,或者说他打算在纸箱内重建加拉帕戈斯群岛的自然生态。
多布然斯基的实验囊括了与进化相关的所有关键要素。他从某个基因结构发生自然变异的种群入手,然后将温度作为自然选择的推动力。只有那些“最适合”的生物体,也就是那些能够适应低温或者高温环境的个体才能生存下来。随着新品系果蝇的出生、选择与繁殖,原有的基因频率发生了变化,从而产生具有全新遗传构成的种群。
为了使用规范的术语来解释遗传学、自然选择以及进化之间的交互作用,多布然斯基重新启用了基因型与表型这两个重要的词汇。基因型是指某个生物体的基因组成,它可以指某个基因、基因结构甚至整个基因组。与之相反,表型则指的是生物体的自然或者生物属性与特征,例如眼睛的颜色、翅膀的形状或是对冷热条件的耐受力。
基因决定自然特征是孟德尔发现的重要真理,而现在多布然斯基不仅可以重述以上事实,他还将其理论扩展到涉及多个基因与多种特征的领域:

基因型决定表型

但是上述公式需要添加两项重要的修正才算完善。首先,多布然斯基注意到,基因型并不是表型的唯一决定因素。显而易见,自然环境与社会背景将对其物理属性造成影响。拳击选手的鼻子形状肯定不只是遗传的产物,其决定因素还包括他选择的职业性质以及鼻软骨遭受攻击的次数。如果多布然斯基突发奇想把某个纸箱中全部果蝇的翅膀剪掉,那么他在不改变基因的情况下同样会影响果蝇的表型(翅膀的性状)。换句话说:

基因型+环境=表型

其次,有些基因可能会被外部触发器或随机因素激活。例如,果蝇中决定残翅大小的某个基因就取决于温度:你不能只根据果蝇基因或环境因素来预测其翅膀的形状,你需要将这两种因素结合起来通盘考虑。对于此类基因而言,基因型与环境都不是表型的预测指标,这是基因、环境与概率交互作用的结果。
因此最终的修正公式应该按照如下表述:

基因型+环境+触发器+概率=表型

尽管上述公式看似简洁,但是却具有权威性,它不仅抓住了遗传、概率、环境、变异与进化之间交互作用的本质,而且还反映了决定生物体形态与命运的演变过程。在自然界里,基因型变异就存在于野生种群中。这些变异与不同的环境、触发器以及概率发生交互作用,然后决定了某个生物体的属性(某只果蝇对于温度耐受力的强弱)。如果面临高强度的选择压,例如温度升高或是食物锐减,那么只有那些最适合的表型才能得以保全。某只果蝇经过这种选择性生存后会繁殖更多的幼虫,而继承了亲代部分基因型的幼虫能够更好地适应这种选择压。值得注意的是,选择过程会对自然属性或生物属性产生影响,其结果是控制属性的基因被动地保留了下来。鼻子畸形可能只是某场落败拳赛的结果,也就是说,这可能和基因没有什么关系,但是如果仅根据鼻子对称性来判断比赛的结果,那么长着畸形鼻子的拳手就会被直接淘汰。即便从长远考虑这位拳手具备许多其他优势基因,例如关节韧性灵活或是能够忍受剧痛,然而由于这该死的鼻子拖累,那么所有这些基因也都会在竞争中走向灭绝。
简而言之,表型的背后就是基因型,它就像是一匹拉着马车的马。自然选择是日久岁深的谜题,它在找寻适应度的时候却阴错阳差地发现基因就具备这个功能。通过表型的筛选,能够产生适应度的基因逐渐在种群中壮大起来,从而让生物体愈发适应它们所处的环境。虽然自然环境令生物体在进化的道路上举步维艰,但是它们却造就了世间完美的绝配。因此这才是推动生命发生进化的引擎。
多布然斯基实验最终取得的辉煌解决了物种起源问题,而这也是达尔文曾潜心研究多年的“谜中之谜”。“纸箱中的加拉帕戈斯群岛”实验阐释了杂交生物种群(果蝇)随时间进化的机理。但是多布然斯基知道,即便让基因型变异的野生种群继续杂交下去,也永远不会形成新物种:毕竟,物种的基本定义就是不能进行种间杂交。
不过为了创造某个全新物种,必须采取某些措施来限制杂种繁殖。多布然斯基很想了解地理隔离是否也是影响因素。假设某个携带基因变异的生物种群可以进行杂种繁殖,可是突然间,这个种群因为某次地质裂缝的出现而被一分为二,或者某座岛屿上的鸟群被风暴席卷至另外一座相距遥远的岛屿,并且再也无法飞回原来栖息的地方。按照达尔文的理论,这两个种群将会分别独立完成进化,直到这两个地点中的某个基因变异体被选择出来,最后形成了生殖隔离。即便新鸟类物种能够飞回原来的岛屿(例如乘船),那么它们也不能与失联已久的远方亲戚进行交配了:由于上述两种鸟类的后代已经具有遗传不亲和性,因此这些错乱的遗传信息将禁止它们存活或是进行繁殖。地理隔离会引起遗传隔离,并最终导致生殖隔离。
此类物种形成机制并非源自主观臆测,多布然斯基可以通过实验来验证这个观点。他将两种地理位置相距遥远的果蝇混合后放入同一个笼子里,果蝇在此进行交配并且产下子代,但是幼虫成年后却无法生育。通过对进化过程进行连锁分析,遗传学家甚至可以查明导致子代不育基因的实际分布。其实这就是达尔文逻辑中缺失的联系:最终由遗传隔离导致生殖隔离,并且推动新物种起源。

到了20世纪30年代末期,多布然斯基开始意识到,他对于基因、变异和自然选择的理解已经远远超出了生物学的范畴。1917年,席卷俄国全境的革命试图抹去所有个体差异而优先发展集体属性。与之相反,另一种穷凶极恶的种族主义正在欧洲迅速蔓延,竭尽所能夸大个体差异甚至将其妖魔化。多布然斯基指出,这两种危机的理论基础均源自生物学领域。其中涉及个体的定义是什么?变异如何塑造我们的个性?评判物种“优越”的标准是什么?
如果上述事件发生在20世纪40年代,那么多布然斯基就可以直接驳斥这些观点了:他最终肯定会对纳粹优生学、苏联农业集体化以及欧洲种族主义做出严厉的科学批判。但是他在野生种群、变异与自然选择方面的研究成果已经为这些问题提供了重要的理论基础。
首先,遗传变异在自然界中很显然是种常态而不是例外。美国与欧洲的优生学家坚持利用人为选择来促进人类向“优越”发展,可是在自然条件下并不存在什么单纯的“优越”。不同种群的基因型大相径庭,而这些多种多样的遗传类型可以在野生条件下共同存在甚至重叠分布。自然界并不像人类优生学家想象的那样急于将遗传变异均质化。实际上,多布然斯基发现自然变异是生物体的某种重要储备,这种财富甚至比生物体自身的责任还重要。如果没有变异发生就不会存在丰富的遗传多样性,那么生物体可能终将彻底失去进化能力。
其次,突变只是变异的别名。多布然斯基在野生果蝇种群中发现,无论是ABC还是CBA品系果蝇,没有哪种基因型具有先天的优越性,它们都得依赖“环境”与“基因—环境”交互作用才能生存。某人产生的“突变”对于另一个人来说就是“遗传变异”。我们可以在某个寒冷的冬夜选出某种果蝇,而在某个炎热的夏日选出另外一种完全不同的果蝇。无论是从道德还是从生物学角度出发,变异都没有优越性可言,因此每种变异只是多少去适应某种特定的环境而已。
最后,生物体的物理或精神属性与遗传之间的关系要远比预期的复杂。高尔顿等优生学家曾希望筛选出复杂的人类表型(智力、身高、容貌以及品德),并据此作为某种生物捷径来富集与智力、身高、容貌和品德相关的基因。但是某种表型并非由单个基因按照一对一的方式来决定。而筛选表型的机制很难保证遗传选择的正确性。如果基因、环境、触发器与概率能够最终决定某个生物体的特征,同时优生学家在没有分清这些因素关联效应的前提下,就贸然打算借助传宗接代来改善智力或容貌,那么他们注定将一败涂地。
对于被滥用的遗传学与人类优生学而言,多布然斯基的每项发现都是针锋相对的反击。基因、表型、选择与进化等概念可以通过相对浅显的理论联系在一起,但是这些道理很容易为人误解或者蓄意歪曲。“追求简洁,保持理性。”英国数学家与哲学家怀特海(Alfred North Whitehead)曾这样告诫自己的学生。多布然斯基已经发现了这种简洁,但是他同时也对遗传逻辑过于简单化提出了强烈的道德警告。可惜他的观点都被湮没在教科书与学术论文中,就连那些集权国家的政治力量也没有重视这些远见卓识,而它们即将在操纵人类遗传的领域中兴风作浪。

第三章 转化

遗传学与进化论和解后被称作现代综合论,或者更广义地被称为广义综合论。即便遗传学家们已经理解了遗传、进化和自然选择之间的复杂关系,基因的物质本质仍是个未解之谜。基因一直被视为“遗传颗粒”,但是却无法从物理或者化学角度对于“颗粒”携带的信息进行描述。摩尔根将基因视为“细绳上的串珠”,其实连他自己也不清楚这种描述代表的确切物质形式。这些“串珠”由什么构成?而“细绳”的本质又是什么呢?

从某种程度上来说,由于生物学家对基因的化学结构一无所知,因此人们曾经认为基因的物质组成根本无法鉴别。在生物界中,基因通常按照垂直的方式进行遗传,也就是说,从父母到孩子,或者从母细胞到子细胞。然而变异垂直传播使得孟德尔与摩尔根能够通过分析遗传模式来研究基因的作用(例如,亲本果蝇可以将白眼性状传递给子代)。但是研究垂直转化的难题在于,基因从不会离开活的生物体与细胞。当某个细胞分裂时,它的遗传物质会在细胞内解离并且重新分配到子代细胞。在这个过程中,基因始终保持着生物学上的可见性,但是在细胞这个黑箱的遮盖下,我们很难理解基因的化学结构。
遗传物质很难从某个生物体传递到另一个生物体,在此并非指在亲代与子代间进行传递,而是指在两个完全不相关的陌生个体间传递。人们将这种水平基因交换称为转化。其实这个词释放出的信号足以令我们惊讶不已:人类已经习惯通过生殖来传递遗传信息,但是在转化过程中,某种生物体可以变成另外一种生物体,就像化身为月桂树的女神达芙妮(更准确地说,基因改变将使某种生物体的属性转化成另一种生物体的属性;如果从遗传学的角度来理解这个希腊神话,那么树枝生长基因必定通过某种方式进入了达芙妮的基因组,并且具备从人类皮肤下长出树皮、树干、木质部和韧皮部的能力)。
转化现象几乎不会发生在哺乳动物中。但是细菌这种苟活在生物世界边缘的物种却能够进行水平基因交换(为了便于理解这个抽象概念,我们可以假设有两位朋友在夜晚外出散步,他们其中一位是蓝眼睛而另外一位是棕眼睛,可是他们返回后却发现由于基因临时交换而导致眼睛颜色互换)。基因交换的瞬间确实非常奇特美妙。在两个生物体发生转化的瞬间,基因只是作为某种纯粹的化学物质而短暂存在。于是有一位化学家想要通过这个难得的机会来捕捉基因的化学本质。转化现象由英国细菌学家弗雷德里克·格里菲斯(Frederick Griffith)发现。
格里菲斯在不经意间完成的实验却成为推动分子生物学发展的革命。首先,他通过高温处理杀死具有毒性的光滑型肺炎球菌,然后将灭活的细菌注射到小鼠体内。结果与他预想的相同,这种细菌的残余物并不能对小鼠发挥作用:由于它们失去了活性,因此不会引起感染。但是当格里菲斯将有毒菌株的死菌与无毒菌株的活菌混合后,接种小鼠却很快死于肺炎。格里菲斯对这些小鼠进行解剖时发现,其体内的粗糙型肺炎球菌已经发生了变化:它们只是与死菌碎片发生了接触,就获得了光滑荚膜这种毒性决定因子。而这种曾经无害的细菌不知何故就“转化”成了有毒的细菌。
经过高温灭活的细菌碎片相当于微生物体内化学物质组成的温汤,那么它们是如何仅凭接触就将某种遗传性状传递给另外一种活菌的呢?格里菲斯对此百思不得其解。起初,他猜测活菌由于吞噬了死菌才导致荚膜出现改变,这就像在巫术仪式中进行的那样,以为吃掉猛士的心脏就能够拥有勇气或者活力。但是当转化完成之后细菌还可以将这种新获得的荚膜维持数代,而在此期间任何食物来源都应消耗殆尽。
那么最简单的解释就是,遗传信息是以某种化学形式在两种菌株之间进行传递的。在“转化”过程中,控制毒性的基因(也就是能产生光滑荚膜而不是粗糙荚膜的基因)以某种方式脱离了原来的菌株并且进入化学温汤中,然后又从温汤中进入活菌并且整合到其基因组内。换句话说,基因可以不借助任何生殖方式而在两个生物体之间传递。它们是携带信息的自主单位(即物质单位)。如果细胞之间需要进行窃窃私语的话,那么它们不用借助那些优雅的胚芽或芽球来传递信息。遗传信息不仅可以通过某种分子进行传递,同时这种物质还将在细胞外以某种化学形态存在,并且能够在细胞、生物体以及亲代与子代之间传递信息。
只要格里菲斯公布这个惊人的发现,那么整个生物界都将为之欢呼雀跃。在20世纪20年代,科学家们刚刚开始运用化学知识来理解生命的奥秘。生物学逐渐向化学靠拢。生物化学家认为细胞就像是装满化学物质的烧杯,细胞膜将这些混合物紧紧包裹,它们之间发生反应后创造出“生命”现象。格里菲斯证实,生物体之间存在某种可以携带遗传指令的化学物质,而这种“基因分子”足以引起学术界的强烈共鸣,并且将重建创造生命的化学理论。

尽管弗雷德里克·格里菲斯的实验充分证实了“基因就是一种化学物质”,但是其他科学家对于这种理念依然抱有疑虑。1920年,托马斯·摩尔根曾经的学生赫尔曼·穆勒从纽约搬到得克萨斯,他在这里继续从事果蝇遗传学的研究。穆勒的实验设计与摩尔根一样,他也希望通过突变体来解释遗传现象。虽然果蝇是遗传学家们的基础研究对象,但是在自然界中产生的突变体实在是凤毛麟角。摩尔根与他的学生们在纽约奋斗了30多年,花了九牛二虎之力才在大量的果蝇种群里发现了白眼与黑体突变。穆勒已经对寻找突变体感到厌烦,他很想知道如果将果蝇暴露在高温、强光或者高能的条件下,那么是否能够加速突变体的产生。穆勒的想法从理论上看似简单,但是从实操上来说却非常棘手。1926年冬季,他突发奇想将某批果蝇用更低剂量的射线照射。穆勒让这些经X射线照射过的雌雄果蝇进行交配,随后他开始观察奶瓶中果蝇幼虫的变化。然而即便是外行也会被穆勒的实验结果震撼:在这些新生果蝇中出现了各种各样的突变体,其数量从几十只到上百只不等。
穆勒因其在上述领域中的发现而享誉世界。辐射效果对果蝇突变率的影响表现为以下两点。首先,基因由物质组成。毕竟辐射也只是能量而已。弗雷德里克·格里菲斯已经证实基因可以在生物体之间移动,穆勒则在实验中用能量改变了基因。无论基因到底是什么,它应该具有可以移动与传递的特点,并且将在能量诱导下发生改变,当然这些特性通常都与化学物质有关。
相对于基因的化学组成来说,我们更容易了解整个基因组的延展性变化,同时科学家们对于X射线易如反掌改变基因的能力感到十分惊诧。即便是坚持自然突变理论的达尔文也会认为如此之高的突变率不可思议。在达尔文的理论中,某个生物体发生改变的速率相对固定,当自然选择的速率被放大时能够加速进化,而抑制自然选择的速率可以减缓进化。穆勒的实验证实了遗传可以被轻而易举地操纵:突变速率本身就瞬息万变。“自然界中没有永恒的现状。”穆勒不久后写道,“一切都处于调整或再调整的过程中,否则生物界最终将会走向灭亡。”如果将改变突变速率与筛选变异体相结合,穆勒认为他或许能够推动进化周期进入飞速发展的轨道,甚至在实验室里创造出全新的物种和亚种,而自己就是这些果蝇的上帝。
与此同时穆勒也意识到,他的实验对于人类优生学发展具有重大意义。假如使用这种微小剂量的辐射就可以改变果蝇基因,那么距离改变人类基因的时代还会远吗?他写道,假如我们能够“人工诱导”遗传变异,那么遗传学将不再是“命运之神摆布人类”的特权。

与许多同时代的科学家和社会科学家一样,穆勒自20世纪20年代起就被优生学深深吸引。当穆勒还在哥伦比亚大学攻读本科学位时,就曾创建生物学学会来探索和支持“积极优生学”。但到了20年代末期,穆勒见证了优生学在美国走向危险的边缘,因此也不得不重新审视自己的热情所在。当时美国优生学档案办公室主要致力于种族净化,并把清除移民、“异端”与“缺陷”作为工作重点,而这种露骨的邪恶行径也令他备受打击。那些所谓的优生运动倡导者达文波特、普里迪和贝尔不过是披着伪科学外衣的卑鄙小人。
就在穆勒憧憬着优生学的未来与改变人类基因组可能性的同时,他也在思索高尔顿及其合作者是否在基本概念上犯了错误。与高尔顿和皮尔森相同,穆勒也想要通过遗传学来减轻人类的痛苦。但是与高尔顿的不同之处在于,穆勒开始意识到,只有当社会处于完全平等的状态下时,积极优生学才能真正发挥作用。优生学不可能超越社会平等而实现。社会平等才是开展优生学的先决条件。如果没有社会平等作为保障,那么优生学将不可避免地误入歧途,尽管流浪、贫困、异端、酗酒以及智障等问题只是社会不公的体现,但是它们还是会被当成遗传病来看待。类似卡丽·巴克这样的女性并不是遗传性智障,她们出身贫寒、目不识丁、身患疾病且无力抗争,可还是被扣上遗传缺陷的帽子沦为社会的牺牲品。高尔顿学说认为优生学最终将产生彻底的平等(将弱者转化为强者),然而穆勒却完全否认了这种臆测。他认为,如果不把平等作为前提条件,那么优生学就会沦为强者控制弱者的一种工具。
当赫尔曼·穆勒在得克萨斯开展的科研工作如日中天之时,他的个人生活却一落千丈。此外穆勒也因为政治倾向而不胜其扰。尽管穆勒企图自杀的举动没有成功,但这却是他身体每况愈下的先兆。无论是肮脏的科学与丑陋的政治,还是整个自私的社会,穆勒对于美国已经感到厌倦。他想要逃到某个能让科学与社会主义融合发展的地方去,只有完全平等的社会才能够从根本上对基因进行干预。他知道在德国首都柏林,以自由民主为目标的社会主义正雄心勃勃地卸下历史的包袱,在20世纪30年代的欧洲创建崭新的共和国。马克·吐温曾写道,这里是世界上“最年轻的城市”,来自四面八方的科学家、作家、哲学家与知识分子齐聚一堂,他们在努力缔造自由的未来社会。穆勒认为,如果想要发挥遗传学这门现代科学的全部潜能,那么最合适的地方恐怕非柏林莫属。

第四章 没有生存价值的生命

生物学家弗里茨·楞次(Fritz Lenz)曾说过,纳粹主义不过是某种“应用生物学”。1933年春季,当赫尔曼·穆勒开始在柏林的凯泽·威廉研究所工作时,他目睹了纳粹将“应用生物学”付诸行动。按照纳粹主义的理解,“应用生物学”实际上是应用遗传学,它的目的就是让“种族卫生”成为可能。
普罗兹与波尔将高尔顿、普里迪和达文波特等英美两国优生学家视为这门新兴“学科”的先驱。他们认为,弗吉尼亚州立癫痫与智障收容所就是一项理想的遗传净化实验。德国大学通常会提供几个“种族生物学”和种族卫生学的教授职位,就连医学院也会常规教授种族科学。“种族科学”的理论策源地就在凯泽·威廉研究所的人类学及人类遗传与优生中心,这里距离穆勒在柏林的新实验室仅有咫尺之遥。
与普罗兹一样,希特勒也相信遗传缺陷将会缓慢毒害整个民族,同时阻碍这个泱泱大国的复兴。当纳粹党于20世纪30年代掌权后,希特勒看到了将这种想法付诸实践的机会。为了争取民众对绝育法的支持,纳粹政府借助各种法律禁令来协助推广,并且最终将这种手段发挥到极致。就在国家机器大肆造势鼓吹并强迫人们被动接受优生绝育的同时,纳粹政府也在法律的掩护下不断逼近种族净化的底线。
绝育在悄然无息中彻底变成了杀人机器。早在1935年,希特勒就曾私下仔细考虑过将基因净化工作从绝育升级至安乐死,就净化基因库这项工程而言,还有什么比从肉体上消灭他们更快捷的方式吗?为了赋予这种灭绝措施合法的身份,纳粹政府开始委婉地将受害者描述成“没有生存价值的生命”(lebensunwertes Leben)。这个离奇短语反映出纳粹优生学逻辑正变得愈加恐怖:对遗传缺陷携带者实施绝育已不足以让未来的国家得到净化,必须把他们从现有的体制内彻底清除。这就是遗传学上的最终解决方案。此后德国各地相继建立起灭绝中心。
最终,纳粹政府净化“遗传病”的计划演变为一场更大灾难的序曲。这场人类历史上最恐怖的浩劫与之前的灭绝(针对失聪、失明、失语、跛足、残疾以及智障人员)行动不可同日而语。在大屠杀期间,有600万犹太人、20万吉卜赛人、几百万苏联和波兰公民还有不计其数的同性恋者、知识分子、作家、艺术家以及持不同政见者在集中营与毒气室中惨遭杀害。此类令人发指的暴行与早期的灭绝计划本质上一脉相承,纳粹主义正是在野蛮优生学的“幼儿园”里学会了这些卑鄙伎俩。“种族灭绝”(genocide)这个单词的词根与基因“gene”同源,我们有充分的理由说明:纳粹主义盗用了基因与遗传学的名义为延续其罪恶进行宣传与辩解,同时还驾轻就熟地将遗传歧视整合到种族灭绝的行动中。从肉体上消灭精神病与残疾人(“他们的思维或行为不能和我们保持一致”)的行为只是大规模屠杀犹太人之前的热身运动。基因就这样史无前例地在悄无声息中与身份混为一谈,然后这些带有缺陷的身份被纳粹主义利用,并且成为他们实施种族灭绝的借口。

20世纪30年代,就在纳粹政府不断歪曲遗传学事实来支撑国家主导的绝育和灭绝行动时,另一个强大的欧洲国家正在以完全相反的方式蓄意践踏遗传学与基因理论来维护其政治纲领。20世纪30年代,纳粹政府将遗传学视为种族净化的工具,而那时苏联的左翼科学家与知识分子提出遗传并非与生俱来,资产阶级为了强调个人差异的固定性,于是就创造出了基因这个海市蜃楼,而事实上,特征、身份、选择或是命运都无法消除。即使国家需要净化,也不该采用遗传选择的方式,政府应当对全体人民进行再教育并且抹去从前的自我。需要净化的是大脑而不是基因。
与纳粹主义相同,苏维埃主义也需要“科学”的巩固与支撑。1928年,农业研究人员特罗菲姆·李森科表情凝重地宣称,他在动植物中发现了“粉碎”并改变遗传影响的方法,而某位记者曾经形容他“令人作呕”。通过对小麦植株采取“休克疗法”,李森科认为他可以让植株在春季开花,在夏季结穗。
然而这种“休克疗法”显然与遗传学事实背道而驰。将小麦置于寒冷或干旱的条件下不可能使基因产生永久且可遗传的变异,这就好比连续切除鼠尾也无法创造出无尾老鼠,或者无论怎样牵引羚羊颈部也不能将其变成长颈鹿。为了改变实验植株的性状,李森科也在想方设法获得抗冻基因变异体(摩尔根和穆勒),然后采用自然选择或人工选择来分离突变植株(根据达尔文的理论),最后再将突变植株进行杂交使突变固定下来(孟德尔和德·弗里斯)。但是李森科让自己与苏联领导人都相信,他只需要改变暴露条件就可以对植株进行“再培养”,从而改变它们的固有特征。他完全否定了基因的概念。他认为,基因是“由遗传学家创造出来”支持“腐朽资产阶级”科学的产物。“遗传基础跟某些具有自我复制能力的特殊物质没有关系。”通过适应环境直接导致遗传发生改变只是对于拉马克陈旧理论的复述,然而直到几十年以后,遗传学家才指出了拉马克学说的概念性错误。
李森科的理论立即受到苏联政府的热烈欢迎。在这个当时挣扎在饥荒边缘的国家中,他提出了能够显著增加农业产量的新方法:通过对小麦和水稻进行“再培养”后,农作物就可以在包括严冬和酷暑的任何条件下生长。也许是受到这项举足轻重理论的启发,斯大林和他的同僚们发现,使用休克疗法“粉碎”基因进行“再培养”同样可以应用在意识形态领域。当李森科通过再培养植物来减轻它们对土壤和气候的依赖时,苏联的党务工作者也在对持不同政见者进行再教育,试图改变他们对错误意识和物质商品根深蒂固的依赖。纳粹政府相信遗传物质绝对不会改变(“犹太人就是犹太人”),并且使用优生学来改变他们国家的人口结构。苏联政府则相信遗传物质绝对可以重置(“任何人都可以成为其他人”),并且希望通过清除所有差异来实现激进的集体利益。1940年,李森科在击败了竞争对手后出任苏联植物遗传育种研究所所长,然后在苏联生物界建立起极权主义的领地。
纳粹主义与李森科主义的理论基础源自两种截然相反的遗传概念,但是这两种理论之间也具有惊人的相似性。尽管纳粹理论的残暴性无人企及,但是纳粹主义与李森科主义实质上是一丘之貉:它们都采用了某种遗传学理论来构建人类身份的概念,而这些歪理邪说最后都沦为满足政治意图的工具。这两种遗传学理论可谓是大相径庭,其中纳粹政府坚信身份具有固定性,而苏联政府认为身份具有强大的可塑性。由于基因与遗传的概念一直处于国家地位和政治进程的核心,因此纳粹政府坚持遗传无法改变的理念,苏联政府笃信遗传可以被彻底清除。在这两种意识形态里,遭到蓄意歪曲的科学被用来支持国家主导的“净化”机制。通过偷换基因与遗传学概念,整个系统的权力与地位得到了证实与巩固。到了20世纪中叶,无论基因学说被接受与否,它已经成为某种潜在的政治与文化工具,并且跻身历史上最危险的思想之一。

垃圾科学支撑起极权主义,而极权主义又制造出垃圾科学。那么纳粹遗传学家在遗传学领域做出过何种贡献吗?
在这些数量众多的科学垃圾里,有两项贡献显得格外突出。首先体现在方法论上:尽管纳粹科学家的手段野蛮残酷,但是他们事实上提高了“双胞胎研究”的水平。弗朗西斯·高尔顿自19世纪90年代起就开始从事双胞胎的研究工作。高尔顿创造了“先天与后天”这句名言,并且非常好奇科学家如何区别两者之间的作用。对于某些特殊性状而言,例如身高或者智力,我们如何判定它们是来自先天还是后天呢?人们该如何分清遗传与环境之间的关系呢?
高尔顿认为借助某种自然实验可以回答上述问题。他推断,既然双胞胎的遗传物质完全相同,并且任何相似之处都得益于基因的作用,那么所有差异就是来自环境的结果。在双胞胎研究中,通过比较与对比他们的相同与不同之处,遗传学家就能确定先天与后天因素对重要性状的精准贡献。
虽然高尔顿考虑问题的方向完全正确,但是这种推理却存在一个重要的缺陷:他没有把基因完全相同的同卵双胞胎与基因不同的异卵双胞胎进行区分(同卵双胞胎源自单个受精卵分裂,因此双胞胎具有完全相同的基因组;异卵双胞胎则源自两个同时受精的卵细胞,双胞胎的基因组并不相同)。由于这种概念上的混淆,因此早期双胞胎研究经常失败。赫尔曼·沃纳·西门子(Hermann Werner Siemens)既是德国优生学家也是纳粹主义的支持者,他于1924年提出了双胞胎实验的解决方案,为了实现高尔顿的设想,必须对同卵双胞胎与异卵双胞胎进行严格的区分。
作为一名训练有素的皮肤科专家,西门子曾经在求学期间得到普罗兹的指点,而且他还是种族卫生概念早期的坚定支持者。西门子继承了普罗兹的观点,他意识到只有首先构建遗传模型才能为遗传净化找到理论依据:如果能证明盲人的失明可以遗传,那么就可以合法对其实施绝育。由于血友病的性状一目了然,因此根本不需要进行双胞胎实验就可以证明其遗传性。但是对于更为复杂的性状来说,例如智力或心理疾病,构建遗传学模型的任务也变得错综复杂起来。为了减少遗传因素与环境因素的影响,西门子提出应该将异卵双胞胎与同卵双胞胎进行比较。遗传学研究中的关键实验必须保持一致性(concordance)。所谓“一致性”是指双胞胎共同拥有某个性状的比例。如果双胞胎的眼睛颜色100%相同,那么他们之间的一致性为1;如果只有50%相同,那么一致性就是0.5。一致性是测量基因影响性状程度的便捷手段。如果同卵双胞胎对精神分裂症具有高度一致性,而出生与生长环境相同的异卵双胞胎一致性却很低,那么这种疾病的根源必定与遗传有关。
对于纳粹遗传学家来说,这些早期研究为后来进行的极端实验奠定了基础。门格勒在遗传学和医学研究中表现出病态般的狂热,他后来擢升为奥斯威辛集中营的总医官,并且在此对双胞胎进行了惨绝人寰的实验。
除了上述那些荒谬的人体实验,门格勒的研究质量基本上就是敷衍了事。他在对成百上千的受害者进行实验后,手头却只有一本表皮破旧且内容泛泛的笔记本,其中没有留下任何有价值的研究结果。这些内容凌乱的笔记被保存于奥斯威辛纪念馆,某位研究人员在仔细阅读其内容后总结道:“没有科学家会重视(这些)内容。”事实上,无论双胞胎实验在德国取得了怎样的早期成果,门格勒的卑鄙行径都彻底毁掉了此类研究,人们对于该领域的仇恨刻骨铭心,而整个世界需要耗费几十年的时间才能重新面对这个话题。
纳粹对遗传学的第二项贡献绝对出乎意料。到了20世纪30年代中期,随着希特勒在德国走向政治巅峰,大批科学家在面临纳粹统治的威胁时选择离开这个国家。
纳粹德国的损失恰好促进了遗传学的发展。这些离开德国的科学家不仅自由来往于世界各地,同时还促进了不同学科之间的交流。当他们在异国他乡找到落脚点后,还是会继续聚焦在新课题的研究上。例如原子物理学家对于生物学领域非常感兴趣,而这正是科学探索尚未涉及的前沿地带。由于物质构成的基本单位已经不再是秘密,因此他们希望能够借此破解组成生命的物质单元。原子物理的核心就是执着地去寻找无法再简化的颗粒,然后再找到适合的通用机制并进行系统阐述,而其理念在不久以后将渗透到生物学领域,并推动这个学科迎接新方法与新问题的挑战。这种理念产生的深远影响需要用几十年的时间来感受:当物理学家与化学家的工作重点逐渐转移到生物学领域后,他们开始尝试通过分子、力学、结构、行为和反应等化学与物理术语来理解生物体。随着时间的推移,这些到新大陆定居的流亡者将重新绘制生物学的版图。
如果仅根据假设的理论基础来描述“基因分子”,那么生物学家或许对此并不感兴趣,但是物理学家怎么会拒绝在这个既新奇又冒险的领域尝试一番呢?1943年,量子理论学家埃尔温·薛定谔在都柏林表示,他想要大胆地尝试使用基础理论来描述基因的分子属性[本次讲座的内容后来收录于他的著作《生命是什么?》(What Is Life?)中]。薛定谔假设基因必定由某种特殊的化学物质组成,同时这种分子还具有自相矛盾的地方。它应该符合现有的化学规律,否则复制或者传递过程都无法实现,但是它在许多地方又不符合上述规律,否则无法解释遗传特征纷繁复杂的多样性。这种分子物质既能够携带大量信息,又可以在细胞内保持结构紧凑。
薛定谔设想出一种具有多种化学键的化学物质,它能够沿着“染色体丝”的长度伸展。也许正是这些化学键的序列组成了密码本,而“各式内容都可以被压缩成(某种)微型密码”。或许细绳上串珠的顺序就携带着神秘的生命密码。
这种传递信息的物质既有相似之处又保持各不相同,尽管组成顺序简单但是代表种类繁多。薛定谔试图想象出某种能够反映遗传学分歧与矛盾特征的化学物质,而这种分子可以让亚里士多德都感到心满意足。在薛定谔的脑海里,他仿佛已经预见到遗传物质DNA(脱氧核糖核酸)。

第五章 “愚蠢的分子”

1933年,当奥斯瓦尔德·埃弗里(Oswald Avery)55岁时,他才听说了弗雷德里克·格里菲斯进行的肺炎球菌转化实验。他确信格里菲斯在实验中必定犯了某些严重的错误。化学碎片怎么可能携带遗传信息在细胞间进行传递呢?格里菲斯的实验似乎让遗传学登上了通往未知领域的快车,然而埃弗里就是不肯迎合这股潮流。
格里菲斯的实验引起了科学家们对基因分子本质的广泛推测。到了20世纪40年代早期,生物化学家已经能够通过裂解细胞来了解其中的化学成分,并且在生物体中鉴定不同的分子物质,但是携带遗传密码的分子仍旧是个未解之谜。
人们已知染色质(承载基因的生物结构)由蛋白质与核酸这两种化学物质组成。虽然没有人知道或者了解染色质的化学结构,但是对于这两种“紧密结合”的化学成分而言,生物学家较为熟悉的蛋白质似乎具有更为丰富多彩的功能,当然它也更容易被认为是基因的携带者。蛋白质在细胞内参与执行许多重要任务。与此同时,细胞需要依赖化学反应才能生存下去,例如,在呼吸作用中,糖类与氧在经过化学结合后产生二氧化碳和能量。然而这些化学反应并不会随时随地发生(如果出现此类情况,那么我们的身体就会不时散发出糖类烧焦的味道)。蛋白质可以诱导调控细胞中此类基础化学反应,它们可以让化学反应加速或者减缓,并且使其节奏与生物体新陈代谢相匹配。生命或许就是化学反应的过程,但是它必定是某种特殊环境下的产物。生物体并不依赖于那些司空见惯的反应,只有某些独一无二的过程才能主宰其命运。反应过多将会持续消耗人体能量,而反应过少则会让我们走向衰竭死亡。蛋白质可以完成这一近乎不可能的任务,并且使我们在混乱的化学反应(熵)中得以生存,就像人们钟爱的滑雪运动总是追求险中求胜。
除此之外,蛋白质还是组成发丝、指甲、软骨以及支持与固定细胞基质的基本构件。当蛋白质构象发生改变后,它们还可以形成受体、激素以及信号分子,并借此打通细胞彼此之间的联络。几乎每项细胞功能(代谢、呼吸、分裂、自卫、废物排泄、分泌、信号传导、生长甚至是细胞死亡)都需要蛋白质参与执行。它们简直就是生化世界里辛勤的小蜜蜂。
与蛋白质相比,核酸是生化世界里的黑马。1869年,就在孟德尔的文章在布尔诺自然科学协会宣读4年之后,瑞士生物化学家弗里德里希·米舍(Friedrich Miescher)在细胞中发现了这种新型生化分子。到了20世纪20年代早期,生物化学家对于核酸的结构有了进一步了解。核酸由DNA与RNA(核糖核酸)这对分子“表兄弟”组成。二者的长链中包含有四种碱基,它们沿着细绳般的分子链或者骨架排列。四种碱基向骨架外侧凸起,就像是藤蔓上钻出的绿叶。在DNA中,这四片“叶子”(或者碱基)分别是腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)。而在RNA中,胸腺嘧啶被替换成了尿嘧啶(U),所以其组成为A、C、G、U四种碱基。然而除了这些基本细节以外,人们对于DNA与RNA的结构和功能一无所知。
生物化学家菲伯斯·莱文(Phoebus Levene)是埃弗里在洛克菲勒大学的同事,他认为DNA的化学组成有点滑稽,四种碱基沿长链分布意味着它是一种极其“平庸”的结构。莱文推测,DNA应该是由结构单一的聚合物长链组成的。根据莱文的设想,四种碱基将以某种固定的顺序重复出现:就像AGCT—AGCT—AGCT—AGCT一样令人感到乏味。这种序列好似某种化学物质的传送带,它具有重复、节律、稳定与简朴的特点,相当于生物化学界中经久耐用的尼龙。因此莱文将其称作“愚蠢的分子”。
即便只是走马观花地看一眼莱文提出的DNA结构,学者们也足以认定它不能作为遗传信息的携带者。愚蠢的分子不可能携带精准的消息。而DNA千篇一律的结构与薛定谔想象中的化学物质截然不同,它枯燥乏味的分子结构不仅毫无特色,甚至有过之而无不及。相比之下,蛋白质具有灵活多样的特点,它可以像变色龙一样改变构象,并且执行各种各样的功能,因此将其作为基因携带者显然更具有吸引力。如果染色质像摩尔根指出的那样呈串珠样排列,那么蛋白质应该是其中的活性组分(蛋白质好似串珠,而DNA就像细绳)。正如某位生化学家所言,染色体上的核酸只是“分子结构的支持物”,也可以说是凸显基因地位的分子骨架。蛋白质才是真正携带遗传信息的物质,而DNA不过是核酸间隙的填充物罢了。1940年春季,埃弗里对于格里菲斯实验中的关键结果进行了确认。他们采用了多种方法来验证转化因子的化学成分。虽然这些用心良苦的实验让他们精疲力竭,但是结果与预期相去甚远。无论其化学成分究竟是什么,转化因子的组成应该与糖类、脂质或者蛋白质无关。
那么转化因子到底是何方神圣呢?它能够经受冻融的考验,乙醇可以促进其发生沉淀。他们发现RNA消化酶并不能影响转化因子的活性,而只有采用DNA降解酶来消化上述物质才能消除转化作用。埃弗里、麦克劳德与麦卡蒂又进行了一系列实验,他们分别用紫外线、化学分析以及化学电泳的方法来检测转化因子。无论他们采取何种方法,实验结果都非常明确:这种具有转化功能的物质就是DNA。后来某位研究人员曾这样描述,埃弗里发现了“基因的物质实体”,也就是解决了“基因到底源自何方”的问题。

或许这是纳粹对于遗传学发展做出的最后一点贡献:它为优生学盖上了奇耻大辱的烙印。纳粹优生学暴行成为一部现实版的反面教材,而人们也开始对某些教唆势力重新进行了全面审视。在世界范围内,各个国家的优生学计划悄然终止。

第六章 DNA双螺旋

奥斯瓦尔德·埃弗里的实验实现了另外一种“转化”。在所有生物分子中,DNA曾经只是个无足轻重的角色,然而现在终于轮到它闪亮登场。20世纪50年代,随着其他实验室的研究结果相继问世,就连最顽固的怀疑论者也不得不转为DNA的信徒。

莫里斯·威尔金斯是一位年轻的新西兰物理学家,他是早期皈依DNA信仰的科学家之一。作为乡村医生的儿子,威尔金斯曾于20世纪30年代在剑桥大学攻读物理学。其实还有一位重量级的科学家也来自遥远的新西兰,他就是颠覆20世纪物理学的欧内斯特·卢瑟福(Ernest Rutherford)。1895年,这位年轻人在奖学金的资助下进入剑桥大学,他从此踏上了揭开原子物理学奥秘的道路。卢瑟福在实验研究中展现出无与伦比的才华,他根据结果推导出放射性的特点,搭建出一个令人信服的原子概念模型,然后还将原子拆分成亚原子粒子,并且开辟出亚原子物理学这个新领域。1919年,卢瑟福成为第一位实现中世纪关于化学嬗变梦想的科学家:他使用放射性α粒子轰击氮原子并将其转化为氧原子。卢瑟福证实化学元素并不是构成物质的基本单位。就像作为物质基本单位的原子也是由电子、质子与中子等更基本的物质单位组成。
威尔金斯追随卢瑟福的方向开始研究原子物理学与放射线。威尔金斯推断,基因作为遗传的基本单位必然是由亚单位组成,而DNA的结构则可以解释这些亚单位的功能。
生物物理学是学科发展进入新时代的标志,而这个奇特的称谓由生物学与物理学组成。19世纪学术界的观点认为,活细胞不过是相互关联的化学反应的产物,并由此诞生了生物化学(融合了生物学与化学)这门重要的学科。化学家保罗·埃利希(Paul Ehrlich)曾经说过:“生命……就是个化学反应过程。”他将细胞裂解后释放的“活化学物质”按照组别与功能分类。其中糖源提供能量,脂肪储存能量。由于蛋白质不仅能够进行化学反应,同时还可以调控生化过程的节奏,因此起到生物界交换机的作用。
但是蛋白质是如何调控生理反应的呢?血红蛋白在含氧量较高的环境里会与氧分子结合,而当其运动到含氧量较低的环境后会释放氧分子。这种属性能够让血红蛋白将氧气从肺部转运至心脏和大脑。但是血红蛋白需要具备什么特点才能让它成为高效的分子摆渡车呢?其实答案就在血红蛋白的分子结构里。通过控制铁离子和氧分子的结合与释放(血液的周期性氧化与还原),血红蛋白可以为机体组织提供充足的氧气。
血红蛋白的结构造就了其独特的功能。分子的物理结构决定其化学性质,化学性质决定其生理功能,而生理功能最终决定其生物活性。生物体复杂的功能可以按照以下逻辑来理解:物理结构决定化学反应,化学反应决定生理功能。对于薛定谔提出的“生命是什么”,生物化学家可能会这样回答:“生命由化学物质组成。”而生物物理学家还会补充道:“如果化学物质不以分子形式存在,那么生命又会是什么?”
生理学是形态与功能的精妙匹配,其具体过程发生于分子作用过程中,而对于生理学的描述则可以追溯到亚里士多德时代。在亚里士多德眼中,生物体不过是由某些精致原件组装的机器。生物学从中世纪开始逐渐摆脱了传统理论的影响,当时的学术界认为神奇法力与魔幻之水是决定生命的要素,而生物学家则使用天外救星(deus ex machina)来解释生物体的神秘功能(对于神的存在进行辩护)。生物物理学家打算在生物学研究中重启教条的机械论描述。他们认为应该根据物理学概念来解释生理活动,例如力、运动、行为、动力、引擎、杠杆、滑轮以及搭扣。牛顿发现的万有引力定律同样适用于苹果树的生长。人们没有必要援引神奇法力或者杜撰魔幻之水来解释生命现象。生物学的基础是物理学。天外救星其实就近在眼前。
在伦敦国王学院期间,威尔金斯的主攻方向就是破解DNA的三维结构。他推断,如果DNA确实是基因的载体,那么其结构理应体现基因的特征。严酷的进化过程使长颈鹿的颈部拉长,并且让血红蛋白的四臂搭扣结构趋于完美,根据同样的原理,DNA的构象也应该与其功能相匹配。而这种携带基因的分子必定与众不同。
为了破译DNA结构,威尔金斯决定采用某些源自剑桥大学的生物物理学手段,其中就包括晶体学与X射线衍射技术。为了对晶体学有个初步了解,我们可以在脑海中试着想象出一个微小的立方体。尽管上述立方体既“看不见”也摸不到,但是它却具备影子这种所有物质实体的共性。假设我们记录下光线从不同角度照射在立方体上留下的影子,那么立方体正对光源时投射出的阴影为正方形,斜对光源时形成的阴影为钻石状,而再次移动光源时阴影将变成梯形。虽然这项工作耗时费力,就像要从上百方的剪影中还原出某张面部的轮廓,但是该方法的确行之有效:只要通过逐个拼接就可以把二维图像变为三维立体结构。
X射线衍射技术的原理与之类似,当X射线投射到晶体上发生散射时就会留下“影子”,而为了洞悉分子世界的内在结构并产生散射现象,我们就需要X射线这种具有强大穿透力的光源。但是这项技术还存在一个小问题:分子在不停运动中难以捕捉成像。而有一种方法可以巧妙地解决该问题,那就是让分子从液态转化为晶态,然后原子就会固定在某个位置。既然发现了影子成像的规律,那么这些晶格就可以产生有序可读的剪影。物理学家通过X射线照射晶体就能破译其三维空间结构。
当然威尔金斯也希望能借助这项技术来测定DNA的结构。使用X射线照射DNA的过程简单明了并且无须专业知识。威尔金斯已经备齐了实验所需的全部关键材料。他现在面临的主要挑战是如何让DNA静止不动。
20世纪50年代早期,正当威尔金斯紧锣密鼓地开展工作时,一位不速之客的到来打破了这种平静。1950年冬季,作为伦敦国王学院生物物理系主任,J. T.兰达尔(J. T. Randall)新招募了一位从事晶体学研究的年轻科学家。这位新人名叫罗莎琳德·富兰克林,她刚刚在巴黎完成了煤晶体方面的研究。
DNA图像中模糊的静态画面让富兰克林感到十分困惑。但没过多久,她就在不经意中发现了答案。DNA在纯态时以两种形式存在。在潮湿状态下,DNA会表现为B型晶体结构;在干燥状态下,DNA将转换为A型晶体结构。当样品池湿度降低时,DNA分子体积会发生舒缩,仿佛可以透过这种呼吸换气看到生命的节律。由于DNA两种结构之间的转换对于实验结果产生了部分干扰,因此这也是威尔金斯一直在努力克服的障碍。富兰克林设计了一个精巧的装置,可以通过电解食盐水产生氢气泡来调节样品池的湿度。随着样品池内湿度增加,这些纤维似乎永久性地处于松弛状态。她终于获得了成功。在接下来的几周内,富兰克林拍摄了许多前所未有的高清晰照片,后来被晶体学家J. D.贝尔纳(J. D. Bernal)称为“有史以来最迷人的X射线照片”。
1951年春季,莫里斯·威尔金斯在那不勒斯动物所参加了一场学术会议,而波弗利与摩尔根曾在这里的实验室研究过海胆。在那天早上的听众中,有一位威尔金斯从来没有听说过的生物学家,这位叫作詹姆斯·沃森的年轻人神采奕奕且能言善道。沃森也非常崇拜薛定谔的名著《生命是什么?》。当时沃森正在哥本哈根从事核酸化学领域的研究,而他后来将其描述为“失败透顶”,可是威尔金斯的DNA衍射照片却令他为之一振。
沃森为了拍摄DNA衍射照片搬到了剑桥。就在来到剑桥的那一天,他再次遇到了志同道合的伙伴。这位名叫弗朗西斯·克里克的学者恰巧也在佩鲁茨实验室工作。克里克同样拜读过薛定谔的《生命是什么?》,而“这本小册子引发的一场革命”彻底震撼了生物学领域。
沃森与克里克仿佛就是两条互补的核酸长链,虽然他们性格里有玩世不恭的狂傲,但是却无法遮掩两位学者卓越的才华。假如可以找到某位令他们敬畏的科学家,那么恐怕非莱纳斯·鲍林莫属。具有传奇色彩的鲍林是加州理工学院的一位化学家,他刚刚宣布自己解决了蛋白质结构测定中某个重要的难题。1951年4月,鲍林发表了关于蛋白质螺旋结构的学术论文。这篇文章中密布着各种方程与数据,即便是专家学者也会感到论文晦涩难懂。尽管鲍林将关键的研究方法隐藏在数字迷雾中,但是克里克对于那些复杂的数学公式了如指掌。克里克告诉沃森,实际上鲍林的模型“只是根据常识判断的产物,并非复杂数学推理的结果”,他丰富的想象力才是重中之重。“鲍林有时会使用方程来支持论点,其实在大多数情况下可以用文字描述代替……人们无法从X射线衍射照片中辨别出α—螺旋结构,现在关键步骤是要确定原子之间的排列顺序。就像学龄前儿童的玩具一样,我们要用分子模型取代纸笔来完成这个过程。”
在鲍林工作的启发下,沃森与克里克在科学理念上发生了质的飞跃。那么DNA的结构能否通过鲍林的“诀窍”来测定呢?克里克认为,X射线衍射照片固然有助于解开DNA结构的奥秘,然而试图通过实验技术来确定生物分子结构则纯属徒劳。
就在50英里之外的伦敦国王学院,富兰克林对于用玩具构建DNA模型的想法嗤之以鼻。她执着地专注于自己的实验研究,并且拍摄了许多愈发清晰的DNA衍射照片。富兰克林坚信结果就在其中,完全没有必要再进行猜测。她认为实验数据是构建模型的前提,而其他方法都是旁门左道。
1951年11月21日,富兰克林在国王学院做了一次演讲。她在笔记中写道:“几条核酸链组成了一种大螺旋结构,其中磷酸位于螺旋外侧。”她似乎已经隐约看到了精美绝伦的DNA骨架结构。然而富兰克林只给出了某些粗糙的测算结果,她对于这种结构的细节未能做出任何解释。随后,盛气凌人的富兰克林就草草结束了这场枯燥的学术研讨会。在沃森的学术生涯中,这是他参加过的最重要的研讨会之一,可是他居然没有做笔记。尽管如此,克里克还是理解了富兰克林的基本设想,然后他们匆忙赶回剑桥开始搭建DNA模型。
单股DNA由糖基和磷酸骨架以及与之相连的四种碱基(A、T、G、C)构成,这些碱基看起来就像是某条拉链上突起的链牙。为了测定DNA结构,沃森与克里克首先要计算出每个DNA分子中拉链结构的数量,其中哪些组分位于螺旋内侧,而哪些组分又位于螺旋外侧。这个问题看起来并不难,可是想要构建一个简单明了的DNA模型却谈何容易。与理想中的DNA结构相比,该模型还算不上完美。沃森与克里克意识到,他们在下一步研究中需要借鉴富兰克林的定量检测方法。于是这两人突发奇想,主动邀请威尔金斯与富兰克林前来实验室参观,而后来他们对此决定追悔莫及。这次由沃森与克里克主动邀请的参观反倒变成了对他们的批判。
与此同时,莱纳斯·鲍林正在帕萨迪纳的实验室试图揭开DNA结构的奥秘。沃森与克里克对此忧心忡忡,他们担心某天早上醒来,某份8月出版的学术期刊已经发表了DNA结构测定结果,但是署名作者是鲍林,而非他们自己。1953年1月的第一个星期,他们一直担心的噩梦似乎就要成真:鲍林与科里撰写了一篇有关DNA结构的文章,并且将优先出版的副本提供给剑桥大学。沃森觉得“一切都完了”。他疯狂地把这篇文章从头到尾通读一遍,然后找到了文中具有关键意义的DNA结构图。但是当沃森凝神观察的时候,他立刻意识到“这个结构有问题”。鲍林的实验没能实现一鸣惊人,但是他构建的模型却能导致分子大爆炸。沃森兴高采烈地告诉了克里克,然后两个人来到他们最喜欢的老鹰酒吧,幸灾乐祸地用威士忌来庆祝鲍林的失败。
1953年1月底,沃森来到伦敦拜访威尔金斯,并且顺便也到实验室看望了富兰克林。威尔金斯告诉沃森,罗莎琳德·富兰克林在去年夏季已经获得了一组全新的B型DNA照片,这些照片的清晰程度令人难以置信,DNA骨架的基本结构几乎跃然纸上。威尔金斯走到隔壁房间,他从抽屉里取出这张关键的照片,然后将它展示给沃森。与此同时,富兰克林还待在办公室里,心中燃烧着愤怒的火焰。她并不知道自己最珍贵的数据刚刚被威尔金斯透露给了沃森。沃森立刻就为眼前的照片所震撼。当沃森回到剑桥后,他兴奋地从学院的后门一跃而入,他确信DNA结构由两条相互缠绕的螺旋链组成:这种“重要的生物分子成对出现”。
第二天早晨,沃森与克里克冲到实验室满怀热情地开始搭建模型,整个过程严格遵循遗传学与生物化学的原理来进行。他们在有条不紊开展工作的同时尽量做到精益求精,并且在模型结构内部为关键的水分子留下了足够空间。如果他们想要赢得这场竞赛,那么智慧与直觉都不可或缺;只有具备这些条件,他们才能实现心中的梦想。
某位落寞的化学家曾提出,DNA的碱基之间必定存在某种联系。欧文·查加夫(Erwin Chargaff)是一位出生于奥地利的生物化学家。1950年,他在纽约哥伦比亚大学工作期间发现了某种独特的化学现象。每当查加夫消化DNA并对碱基组成进行分析时,他总能发现A与T所占比例几乎相同,而G与C的比例也十分相近。某种神秘的力量让A与T以及G与C出双入对,好像这些碱基天生就相互绑定在一起。然而尽管沃森与克里克了解查加夫法则,但是他们并不知道如何将其用于构建DNA结构模型。
当碱基在螺旋内部的配对问题解决后,他们又面临着第二个关键问题,也就是如何对于DNA骨架的外部尺寸进行精确测算。这关乎模型中各组分的布局问题,并且明显受到DNA结构空间维度的限制。而富兰克林的数据又一次在她不知情的情况下发挥了重大作用。1952年冬季,巡视委员会受命前往国王学院审查工作。威尔金斯与富兰克林准备了一份关于DNA研究最新进展的工作报告,其中就包括许多已经完成的初步测算结果。马克斯·佩鲁茨是该委员会的成员之一,他得到了一份报告副本并将其转交给沃森与克里克。虽然该报告没有明确标注为“机密”,但是显然不能供他人随意借阅,尤其是那些富兰克林的竞争对手。
就在1953年2月28日的清晨,正当沃森忙着摆弄着用纸板制作的碱基模型时,他开始怀疑螺旋内部相互配对的碱基彼此是否相同。如果其中的规律是A与T配对或C与G配对呢?“我突然间意识到,腺嘌呤与胸腺嘧啶形成的碱基对(A→T)在形状上与鸟嘌呤与胞嘧啶形成的碱基对(G→C)相同……由于这两种碱基对形状一致,因此无须对此进行额外修饰。”
沃森现在意识到,碱基对可以轻而易举地彼此堆叠在一起,然后它们会朝向螺旋结构的中央。如果此时再回顾查加夫法则,那么其重要性不言而喻,鉴于A与T以及G与C彼此互补,因此它们必须以相同数量出现,看上去就像是拉链上相互咬合的链牙。此事再次提醒我们,最重要的生物分子必须成对出现。沃森根本等不到克里克走进办公室。“弗朗西斯刚一出现,他甚至还没来得及跨入大门,我就迫不及待地告诉他,答案已经尽在我们掌握中。”
克里克只扫了一眼就对这种碱基配对模式深信不疑。尽管该模型的具体细节还有待进一步完善,A∶T与G∶C碱基对在螺旋骨架内的位置仍需明确,但这无疑是一项重大突破。该方案设计非常完美,几乎找不到任何瑕疵。沃森回忆道,克里克“冲进老鹰酒吧,逢人便拉过来附耳低言,然后告诉对方我们发现了生命的奥秘”。
DNA双螺旋结构是一个标志性的象征,它与毕达哥拉斯三角形、拉斯科洞穴壁画、吉萨金字塔以及从外太空俯瞰人类居住的蓝色弹珠图像有异曲同工之妙,并且将永久铭刻在人类历史与记忆中。

图片发自简书App

DNA双螺旋结构示意图:单螺旋结构(左)以及成对的双螺旋结构(右)。注意碱基互补配对原则:A与T配对,G与C配对。盘绕DNA“骨架”由糖基—磷酸链组成。

两股DNA链缠绕在一起构成了双螺旋结构。“右手螺旋”是最为常见的DNA构象,就像向右旋转的螺丝钉一样扭转延伸。在双螺旋模型中,每条DNA链均是由A、T、G、C构成的长“碱基”序列。而糖基—磷酸骨架把这些碱基串联起来。该骨架向外侧扭曲变形成为螺旋状结构,同时那些附着在内侧的碱基就像是旋转楼梯的踏板。两条链上的碱基相互对应:A与T配对,G与C配对。从互补的角度来说,两条链包含相同的信息:每条链都是对方的“倒影”,或者是彼此的回声(更贴切的比喻是二者互为阴阳)。A∶T与G∶C碱基对之间的分子间作用力将两条链牢固地锁定在一起。DNA双螺旋结构可以看作由四个字母(—ATGCCCTACGGGCCCATCG……—)组成的密码编写而成,互补的两条链将会永远通过这种镜像密码缠绕在一起。
法国诗人保尔·瓦莱里(Paul Valéry)曾经写道:“如果你想了解事物的本质,那么就不要被它们的名字迷惑。”如果我们想要了解DNA的奥秘,那么也不能被它的名字或化学结构式干扰。就像人类使用的那些简单工具(锤子、镰刀、风箱、梯子以及剪刀)一样,我们完全可以从分子结构中领悟其功能。只要了解DNA的结构,那么就可以直接掌握这种信息载体的功能。对于生物学中最重要的分子来说,DNA名字的含义与功能相比可以忽略不计。
就在1953年3月的第一个星期里,沃森与克里克已经成功构建出完整的DNA模型。沃森冲到卡文迪许(Cavendish)实验室的地下金属加工车间,督促工人们抓紧时间制造模型零件。最后,全部零部件终于成功组装到一起,感觉就像完成了一幅复杂的拼图。第二天,他们带着铅垂线和尺子回到实验室,然后仔细地测量各部件之间的距离。无论是角度、宽度还是分子间隙,所有这些测量结果都近乎完美。第二天清晨,莫里斯·威尔金斯在闻讯后迫不及待地赶到剑桥。他“在转瞬间……就迷上了它”。富兰克林在两周之后才见到了双螺旋模型,她也随即相信这就是理想中的DNA结构。
1953年4月25日,沃森与克里克在《自然》(Nature)杂志上发表了《核酸分子结构:脱氧核糖核酸结构》。同期发表的还有一篇由戈斯林与富兰克林撰写的论文,他们为支持双螺旋结构提供了强有力的晶体学证据。而第三篇文章则由威尔金斯完成,他从DNA晶体实验中获取的数据进一步印证了该模型的合理性。沃森与克里克在文章结尾谦虚地提及:“我们已经注意到,文中提出的特定碱基配对直接暗示了某种潜在遗传物质的复制机理。”DNA最重要的功能就隐藏在其结构之中,它具有在细胞间以及生物体间传递遗传信息的能力。这种不稳定的分子组合不仅记录了生物体的信息、运动与形态,还为达尔文、孟德尔与摩尔根苦苦追寻的梦想找到了答案。
图像是反映事物内在规律的具体表现形式,其中双螺旋分子的结构图携带着人类构建、操作、修复以及复制的遗传指令,它承载着20世纪50年代科学界意气风发的豪情壮志。人类的完美性与脆弱性均隐藏在DNA分子的编码中:只要我们学会操纵这种化学物质,那么我们将能够改写自然、治愈疾病、改变命运并且重塑未来。
当沃森与克里克构建的DNA双螺旋模型问世后,基因作为代际神秘信息载体的概念正式终结,同时也意味着遗传学领域从此跨入新纪元。基因作为一种能够编码与存储信息的化学物质或分子,它可以在各种生物体之间传递信息。假如说20世纪早期遗传学领域的关键词是“遗传信息”,那么到了20世纪末期这个关键词可能就变成了“遗传密码”。半个世纪以来,基因是遗传信息载体的事实已经尽人皆知。而接下来的问题就是,人类能否破译自身的遗传密码。

第七章 “变幻莫测的难解之谜”

“代码”这个词在拉丁语中是植物茎基的意思,而这种也被称为木髓的材料曾经用于早期记录。对于代码这个词来说,它从形态到功能演变的过程不免令人深思。其实DNA又何尝不是如此,沃森与克里克意识到,分子形态与其功能之间存在着某种内在联系,遗传密码已经被写入组成DNA的材料中,它就像刻入木髓的符号一样清晰可见。

乔治·比德尔(George Beadle)与爱德华·塔特姆(Edward Tatum)是两位来自斯坦福大学的科学家,他们于1941年在位于地下隧道中的实验室里发现了连接基因与物理性状之间的缺失环节,并且比埃弗里完成的肺炎球菌转化实验还提前了3年。
“组分缺失”实验促使比德尔与塔特姆对基因有了新的认识。他们指出,缺少某种代谢功能的突变体将表现为相应的蛋白酶活性障碍。遗传杂交结果显示,每种突变体中仅有一个基因存在缺陷。
但是如果基因突变破坏了酶的功能,那么该基因在正常状态下必定携带合成正常酶的信息。而那些执行代谢或者细胞功能的蛋白质则由遗传单位所编码。比德尔于1945年写道:“基因可以指导蛋白质分子折叠形成最终构象。”其实这就是一代生物学家始终梦寐以求的“基因行为”:基因通过编码信息来合成蛋白质,然后由蛋白质来实现生物体的形态或功能。
或者以信息流来表示:

图片发自简书App

1958年,比德尔与塔特姆凭借上述发现获得了诺贝尔奖。但是他们在实验中提出的一个关键问题仍然悬而未决:基因如何通过编码信息来合成蛋白质呢?蛋白质是由20种名为氨基酸(甲硫氨酸、甘氨酸、亮氨酸等)的简单化合物串联形成的链状结构。它们与DNA的不同之处在于,DNA链主要以双螺旋形式存在,而蛋白质链则可以扭转形成各种特殊的空间构象,看起来就像是被折叠成特殊形状的电线。这种变形能力可以让蛋白质在细胞中执行不同的功能。它们在肌肉(肌球蛋白)中表现为细长且柔韧的纤维,也可以化身为球形(例如,酶类中的DNA聚合酶)然后促进化学反应发生,还能够与产生颜色的化学物质结合,合成眼睛或者花朵内的色素。它们在扭曲形成搭扣状构象后可以充当其他分子的搬运工(血红蛋白),此外还可以指定神经细胞之间的信息传递方式,并对正常状态下的认知功能与神经系统发育起决定作用。
但是DNA序列(例如ATGCCCC……)是如何携带合成蛋白质的指令呢?沃森始终感觉DNA首先会转换成为某种携带信息的中间体,于是他将其称作“信使分子”,而这些分子上携带有基因密码发出的合成蛋白质指令。1953年,沃森写道:“我在最近一年多总在跟弗朗西斯(克里克)念叨,DNA链携带的遗传信息必定先复制到与其互补的RNA分子中。”然后RNA分子将作为合成蛋白质的“信使”发挥作用。

雅克·莫诺(Jacques Monod)与弗朗索瓦·雅各布(François Jacob)是两位在巴黎工作的细菌遗传学家,他们在20世纪50年代中期也开展了相关实验,其结果也隐约暗示DNA在蛋白质翻译过程中需要某种中间体分子作为信使来发挥作用。他们提出,基因并不能直接发出指导蛋白质合成的指令。确切地说,DNA中的遗传信息需要先转换成软拷贝(草稿),然后蛋白质翻译将以该软拷贝为模板,而不是直接采用原始DNA的序列。
1960年4月,弗朗西斯·克里克与雅各布在悉尼·布伦纳(Sydney Brenner)位于剑桥的狭小公寓内会面,他们共同讨论了这种神秘中间体分子的身份。布伦纳是一位南非鞋匠的儿子,他在获得奖学金后来到英国学习生物学。就像沃森与克里克一样,他也对沃森的“基因信仰”和DNA功能十分着迷。这三位科学家甚至来不及品味刚刚入口的午餐就意识到,此类中间体分子必须能够往来于细胞核与细胞质之间,其中前者是基因的存储地点,而后者是蛋白质的合成场所。尽管缺乏确凿证据,但是布伦纳与克里克仍旧怀疑这种中间体分子就是RNA(DNA的分子“表兄弟”)。
1960年早春,雅各布飞抵加州理工学院与马修·梅塞尔森(Matthew Meselson)共同联手,他们打算破解这个“变幻莫测的难解之谜”。几周之后的6月初,布伦纳也加入了他们的团队。
布伦纳与雅各布知道,蛋白质是由细胞内一种名为核糖体的特殊细胞器合成的,而纯化信使中间体最有效的方法就是突然中止蛋白质合成。这种过程相当于生化版本的冷水浴,当那些冻得发抖的分子连同核糖体一起被提纯后,就可以揭开这个“难解之谜”。
细胞内使核糖体保持完整性的化学因子就是镁离子。镁离子的作用至关重要:当我们在溶液中补充镁离子后,核糖体将会保持彼此黏合的状态,布伦纳与雅各布终于从细菌细胞中提纯出微量的信使分子。果不其然,这种分子就是RNA,但是其类型却异乎寻常。当基因启动翻译时,信使分子随之生成。与DNA相似,RNA分子也由四种碱基串联而成,它们分别是A、G、C、U(请注意,在基因的RNA拷贝里,U将取代DNA中的T)。值得关注的是,布伦纳与雅各布后来发现信使RNA与原始DNA呈互补关系。当基因的RNA拷贝从细胞核转移到细胞质时,其携带的信息将被解码并指导蛋白质合成。信使RNA既不是天使也不是恶魔,它只是一个专业的中介。基因生成RNA拷贝的过程被称为转录,仿佛它们在以原始语言为模板对单词或句子进行重写。最终基因密码(ATGGGCC……)被转录为RNA密码(AUGGGCC……)。
这个过程类似于对珍本图书馆内的藏书进行翻译。信息的原版拷贝(例如基因)被永久尘封在幽深的密室或者金库里。当细胞发出“翻译请求”时,RNA作为DNA的拷贝接受指令从细胞核转移到细胞质。基因的副本(例如RNA)将被作为蛋白质翻译的源代码。上述过程允许多拷贝基因同时流通,此外RNA拷贝的数量可根据需求增减,而该事实很快就被证明在理解基因的活性与功能中起到至关重要的作用。
然而转录只解决了蛋白质合成的一半问题。剩下的另一半问题依然存在:信使RNA是如何解码并合成蛋白质的呢?在生成基因的RNA拷贝时,细胞采取了一种非常简易的转位方式:基因中的A、C、T和G序列在复制到信使RNA后其对应的序列为A、C、U和G(即ACT CCT GGG→ACU CCU GGG)。基因的原始序列与RNA拷贝之间的唯一区别就是胸腺嘧啶被尿嘧啶所取代(T→U)。可是一旦DNA转录生成RNA,那么基因中的“信息”是如何解码并合成蛋白质的呢?
在沃森与克里克看来,单个碱基(A、C、T或G)携带的遗传信息非常有限,根本无法承担合成蛋白质的重任。生物体内的蛋白质由20种氨基酸构成,而仅凭上述四种碱基不可能生成20种选项。秘密应该就隐藏在碱基组合之中。他们写道:“似乎那些鳞次栉比的碱基序列才是携带遗传信息的密码。”
我们可以运用自然语言进行类比来说明这一点。字母A、C与T自身携带的信息量微乎其微,但是它们在经过多种方式组合后就可以产生纷繁复杂的信息。同样还是这些字母,当它们的序列改变后其反映的信息也大相径庭:例如,行为(act)、战术(tac)以及猫(cat),尽管这些单词由相同的字母组成,但是它们代表的含义却存在天壤之别。解决遗传密码的关键是将RNA链中的序列原件映射到蛋白质链的序列中。而这就像破译遗传学界的罗塞塔石碑:哪种RNA碱基序列可以决定蛋白质中氨基酸的组合呢?或者从概念层面来讲:

图片发自简书App

克里克与布伦纳通过大量设计精妙的实验证实,遗传密码必定以某种“三联体”的形式存在:也就是说,DNA上三个碱基(例如ACT)只对应蛋白质中一个氨基酸。
然而三联体密码与氨基酸之间存在何种关系呢?到了1961年,来自世界各地的几个实验室相继加入破译遗传密码的竞赛中。就像所有的密码破译工作一样,这项研究在推进过程中也是举步维艰。起初,人们感觉三联体之间似乎会彼此重叠,而这也让寻找简码的努力前途渺茫。之后又有一段时间,实验结果证实某些三联体似乎根本不起作用。但到了1965年,所有这些研究(尤其是尼伦伯格的团队)成功地将每个DNA三联体映射到与其对应的氨基酸上。例如,ACT对应苏氨酸,CAT对应的则是功能与结构完全不同的组氨酸。此外,CGT对应的是精氨酸。假设某段特定的DNA序列为ACT—GAC—CAC—GTG,那么细胞可以通过碱基互补的原则生成RNA链,然后RNA链经过翻译后形成氨基酸链,并且最终合成某种蛋白质。其中,三联体密码(ATG)是合成蛋白质的起始密码子,而另外三个三联体密码(TAA,TAG,TGA)是合成蛋白质的终止密码子。至此,我们已经掌握了遗传密码的基本规律。
遗传信息流动可以简述如下:

图片发自简书App

或者从概念层面表示为:

图片发自简书App

或者:

图片发自简书App

弗朗西斯·克里克将这种信息流称为生物信息的“中心法则”(the central dogma)。尽管“法则”一词令人费解(克里克后来承认,他从未理解“法则”的深层含义,而实际上法则意味着固定不变的信条),但是“中心”一词却精准无误地反映了这种规律的本质。克里克以此来说明遗传信息流在生物学中具有普遍性。无论是细菌、大象、红眼果蝇还是王公贵族,生物信息始终以某种原始的方式在生命体系中有条不紊地流动:其中DNA经过转录形成RNA,然后RNA通过翻译合成蛋白质,并且最终由蛋白质构建结构并且执行功能,从而让基因展现出无穷无尽的生命力。

镰刀形红细胞贫血症是一种血红蛋白分子结构异常的遗传病,也许没有哪种疾病比它更能反映这种信息流的本质以及对生理功能的影响。
如果蛋白质链上恰好有某个氨基酸发生了改变,那么基因上的某处三联体(“三联体编码氨基酸”)肯定与原来不同。而实际情况与预测结果完全吻合,在鉴定与测序镰刀形红细胞贫血症患者体内编码血红蛋白B链的基因之后,人们终于发现DNA上某处三联体由GAG变成了GTG,并进一步导致血红蛋白B链中的谷氨酸被缬氨酸替换。这种改变影响了血红蛋白链的折叠,同时大量血红蛋白突变体在红细胞中积聚成团,再也无法盘绕形成正常状态下整齐的钩状结构。这些团块的体积随着缺氧程度加深而增大,同时红细胞的细胞膜也在牵拉下从正常的圆盘状变为新月形,也就是显微镜下所见到的“镰刀形红细胞”。镰刀形红细胞无法顺利通过毛细血管与静脉,它们在体内积聚形成微小的血凝块后将会造成血液中断,并且导致患者在贫血危象中出现剧烈疼痛。
镰刀形红细胞贫血症的发病机制非常复杂。首先,基因序列改变引起了蛋白质序列变化;其次,血红蛋白的形态改变会导致红细胞出现皱缩,随后这些积聚成团的血凝块将阻塞静脉并中断循环,最终产生各种临床症状(基因突变导致)。基因通过合成蛋白质来影响生理功能并决定了人类的命运,而这种冰火两重天就源自DNA上某个碱基对的改变。

第八章 基因的调控、复制与重组

正如核心部位少数重要原子的规则排列才是巨大晶体形成的基础,伟大科学体系的诞生也取决于几个关键概念的连锁互动。

图片发自简书App

根据相同的逻辑,几个关键概念的连锁互动也让遗传学获得了新生。最终,遗传学的“中心法则”就像牛顿力学一样在不断地提炼、改进与修订过程中日臻完善。由于“中心法则”构建了一种独特的思维体系,因此它对于新兴学科的意义非常深远。1909年,约翰森创造了“基因”一词,他曾宣称基因是“独立于任何假说之外”的概念。然而到了20世纪60年代早期,人类在基因领域取得的成果已经远远超出“假说”的范畴。遗传学描述了生物体内部沟通与外部联络的信息流,涉及从转录到翻译的各个阶段。至此,神秘的遗传机制终于浮出水面。

大肠杆菌(Escherichia coli)是一种在显微镜下呈胶囊状的肠道细菌,同时它也是结构最简单的生物体之一。大肠杆菌可以通过摄取葡萄糖与乳糖这两种不同的糖源而生存下去。无论提供何种糖源供能,大肠杆菌都会进入快速分裂阶段。这种绵延的生长曲线让法国生物学家雅克·莫诺乐在其中。
如果葡萄糖与乳糖在大肠杆菌中的代谢机制相同,那么这些以混合糖源为营养的细菌也应该表现为同样光滑的生长曲线。然而莫诺却在研究结果中无意间观察到一种怪象。起初大肠杆菌数量与预期的一样呈指数倍增,可是紧接着细菌生长在停滞一段时间后才得以继续。当莫诺研究这种停滞的机理时,他发现了这个超乎寻常的现象。在这种含有混合糖源的培养基中,大肠杆菌细胞首先会选择性地消耗葡萄糖,而不是对等地同时消耗乳糖。大肠杆菌细胞生长停滞似乎就是在重新选择食谱,当培养基中的糖源由葡萄糖变换为乳糖后,这些细菌将再次恢复生长。莫诺将该现象称为“两期生长”(diauxie)。
直到20世纪40年代末期,莫诺才发现这种现象是代谢调节的结果。当细菌消耗的养分从葡萄糖转变为乳糖时,它们会诱导产生特定的乳糖消化酶。然后当葡萄糖再次占据主导地位时,那些乳糖消化酶将会消失,同时葡萄糖消化酶会重新出现。在该转换过程中,诱导消化酶的产生需要几分钟的时间,而这就好像在吃饭期间更换餐具(放下鱼刀,改用甜点叉),于是我们就可以观察到生长停滞。
莫诺认为,两期生长表明基因将通过代谢输入受到调控。如果细胞中的酶(蛋白质)可以在诱导下出现与消失,那么基因就应该起到分子开关的作用(毕竟酶是由基因编码而成)。20世纪50年代早期,弗朗索瓦·雅各布来到巴黎加入了莫诺的团队,他准备通过突变体来系统地研究大肠杆菌中基因调控的机制,而摩尔根曾经采用该方法在果蝇遗传领域取得了辉煌的成就。
这些细菌突变体与果蝇突变体一样在揭示真相时起到了重要的作用。来自美国的微生物遗传学家阿瑟·帕迪(Arthur Pardee)与莫诺、雅各布共同发现了支配基因调控的三项基本原则。
首先,当某个基因启动或关闭时,细胞内的DNA原版拷贝始终保持完整。而真正发挥作用的是RNA:当某个基因启动时,它会在诱导下产生更多的RNA信息,同时生成更多的糖源消化酶。细胞的代谢特性(即它消耗的是乳糖还是葡萄糖)并非来自其恒定的基因序列,而是取决于基因产生的RNA数量。在乳糖代谢过程中,存在大量指导乳糖消化酶合成的RNA。这些信息在葡萄糖代谢过程中被抑制,取而代之的是大量指导葡萄糖消化酶合成的RNA。
其次,RNA信息在产生过程中也会同步受到调控。当糖源由葡萄糖转换为乳糖时,细菌就会启动某个基因模块(其中包含了几种乳糖代谢基因)来消化乳糖。模块中的基因将指定某个“转运蛋白”协助乳糖进入细菌细胞,而另一个基因会编码乳糖分解所需的酶,此外还有一个基因可以合成将上述产物进行再分解的酶。但是令人感到惊讶的是,染色体结构分析结果显示,所有参与某个特定代谢通路的基因均彼此相邻,它们就像是经过分类整理的馆藏图书,可以在细胞中同时被诱导参与代谢过程。这种代谢改变对于细胞的遗传变化具有深远的影响。该过程不仅仅是更换某件餐具那么简单,而是彻底改变了晚餐的全套用具。这种基因调控的模式好似功能电路的启动与关闭,它们仿佛受到某个共用阀芯或是主控开关的操纵。因此莫诺将这类基因模块称为操纵子(operon)。
蛋白质的合成与环境的需求完美同步:只要在细胞生长过程中提供正确的糖源,那么相应的糖代谢基因就会同时启动。冷酷的物种进化再次为基因调控提供了完美的解决方案,而携带遗传信息的基因则通过合成蛋白质来完成各种功能。
对于细胞中成千上万的基因而言,乳糖感应蛋白是如何做到只对乳糖消化基因进行选择性识别与调控的呢?莫诺与雅各布发现了基因调控的第三项基本原则,他们认为每个基因上都附有特定的DNA调控序列,其作用类似于识别标签。只要糖源感应蛋白在环境中检测到糖,它就会识别这个标签并启动或关闭靶基因。由于这种基因信号能够产生大量RNA信息,因此它们可以指导合成与糖源消化有关的酶。
简而言之,基因携带的信息中不仅包括蛋白质编码的内容,还反映了蛋白质合成的时间与空间特征。生物体中所有的数据均加密存储在DNA中,并且通常会附加到每个基因的前端(当然调控序列也可以位于基因的两端与中间)。而调控序列与蛋白质编码序列组合则决定了基因的功能。
我们在此将回顾性分析一下既往的研究结果。1910年,当摩尔根发现基因连锁现象时,他并未找出染色体上相邻基因之间的逻辑关系:虽然果蝇黑体与白眼基因在染色体上的位置紧密相连,但是它们在功能上似乎没有交集。然而雅各布与莫诺却得出与之相反的结论,他们认为细菌基因串联在一起绝非偶然事件。实际上,参与相同代谢通路调控的基因在物理位置上彼此相邻:它们只有在位于同一基因组的情况下,才能在代谢过程中共同发挥作用。基因上附加的特定DNA序列为其活性(即该基因序列的“功能”)提供了行动指南。这些用于启动或者关闭基因的序列让人联想到句子中的标点与注释(例如引号、逗号以及大写字母等):通过它们可以理解基因语言的背景,并且对其中的重点内容进行诠释,同时读者也将据此掌握阅读与断句的规律:
“这就是基因组的结构。除此之外,它还包含有独立的调控模块。基因组就像是某种奇妙的语言,其中有些词语聚集成句;而另一些则被分号、逗号和破折号分隔开来。”
1959年,就在沃森与克里克关于DNA双螺旋结构的文章问世6年之后,帕迪、雅各布与莫诺发表了他们在乳糖操纵子领域取得的重要成果。这篇论文被称为Pa-Ja-Mo[也有人将其戏称为“睡衣”(pajama)],分别由三位科学家姓氏的前两个字母拼写而成。由于该研究结果对于生物学具有普遍意义,因此迅速被学术界奉为经典。PaJa-Mo论文指出,基因并不是某种死气沉沉的模板。尽管每个细胞都含有相同的成套基因(基因组相同),但是在选择性激活或者抑制因素的作用下,某些特殊基因亚群依然允许单个细胞对环境做出应答。基因组就像一幅波澜壮阔的蓝图,它可以根据天时地利来调整遗传密码。
在此过程中,蛋白质扮演着调控传感器或者主控开关的角色,它在基因启动、终止或者组合过程中发挥着重要的协调作用。基因组就像是某首娓娓动听的交响乐总谱,它包含着维系生物体成长发育的指南。但在缺少蛋白质的情况下,基因组“乐谱”总是显得有气无力。蛋白质可以让遗传信息以具体的形式展现出来。它们仿佛正在指挥基因组乐团进行演奏,当乐谱进行到第14分钟时,中提琴加入弦乐,而琶音变换中铙钹的撞击的出现将让气氛开始活跃,最后密集的鼓声将整个作品烘托至高潮。或者从概念层面表示为:

图片发自简书App

Pa-Ja-Mo论文解决了遗传学领域的一个核心问题:具有固定基因组的生物体如何在环境变化时做出如此快速的反应呢?除此之外,它同时也为胚胎发生的核心问题提供了解决方案:这些相同的基因组如何让胚胎演变出成千上万种类型的细胞呢?基因调控(在特定时间里选择性启动或关闭特定细胞中的特定基因)必须根据生物信息的复杂性设置关键分层。
莫诺认为,只有在基因调控的基础上,细胞才得以在时间和空间上实现自己独特的功能。莫诺与雅各布总结道:“基因组不仅包含有一系列生命蓝图(基因),它还是一种协调机制……同时也是一种控制执行的手段。”沃尔特·诺埃尔体内的红细胞与肝脏细胞含有相同的遗传信息,可是基因调控确保血红蛋白只出现于红细胞中,而不会在肝脏细胞中表达。对于毛虫与蝴蝶来说,虽然它们也携带着完全相同的基因组,但是毛虫可以在基因调控下蜕变成蝴蝶。
对于遗传学家来说,生物体的发育过程可以用基因序列诱导(或抑制)与基因电路来描述。基因指定的蛋白质可以序贯启动其他基因,整个过程不断循环往复一直可以追溯至最原始的胚胎细胞。自始至终只有基因才能决定这一切。
基因调控(蛋白质控制基因的启动与终止)的作用在于,它可以让细胞的遗传信息在原有拷贝的基础上变得更加丰富多彩。

对于沃森和克里克来说,DNA双螺旋模型(两条互补共存的“阴阳”链)实际上已经暗示了基因复制的机理。沃森和克里克提出,每条DNA链都将生成各自的拷贝,进而从原来的双螺旋结构演变为两条双螺旋链。在DNA复制过程中,原有的两条阴阳链会率先解离。然后它们将被作为模板创建互补的阴阳链,并且最终形成两条相互配对的DNA链。
DNA双螺旋不能自主进行复制,否则它将成为脱缰的野马。在DNA复制过程中,某种名为复制蛋白的酶可能起到了重要作用。1957年,生物化学家阿瑟·科恩伯格开始着手分离DNA复制酶。到了1958年,科恩伯格在对大肠杆菌沉淀物进行反复蒸馏后,得到了一种近乎纯净的酶制剂(他曾经告诉我:“遗传学家仰仗统计,生化学家依靠提纯。”)。他将这种物质称为DNA聚合酶(DNA是由碱基A、C、G与T组成的聚合物,因此这是一种制备聚合物的酶)。当科恩伯格在DNA中加入此类纯化酶,并且提供足够的能量与核苷酸碱基(A、T、G与C)后,他目睹了核酸链在试管中形成的过程:DNA终于实现了自我复制。
值得注意的是,这里存在某种递归现象:与所有蛋白质一样,启动DNA复制的聚合酶本身就是基因的产物。也就是说每个基因组中都含有允许自身复制的蛋白质密码。由于DNA复制过程错综复杂,因此为其调控提供了关键节点。当然DNA复制也可在其他信号或调节分子的调控下启动或终止,例如年龄或细胞的营养状态,并确保细胞在准备分裂时才进行DNA复制。但是这种机制却引出了另外一个问题:如果调节分子自身发生失控,那么没有任何手段能够阻止细胞持续复制。我们很快就会意识到,癌症这种顽疾就是基因功能障碍的结果。

基因合成的蛋白质可以作用于基因的调控与复制。而重组(recombination)是基因生理学中第三个以“R”作为首字母的单词,它具有产生全新基因组合的能力,因此对于物种生存来说必不可少。
为了理解基因重组的概念,我们可能需要再次重温孟德尔与达尔文的贡献。在长达一个世纪的探索中,遗传学已经阐明了“相似性”在生物体之间传播的规律。编码遗传信息单位的DNA位于染色体上,它们可以通过精子与卵子传递到胚胎,然后再从胚胎进入生物体的每个细胞。这些遗传单位编码合成蛋白质的信息,而它们与蛋白质反过来又决定了生物体的形态和功能。
但是当这种遗传机制解决了孟德尔的问题(如何保持不变)后,它却未能进一步诠释达尔文的逆向谜题(如何推陈出新)。如果生物体要发生进化,那么它必须要能产生遗传变异,也就是说子代与亲代的遗传物质并不相同。如果通常情况下基因只传递相似性,那么它们是如何传播“差异性”的呢?
在自然界中,突变只是生物体产生变异的一种机制,例如DNA序列(碱基由A变为碱基T)改变可能导致蛋白质的结构与功能受到影响。而突变常见的原因包括:DNA被化学物质或X射线破坏,以及DNA复制酶在复制基因时偶然产生错误。
但是除了突变以外,自然界还存在另一种遗传多样性的发生机制,那就是遗传信息可以在染色体之间发生交换。源自母本与父本的染色体DNA可以交换位置,随后可能产生父本与母本基因的杂合体。而重组也是一种遗传物质“突变”的形式,只不过是整段遗传物质在染色体间发生了交换。
遗传信息在染色体之间发生移动只见于极特殊的情况下。第一种情况发生在精子与卵子形成的过程中。在精子与卵子发生之前,细胞临时起到基因护栏的作用。由于来自母本与父本的染色体按照配对原则相互拥抱在一起,因此它们相互之间很容易发生遗传信息互换。配对染色体间遗传信息的互换对于混合与匹配亲本遗传信息至关重要。摩尔根将该现象称为“交叉互换”(他的学生们曾经使用交叉互换对果蝇基因进行定位)。然而更符合现代学科发展的称谓是“重组”,这个术语可以反映基因组合进行再次组合的能力。
相比前者,第二种情况的意义更为重大。如果DNA被诱变剂(如X射线)损伤,那么遗传信息显然会受到威胁。在这种遗传损伤发生后,细胞可以根据基因配对染色体上的“孪生”拷贝对其进行重新复制,其中母本拷贝中的部分信息可能被父本拷贝改写,并且将再次导致杂合基因的产生。
在上述基因重建的过程中,碱基配对原则再次发挥了重要作用。同时基因在阴阳互补的作用下恢复了原始状态:DNA就像奥斯卡·王尔德小说中的人物道林·格雷(Dorian Gray)那样,他可以源源不断地从自身画像中汲取新的活力。与此同时,蛋白质则对于整个过程进行监管与协调(引导受损DNA链向完整基因靠拢,复制与纠正缺失的遗传信息,并且缝合基因断裂位点),并且最终用正常基因上的信息修复受损的DNA链。

值得注意的是,调控、复制与重组这三个基因生理学概念与DNA的分子结构密不可分,而沃森与克里克提出的双螺旋结构中碱基配对原则发挥着关键作用。
在基因调控过程中,DNA向RNA转录需要依赖碱基配对才能完成。当某条DNA链被用于构建RNA信息时,它们将会根据碱基配对原则生成基因的RNA拷贝。而在复制过程中,DNA将再次根据其序列为模板进行拷贝。每条DNA链都会生成与自身互补的拷贝,双螺旋结构就此可以形成两条双螺旋链。此外在DNA重组过程中,还是碱基配对原则让受损的DNA得以恢复。这些受损的基因拷贝将以互补链或者第二份基因拷贝为模板进行重建。
双螺旋结构充分展示了碱基配对原则的重要性,成功解决了遗传生理学中的三大难题。这些互为镜像的化学物质使得基因可以根据正常拷贝进行重建。而碱基配对原则就是确保遗传信息准确性与稳定性的基础。

在生物学领域中,解剖学家和生理学家不仅分属于两大阵营,同时他们的研究方法也大相径庭。解剖学家通过描述物质、结构与身体部位的属性来反映生物体的形态变化。与之相反,生理学家通过观察这些结构与部位交互作用产生的功能来了解其运行规律。
这种学科之间的差异让基因历史发生了根本性转变。或许孟德尔是最早的基因“解剖学家”:根据豌豆代际信息传递的特点,他将基因的基本结构描述为不可分割的信息微粒。20世纪20年代,摩尔根与斯特提万特将该解剖链的意义延伸,证明基因是染色体上呈线性排列的物质单位。到了20世纪40年代至50年代,埃弗里、沃森与克里克证实了DNA就是基因分子,并且用双螺旋结构来描述其空间构象。从此将基因的解剖概念推向巅峰。
然而在20世纪50年代末期至70年代之间,基因生理学却异军突起成为该领域的主力军。调控(例如,基因会在特定条件下被“启动”或“关闭”)可以让基因在时空交错中风云变幻,从而加深了人们对不同细胞之间千差万别的理解。此外,基因还能够在染色体之间进行复制与重组,并且由特定的蛋白质进行修复,而这也解释了细胞与生物体如何代际保存、复制与重组遗传信息的问题。
对于人类生物学家来说,上述每项发现都意义深远。随着遗传学从基因概念的物质层面转向机制层面,也就是从研究基因的组成发展为探索基因的功能时,人类生物学家逐渐察觉到,他们终于通过这条主线将基因、生理学以及病理学紧密联系起来。疾病发生未必与遗传密码改变有关(例如镰刀形红细胞贫血症中的血红蛋白),这种情况也可能是基因调控的结果,从而导致正确的基因无法在适当的时间与空间内被启动或关闭。基因复制不仅需要解释单细胞演化为多细胞生物体的原理,同时还要阐明基因复制错误对于疾病的影响,例如那些没有自发性代谢疾病或严重精神疾病家族史患者的发病机制。基因组之间的共性可以解释亲代与子代的相似性,而基因突变与基因重组则能解释它们之间的差异性。对于家庭成员来说,他们不仅共享相似的社交文化网络,而且还拥有功能相仿的活性基因。
众所周知,19世纪的人体解剖学和生理学为20世纪的医学奠定了基础,同时基因解剖学与生理学也为这门重要的新兴生物学科开辟了一片天地。在接下来的几十年里,这种具有革命性意义的学科研究对象将从简单生物体扩展到更为复杂的领域。其中那些概念性的词语(调控、重组、突变、修复)将从晦涩的基础科学期刊融入普通医学教科书,并且会在渗透过程中引发社会与文化领域的广泛争议(接下来本书会提到“种族”的概念,然而如果没有首先理解基因重组与突变的机制,那么我们不可能理解其深刻内涵)。这门新兴学科将诠释基因在构建、维护、修复与繁殖中的作用,同时它还将揭秘基因解剖与生理变异和人类身份、命运、健康与疾病的关系。

第九章 基因与生命起源

尽管遗传物质的传递机制已经从分子层面得到阐明,但是这反而让困扰托马斯·摩尔根的谜题更加令人费解。对于摩尔根而言,生物学需要探寻的主要奥秘不是基因而是生命的起源。
摩尔根指出,基因是解决纷繁复杂生命现象的完美方案。在有性生殖过程中,生物体的信息以压缩形式进入单个细胞,然后这个细胞又可以重新演化为生物体。摩尔根意识到,基因解决了遗传信息的传递问题,可是由此又产生了生物体的发育问题。因此这种单个细胞必须能够携带构建生物体的完整指令(也就是基因)。

如果人们仅凭直觉进行判断,那么胚胎学家应该肩负起探索生命起源的重任,而这个过程需要涵盖从胚胎早期到生物体成熟阶段的全过程。由于某些无法避免的原因(我们即将看到),人类对于生物体发育的认识是以某种倒序方式进行的。其中最先破译的是基因影响大体解剖特征(四肢、器官与结构)的机制,接着是生物体决定这些结构位置(前后、左右、上下)的机制,最后才是明确机体轴线、前后以及左右方位(胚胎发育过程中最早期发生的事件)的机制。
当然产生这种倒序研究的原因显而易见。控制大体结构(例如四肢与翅膀)的基因突变往往具有典型的特征且非常容易被发现与描述。然而控制机体结构基本要素的基因突变较难分辨,其原因在于这种突变大大降低了生物体的存活率。此外由于头尾结构异常的胚胎在早期即夭折,因此无法捕捉到胚胎形成初期发生的基因突变。
20世纪50年代,加州理工学院的果蝇遗传学家爱德华·路易斯(Edward Lewis)开始重建果蝇胚胎的形成过程。路易斯总结道:构建器官与结构的信息由主控“效应”基因编码,其工作原理类似于自主部件或子程序。在果蝇(或任何其他生物体)正常繁衍过程中,这些效应基因会在特定的位点与时间启动,并且将决定果蝇机体分节与器官功能。这些主控基因可以左右其他基因的“启动”与“关闭”,它们就像是微处理器中紧密相连的电路。效应基因突变可以导致畸形或者体节与器官异位。

然而谁才是真正的幕后指使呢?爱德华·路易斯的发现包括控制体节、器官与结构发育的主控基因,并且成功解决了胚胎发育最后阶段的问题,但同时也提出了一个看似无限递归的难题。如果胚胎是由控制各个体节和器官(它们彼此之间互为邻里)身份的基因构建,那么某个体节从胚胎发育伊始是如何知道自己身份的呢?例如,某个负责翅膀的主控基因如何“知道”要在第二胸节构建翅膀,而不是在第一或者第三胸节呢?如果遗传模块的自主性如此之高,那么果蝇的腿为何不会生长在头上,人类拇指也不会从鼻子里长出来呢?
为了能更好地解释这些问题,我们需要回顾一下研究胚胎发育的进程。克里斯汀·纽斯林—沃尔哈德(Christiane Nüsslein-Volhard)与埃里克·威绍斯(Eric Wieschaus)是海德堡大学的两位胚胎学家。1979年,他们开始通过果蝇突变体来探究胚胎形成的早期事件,而此时距路易斯发表有关控制肢体与翅膀发育基因的论文已经过去一年。
纽斯林—沃尔哈德与威绍斯制造的突变体甚至比路易斯所描述的种类更为丰富。纽斯林—沃尔哈德与威绍斯推断,这些突变体中的基因决定了胚胎发育的蓝图,它们才是主宰胚胎世界的统治者。上述突变基因将把胚胎分成基本亚节,并且可以激活路易斯发现的主控基因,然后开始在某些(且只有这些)位置构建器官与身体结构(例如头上的触角以及第四胸节上的翅膀等)。因此纽斯林—沃尔哈德与威绍斯将其命名为“分节基因”。可是即使是分节基因也会受到主控基因的影响。
20世纪80年代末期,纽斯林—沃尔哈德带领学生们开始孵化最后一批果蝇突变体,而此时已经不用考虑胚胎结构不对称的问题。这些头尾不全的突变体早在分节出现之前就已经停止发育(当然更无从谈起什么结构与器官)。1986年,纽斯林—沃尔哈德的学生设计了一项精巧的实验,他们使用显微操作针穿刺正常的果蝇胚胎,并且从它的头部提取一滴体液,然后将其移植到无头突变体上。令人惊讶的是,这种细胞手术居然获得了成功:来自正常头部的体液可以诱导无头胚胎在其尾部发育出头状结构。
1986年至1990年间,纽斯林—沃尔哈德与同事发表了一系列具有开创性的文章,他们最终鉴别出几个发出控制胚胎头尾信号的因子。现在我们知道,果蝇卵子在发育过程中会产生8种此类化合物(主要是蛋白质),而且它们在卵子内沉积的位置并不对称。雌性果蝇可以决定母体因子在卵子中的生成与位置。由于不对称性沉积源自卵子本身在雌性果蝇体内的不对称分布,因此这些母体因子可以分别沉积于卵子的头端或者尾端。这些蛋白质在卵子中按照浓度梯度分布。就像方糖在咖啡中溶解扩散一样,卵子中的蛋白质浓度也会根据位置不同而表现出高低差异。化学物质在蛋白质基质中的扩散颇具立体感,看上去好似麦片粥上呈条带状分布的糖浆。此外分别位于高低浓度端的特定基因将被激活,于是果蝇胚胎将按照“头—尾轴”或者形成其他模式发育。
事实上,人类胚胎发育可能也需要通过上述三个过程来实现。与果蝇胚胎发育的过程一样,“母体效应”基因可以使早期胚胎按照化学梯度形成主轴(包括头尾轴、背腹轴以及左右轴)。接下来,某些功能与果蝇分节基因相仿的基因将启动胚胎分裂,并且形成大脑、脊髓、骨骼、皮肤、内脏等主要结构。最后,器官构建基因将授权建造四肢、手指、眼睛、肾脏、肝脏以及肺等器官、部位与结构。

在总结果蝇胚胎大体轮廓特点的基础上,果蝇胚胎学家将其发育过程依次分为轴线确立、体节形成以及器官构建这三个阶段,其中每个阶段都会受到一系列的基因调控。可是如果我们希望从最基础的层面来理解胚胎发育的话,那么基因学家就需要了解基因支配单个细胞命运的机制。
20世纪60年代中期,悉尼·布伦纳开始在剑桥寻找某种有助于破解细胞命运决定之谜的生物体。对于布伦纳来说,即便是果蝇(拥有“复眼、节足与复杂的行为模式”)这般袖珍的生物体也显得过于庞大。如果要了解基因支配细胞命运的机制,那么布伦纳就需要找到某种体型微小且结构简单的生物体,这样每个源自胚胎的细胞都可以非常容易地被计数与跟踪(相比而言,人类由37万亿个细胞组成。哪怕是功能最强大的计算机也无法预测人类细胞的命运)。最后,布伦纳选定了一种体形微小的土壤线虫,其学名为秀丽隐杆线虫(Caenorhabditis elegans),也可以简称为秀丽线虫。
基因告诉每个细胞该“做”什么(何时何地),因此它们都知道自己“是”什么。线虫的结构就像是一部计时精准的遗传钟表,其运行规律与运气、魔法、混沌以及命运毫无关系。细胞是组成生物体的基本单元,而它们会接受遗传指令的统一调控。生命起源实际上是基因潜移默化的过程。

如果说基因在调控细胞属性(出生、位置、形状、大小以及身份)方面已经做到无懈可击,那么最后那批线虫突变体则揭开了另外一项更为重要的发现。20世纪80年代早期,霍维茨与萨尔斯顿逐渐发现,即便是细胞死亡的过程也为基因所掌控。
程序性死亡?遗传学家刚才还在研究线虫的程序性生活,难道死亡也是由基因控制的吗?1972年,澳大利亚病理学家约翰·克尔(John Kerr)在正常组织与肿瘤组织中均发现了某种相似的细胞死亡模式。在克尔的结果公布之前,生物学家曾认为死亡在很大程度上是由外伤、损害或感染引起的偶发事件,而人们将这种现象称为“坏死”(necrosis),其字面的意思是“变黑”(blackening)。坏死通常伴随着组织分解,并且出现化脓或者坏疽形成。但是克尔在某些组织里发现,濒死细胞似乎可以在这条不归路中激活特定的结构发生改变,好像它们在内部启动了“死亡子程序”。濒死细胞不会引起坏疽、创伤或炎症,它们呈现出珍珠样光泽的半透明状,感觉像是花瓶中即将凋谢的百合。如果坏死的表现为细胞变黑,那么这种死亡的特点就是细胞变白。克尔本能地推测这两种死亡形式有着本质区别。他写道,这种“受控的细胞缺失不仅会定期发生,而且还是一种与生俱来的程序化现象”,它由细胞内的“死亡基因”控制。克尔用“凋亡”(apoptosis)来描述这一过程,这个源自希腊语的词语让人联想起树叶从枝头或者花瓣从花朵上飘落。
但是这些“死亡基因”到底长什么样呢?霍维茨与萨尔斯顿又构建了一批突变体,它们的区别并不在于细胞谱系,而是在于细胞的死亡模式。霍维茨认为,这些突变体内发生改变的基因就是导致凋亡的始作俑者,它们就相当于细胞世界中的刽子手、清道夫、保洁员与殡葬师。此外还有一组突变体的细胞死亡模式更为夸张,甚至就连细胞的尸体都没有来得及形成。
值得注意的是,科学家们很快就在人类癌症中发现了某些调节细胞死亡的基因。此外正常人类细胞同样拥有这种控制程序性死亡的凋亡基因。许多凋亡基因的历史非常久远,它们的结构和功能与在线虫和果蝇体内发现的死亡基因相类似。
难道只有基因才能决定线虫体内每个细胞的命运吗?霍维茨与萨尔斯顿在线虫体内还发现了某些成对存在的罕见细胞,然而它们的命运就像抛硬币一样难以捉摸。实际上,决定这些细胞命运的并不是遗传因素,而是细胞之间邻近效应的结果。戴维·赫什(David Hirsh)与朱迪思·金布尔(Judith Kimble)是两位在科罗拉多大学工作的线虫生物学家,他们将这种现象称为“自然模糊性”。
金布尔发现,即便是自然模糊性也无法充分诠释上述现象。事实上某个模糊细胞的身份会受到来自邻近细胞的信号调控,但是邻近细胞本身又会接受遗传指令的预排。线虫之神明显在虫体设计时留下了细微的破绽,但是它就是若无其事地我行我素。因此线虫在构建虫体时受到两种输入信号的作用,分别源自基因的“内部”指令与细胞间交互作用的“外部”指令。
如果强行把外部与内部指令引入到线虫的生命中会产生什么变化呢?1978年,金布尔搬到剑桥后就开始研究强力干扰对细胞命运的影响。她先采用激光烧灼的方法杀死虫体内的单个细胞。然后她发现在严格控制实验条件的前提下,细胞消融可以改变其邻近细胞的命运。但是那些已经由遗传因素预先决定的细胞几乎无法改变自身的命运。与之相反,那些表现为“自然模糊性”的细胞却具有较好的依从性,可即便如此,它们改变自身命运的能力也非常有限。外因带来的改变在线虫的微观世界发挥着作用,不过这种作用需要经过基因镜片的过滤与折射,因此会在现实中受到遗传物质的严重制约。

虽然是胚胎学家发现了控制果蝇与线虫生死的基因级联反应,但是这些成果对于遗传学领域同样具有深远的影响。在解答摩尔根“基因如何指定果蝇”问题的同时,胚胎学家还破解了一个更深层面的谜题:遗传单位如何让生物体表现出令人困惑的复杂性。
其实我们可以从组织结构与交互作用中找到答案。当基因与蛋白质的属性(等级、梯度、开关以及“电路”)完成混合与匹配之后,我们就可以观测到生物体在解剖结构与生理功能上的复杂性。就像某位科学家描述的那样:“……单个基因本身并没有什么过人之处,它们能够影响的分子非常有限……但是这种简单性并未成为构建高度复杂生物体的障碍。如果通过几种不同种类的蚂蚁(工蚁、雄蚁等诸如此类)就可以建起庞大的蚁群,那么在面对随机配置的3万个级联基因时,你可以让自己的想象尽情地发挥。”
遗传学家安托万·当尚(Antoine Danchin)曾经用德尔斐之船的寓言来形容个体基因为自然界创造复杂性的过程。众所周知,人们用德尔斐神谕来思考水中泛舟船板腐烂的问题。随着船体出现破损,船板也被逐个换掉。等到10年之后,最初的船板已经荡然无存。然而船主却认为这还是同一条船。但是如果每个原始的物质元素都已被替换,那么现在这条船怎么可能跟原来那条船相同呢?
答案在于“船”并非由船板制成,而是由船板之间的关系组成。如果你把一百张彼此堆叠的木板压实,那么就可以得到一堵厚实的木墙;如果将木板边对边钉在一起,那么就可以做成甲板;因此造船时船板的形状、关系与顺序均需要满足特定条件。
研究显示,基因也在以相同的方式运行。个体基因可以决定个体功能,而它们之间的相互关系将促成生理功能。如果没有这些交互作用的关系,那么基因组的功能将无从体现。虽然人类与线虫拥有的基因数量均为2万左右,但是只有人类能够创作出西斯廷教堂的穹顶壁画。这个事实表明,基因数量对于机体的生理复杂性而言无足轻重。某个巴西桑巴舞教练曾经对我说:“重要的不是你拥有什么,而是你通过它实现什么。”
理查德·道金斯是一位进化生物学家与作家,他提出的解释基因形态与功能之间联系的比喻最具代表性。道金斯指出,某些基因具备反映生物体发展蓝图的作用。蓝图是展示建筑结构或者机械构造的缩影,其全部特性均与它代表的结构具有点对点的对应关系。然而绝大多数基因的作用与蓝图不同,它们并不指导单一结构或部分的构建。相反,这些基因将与其他基因级联协作实现复杂的生理功能。道金斯认为,这些基因不像蓝图而更像某种配方。蛋糕是糖、黄油与面粉交互作用的结果,但是它们也受到混合比例、环境温度与时间因素的制约。同理,人类生理学也是特定基因与其他基因交互作用的产物,并且整个过程必须按照正常的顺序与地点进行。单个基因只是构建生物体的复杂配方中的一员,而人类基因组才决定人类的配方。

到了20世纪70年代早期,就在生物学家开始破译基因在生物体形成中的复杂机制时,他们也遇到了定向操纵生物基因这个无法回避的问题。1971年4月,美国国立卫生研究院组织召开了一次会议,其内容是明确在不久的将来向生物体引入遗传改变是否可行。1971年,基因操作(即便是在结构简单的微生物体内)的方法尚未问世,但是专家组成员表示他们对该技术的前景充满信心,实现上述目标不过是时间早晚的问题。
只要此类技术问世,那么其影响力将不言而喻,而构建人体的配方也可能会被改写。某位科学家在会议上指出,基因突变历经岁月长河的精挑细选,但是人工突变可以在短短几年之内就完成上述过程。如果能够将“人为遗传改变”引入人体,那么遗传改变的步伐可能会赶上文化变革的速度。某些常见的人类疾病或许就此根除,而个人史与家族史将被永远改写。同时这项技术将重塑遗传、身份、疾病与未来的概念。正如加利福尼亚大学旧金山分校的生物学家戈登·汤姆金斯(Gordon Tomkins)所言:“人类有史以来第一次开始质疑自己——我们到底在做什么?”

第三部分 “遗传学家的梦想”——基因测序与基因克隆(1970─2001)

第一章 “交叉互换”

1968年冬季,保罗·伯格(Paul Berg)结束了在加州拉霍亚(La Jolla)的索尔克生物研究所为期11个月的学术假期后回到了斯坦福大学。在病毒学家雷纳托·杜尔贝科(Renato Dulbecco)的协助下,伯格将研究重点调整为动物病毒方向。而他在整个休假期间都在思考基因如何借助病毒来传递遗传信息。
此时,猿猴空泡病毒40(简称SV40)引起了伯格的兴趣,它被称为“猿猴”病毒是因为它能感染猿猴与人类细胞。如果从概念上来理解,那么每个病毒都是一个专业的基因载体。病毒的构造非常简单,其基因外仅有衣壳包被,而免疫学家彼得·梅达沃(Peter Medawar)则将其形容为“包裹在蛋白质衣壳下面的恶魔”。当某个病毒进入细胞时,它会脱掉外面的衣壳,开始把细胞作为复制自身基因的工厂,并且大量制造新的衣壳,结果就是数以百万计的新生病毒从细胞内以芽生方式释放。病毒依靠基本营养成分就可以完成生命周期。它们生存的目的就是感染与复制,而感染与复制又是它们生存的手段。
由于SV40基因组结构十分紧凑,同时它导入细胞的效率也非常可观,因此SV40成为携带基因进入人类细胞的理想载体。伯格灵机一动:如果能够把外源基因(至少对于病毒来说属于外源范畴)作为诱饵装配给SV40病毒,那么病毒基因组就可以将该外源基因偷偷转运到人类细胞中,并且最终改变细胞的遗传信息,而该创举将开辟遗传学发展的新篇章。但是就在伯格对修饰人类基因组满怀憧憬之时,他不得已要去面对一个技术上的难题:需要找到可以将外源基因插入到病毒基因组中的方法。伯格必须人工设计一个基因“嵌合体”,即由病毒基因与外源基因形成的杂合体。
人类基因以串联形式排列在染色体上,就像是穿在细绳上的串珠,而与之不同的是,SV40的基因是串联排列在环状DNA上的。这种基因组看上去好似一条由分子组成的项链。当病毒感染细胞并将其基因插入细胞染色体时,项链就会开环成为线性DNA,然后把自己附着于染色体的中央。为了将外源基因添加到SV40的基因组,伯格需要强行打开项链的环扣,同时把外源基因插入开环的SV40 DNA上,最后重新封闭两端形成环状DNA。而病毒基因组将会继续完成后续工作:它将把这段外源基因带入人类细胞,然后再将它插入到某条人类染色体上。
伯格并不是唯一注意到病毒DNA可以协助外源基因插入染色体的科学家。1969年,彼得·洛班(Peter Lobban)正在斯坦福大学读研究生。洛班在他的研究方案中提出,基因与钢梁并没有什么不同:它们在投入使用之前都可以根据人类的需求进行重装、改造与塑形。而解决问题的关键在于能否找到合适的方法。在论文导师戴尔·凯泽(Dale Kaiser)的支持下,洛班甚至迫不及待地启动了预实验,他利用标准酶实现了基因在不同DNA分子之间进行转移。
事实上,就像伯格与洛班分别发现的那样,实验成功的秘诀在于要彻底忽略SV40的病毒身份,只把它作为某种化学物质来对待。也许在1971年时,科学界对DNA的一切已经了如指掌,但是人们对于基因操作还处于“遥不可及”的阶段。埃弗里曾经把DNA当作一种普通的化学物质进行加热,却没想到它还具有在细菌之间传递信息的能力。科恩伯格当年只是在DNA中加入了某些酶,就使得它们可以在试管里进行复制。外源基因插入SV40基因组的过程涉及一系列化学反应。现在伯格需要两种特殊的酶来完成这个过程,其中一种可以将环状基因组切开,而另一种则可以把外源基因片段“粘贴”到SV40的基因组。与其说是病毒,还不如说是病毒中包含的信息将再次展现出生命力。
但是科学家在哪里才能找到能够剪切与粘贴DNA的酶呢?正如遗传学历史上常见的重大发现一样,我们需要在细菌世界里寻找这个答案。自20世纪60年代以来,微生物学家一直致力于从细菌中提纯出用在试管里操纵DNA的酶类。细菌细胞,或者说任何细胞都要通过自身的“工具箱”来操纵DNA:在细胞分裂、修复损伤基因或者基因在染色体之间发生交叉互换的过程中,均需要用酶去复制基因或者填充损伤造成的缺口。上述化学反应工具箱具有“粘贴”DNA碎片的功能。伯格深知,即便是最简单的生物体也具有把基因黏合在一起的能力。值得注意的是,切割酶的来源与众不同。DNA切割酶的特异性作用至关重要:在DNA的分子世界,只要切中要害便可一招制敌。某种微生物可以通过切断其他入侵微生物的信息链使其瘫痪。
对于伯格的实验而言,这些来自微生物世界的酶工具将为其奠定坚实的基础。伯格知道,改造基因需要的关键成分就冻存在五家独立实验室的冰箱里。他只需要来到这些实验室,准备好研究所需要的各种酶,然后按照先后次序完成各项化学反应即可。其中一种酶起到切割作用,而另一种酶起到粘贴作用,这样就可以使任意两个DNA片段拼接在一起,并且可以让科学家在基因操作时游刃有余。
伯格深知这项新兴技术蕴含的能量。基因之间可以通过相互结合创造出全新组合,甚至还可以在新组合的基础上继续拓展;它们可以发生改变、产生突变并且穿梭于生物体之间。伯格回忆道,在构建这种基因嵌合体的过程中,“所有用于制备重组DNA的步骤、操作与试剂都早已司空见惯,其新颖之处在于它们之间特定的组合方式”。其实真正关键的进步在于剪切与粘贴概念的提出,也可以说是对近10年来遗传学领域直觉与技术的提炼升华。

尽管伯格与杰克逊面临着各种难以想象的技术障碍,但是他们还是成功地将外源基因片段连接到完整的SV40基因组上,其中就包括一段来自细菌病毒(λ噬菌体)的DNA和三个来自大肠杆菌的基因。
这项研究成果具有举足轻重的意义。虽然λ噬菌体和SV40都属于“病毒”,但是它们彼此的差异堪比马与海马之间的区别(SV40可以感染灵长类动物细胞,而λ噬菌体只能感染细菌)。众所周知,大肠杆菌是一种源自肠道的细菌,其结构与上述两种生物体完全不同。因此就产生了一种奇怪的嵌合体,这些基因在进化树上的亲缘关系相距甚远,可是它们在经过粘贴后却能成为一条连续的DNA。
伯格将这种杂合体称为“重组DNA”。他在选择这个词组的时候应该煞费了一番苦心,而这令人想起了有性生殖过程中产生杂合基因的“重组”现象。在自然界中,由于遗传信息频繁在染色体间发生混合与配对,因此产生了纷繁复杂的生物多样性:源于父本染色体的DNA与源于母本染色体的DNA互换位置会产生“父本∶母本”基因杂合体,这也就是摩尔根所说的“互换”现象。伯格在制备基因杂合体时使用了某些特殊工具,它们可以在生物体自然状态下对基因进行剪切、粘贴和修复,其结果就是将交叉互换原理延伸到生殖概念以外。伯格的研究实际上也是在合成基因杂合体,只不过他是将不同生物的遗传物质在试管中进行混合与配对。现在这种与生殖无关的基因重组指引他跨入了崭新的生物学世界。

图片发自简书App

插图源自保罗·伯格关于“重组”DNA的论文。科学家们不仅可以将任意生物体的基因进行组合,而且还能自由地改造基因,而这也为人类基因治疗与人类基因组工程埋下了伏笔。

同年冬季,一位名叫珍妮特·默茨(Janet Mertz)的研究生决定加入伯格的团队。如果默茨培养出携带病毒基因的细菌,而不是携带细菌基因的病毒,那么又将出现何种结果呢?这种逻辑上的颠倒(更确切地说是生物体的逆转)实现了技术上的重大飞跃。默茨意识到,如果她能将SV40基因插入大肠杆菌的质粒中,那么就可以把细菌当作生产新型基因杂合体的“工厂”。当细菌生长与分裂时,质粒以及质粒上的外源基因也会同时进行倍增。经过修饰后的染色体将在原有基础上重复复制,这样细菌就可以将染色体上装载的外源基因制造出来。而这种数以百万计的DNA片段精准复制品就是“克隆”。
默茨的演讲结束后现场先是陷入了一片沉寂,然后同学与指导老师的质疑如潮水一般涌来。伯格花了几个星期的时间去认真思考波拉克与查加夫提出的顾虑。实际上,许多病毒学家都曾被SV40病毒感染过,可是却没有任何人因此罹患癌症。在公众舆论的巨大压力下,杜尔贝科甚至主动喝下含有SV40病毒的溶剂以证明它与人类癌症毫无关系。在做出风险预估与防范计划之前,伯格主动暂停了该项实验。直到现在,含有SV40基因组片段的DNA杂合体仍旧处于实验阶段。它们将不会被引入到活体组织内。
与此同时,默茨有了另一项重大发现。按照伯格与杰克逊的最初设计,完成DNA剪切与粘贴需要经历六步冗长的酶促反应,而默茨则发现了一条行之有效的捷径。她从来自旧金山的微生物学家赫伯特·博耶(Herbert Boyer)那里获得了一种叫作EcoR1的DNA切割酶,随后默茨发现DNA片段的剪切与粘贴过程可以从六步精简为两步。尽管默茨成功制备出“重组DNA”,但是该项研究在伯格的实验室尚处于暂停阶段,因此她不能将基因杂合体转运到活菌体内。

1972年11月,就在伯格反复权衡病毒—细菌DNA杂合体风险的时候,来自旧金山的科学家赫伯特·博耶飞到夏威夷参加一个微生物学会议,他曾经为默茨的实验提供了DNA切割酶。当天晚些时候,博耶偶然遇到了斯坦福大学的斯坦利·科恩(Stanley Cohen)教授。
博耶与科恩都知道伯格与默茨成功地在实验室里制备出基因杂合体,因此他们讨论的内容也在不经意间转到了科恩的研究领域。科恩已经从大肠杆菌中分离出几种质粒,其中一种质粒的纯化过程非常可靠,它能够轻易地在大肠杆菌菌株之间进行转移。据说其中某些质粒携带有抗生素(例如四环素或青霉素)抗性基因。
但是假如科恩从某个质粒上切下抗生素抗性基因,然后把它导入另外一个质粒中会发生什么呢?某个原本会被抗生素杀死的细菌是否得以存活,并且在抗生素抗性基因的保护下选择性地茁壮成长,而那些不含有杂交质粒的细菌会死去呢?
在伯格与杰克逊的早期实验中,缺少一种简便易行的方法来鉴别细菌或病毒是否已经获得了“外源基因”(从生化混合物中纯化杂合质粒的唯一方法就是利用其大小的区别:因为A+B大于单独的A或B)。与此相反,科恩的质粒带有抗生素抗性基因,而这也为鉴别基因重组体提供了强有力的方法。他们开始用“进化论”来协助完成实验。自然选择的过程在培养皿中就已经开始,并且顺理成章地筛出了符合他们要求的杂交质粒。细菌之间出现抗生素抗性转移证实了基因杂合体或重组DNA的存在。
博耶通过纯化酶使制备基因杂合体的效率得到了大幅提升,而科恩则分离出了可以轻易地在细菌中进行选择与扩增的质粒。现在实验步骤已经一目了然,整个过程简单明了,使用标准试剂就可以在一个下午的时间内实现目标。该实验不仅具有创新性与高效性,同时安全性也得到了保障。与伯格和默茨实验(涉及病毒—细菌杂合体)的不同之处在于,科恩与博耶制备的嵌合体完全由细菌基因构成,而他们认为这样可以大大降低危险性。他们找不到任何停止制备这些质粒的理由。毕竟细菌原本就能够悄然无息地进行遗传物质交换,并且它们从来不会去思索这样做的理由,事实上基因的自由交换是微生物世界特有的标志。
博耶与科恩为了制备基因杂合体一直在奔波劳碌中度过,而他们在送走了寒冷的冬季后迎来了1973年的早春。到了同年夏末的时候,博耶与科恩已经成功地制备出基因杂合体,他们将两条来自不同细菌的遗传物质联结起来,然后形成了一个单基因嵌合体。两种生物体的遗传物质经过重组后获得了全新的身份,而人类也因此接近了哲学领域的核心问题。
1973年2月,博耶与科恩准备在活细胞中对第一个人工制备的基因嵌合体进行扩增。他们用限制性酶切开两个细菌质粒,并且让两种质粒的遗传物质进行互换。然后通过连接酶将携带有杂交DNA的质粒紧密封闭起来,接着再用改良版的转化反应将制备的嵌合体导入细菌细胞中。含有基因杂合体的细菌将在培养皿上迅速繁殖,它们可以形成微小的半透明菌落,仿佛闪耀的珍珠密布在琼脂上。

第二章 现代音乐

当伯格、博耶与科恩正在各自的机构(斯坦福大学与加州大学旧金山分校)里忙着混合与匹配基因片段时,剑桥大学的研究人员则完成了另一项具有同样意义的重大遗传学突破。为了理解这项发现的本质,我们必须重温基因研究的规范用语。与任意一种语言类似,遗传学也是由基本的结构单元组成的,其中就包括字母、词汇、句法与语法等。基因的“字母表”里只有四个字母,它们就是DNA的四个碱基(A、C、G与T)。而“词汇”由三联体密码构成,三个相连的碱基可以编码蛋白质中的某个氨基酸,其中ACT编码苏氨酸,CAT编码组氨酸,GGT编码甘氨酸,并且以此类推。蛋白质就像是基因编码的“句子”,它可以将字母串连成链(例如ACT—CAT—GGT编码苏氨酸—组氨酸—甘氨酸)。此外,莫诺与雅各布发现的基因调控则为这些词句创造出具有丰富内涵的语境。附加在基因上的调控序列(在特定时间与空间启动或关闭某个基因的信号)可以被视为基因组内部的语法。
尽管遗传学字母表、句法和语法就存在于细胞内,但是这些内容并非人类的“母语”。为了帮助生物学家读写基因语言,我们需要发明一套全新的工具。其中“写入”就是将单词按照特定的排列方式进行混合与搭配后产生新的含义。伯格、科恩与博耶在斯坦福大学开始应用克隆技术来写入基因,产生出自然界中不存在的DNA词句(例如把细菌基因与病毒基因联合起来形成全新的遗传因子)。但是“读取”基因,也就是解读某段DNA上精密排列的碱基序列,仍然存在着巨大的技术障碍。具有讽刺意味的是,人类并不了解细胞读取DNA的机制,而这个问题对于化学家来说尤为突出。就像薛定谔曾经预测的那样,DNA这种化学物质令化学家百思不得其解,同时该分子本身的特征也自相矛盾:虽单调乏味却日新月异,既循规守矩又变幻莫测。化学家在拼接分子结构时通常会把它拆分为拼图中的小碎片,然后再把各化学成分组合起来装配出该分子的结构。可是当DNA变成碎片后,它就会降解为A、C、G与T等四种碱基的混合物。如果把书中的每个单词都拆分成字母,那么我们根本无法进行阅读。DNA就像那些单词一样,其序列中携带有相应的含义。只要将DNA降解为碱基,它就变成了原始的“四字母浓汤”。

然而化学家是如何确定基因序列的呢?在英国剑桥大学,有一处位于沼泽附近的非常简陋的半地下实验室。从20世纪60年代开始,生物化学家弗雷德里克·桑格(Frederick Sanger)就在这里从事基因测序研究。桑格对于复杂生物分子的化学结构非常痴迷。20世纪50年代早期,桑格就利用改良的传统分解方法解决了胰岛素蛋白质的测序问题。1958年,桑格因其做出的巨大贡献被授予诺贝尔奖。
1955年到1962年间,虽然桑格使用改良的降解法阐明了几个重要蛋白质的序列,但是他的研究成果却并未触及DNA测序问题。1962年夏季,桑格搬到了位于剑桥大学医学研究委员会(MRC)大楼里的另一处实验室。他在那里遇到了许多新邻居,其中就包括克里克、佩鲁茨与悉尼·布伦纳,而这些科学家都沉浸在对DNA的狂热崇拜中。
20世纪60年代中期,桑格将研究重点从蛋白质转移到了核酸,并且开始认真考虑DNA测序问题。但是曾经在胰岛素研究中崭露头角的方法(切断、溶解、再切断、再溶解)在DNA测序中却无法施展。蛋白质的化学结构使得氨基酸可以按照顺序被依次切断,然而桑格在DNA研究中并未发现可供使用的工具。于是他重新调整了降解反应,但是实验结果只能用一败涂地来形容。当桑格把DNA碎片溶解后发现,携带遗传信息的DNA已经变成了乱码。
1971年冬季,桑格在逆向考虑这个问题时突然获得了灵感。在过去几十年间,他一直通过打破分子之间的联系来解决测序问题。但是如果他将原有的研究方向颠倒过来,尝试以构建DNA替代分解反应,那么又会出现何种结果呢?桑格推断,要想解决基因测序问题,研究者就必须按照基因的变化规律进行思考。细胞无时无刻不在构建基因,而每次细胞分裂都会生成新的复制体。
假设生物化学家能够身临其境进入基因复制酶(DNA聚合酶)中,那么将有机会目睹DNA复制以及基因复制酶逐个添加碱基(例如A、C、T、G、C、C、C等依此类推)的过程,而生化学家只要在一旁仔细观察就可以了解这段基因的序列。其工作模式与复印机相仿,你可以通过DNA拷贝来重建原始结构。此时,镜像将再次还原其本来面目,道林·格雷的真容将从这些散乱的映像中得到显现。
1971年,桑格开始利用DNA聚合酶的复制反应研制基因测序技术。起初桑格的方法效率很低,并且经常莫名其妙地失败。他后来发现该问题与复制反应的速度有关,当聚合酶沿着DNA链快速前进时,其添加核苷酸的速度简直是疾如闪电,以至于桑格根本无法捕捉到中间的步骤。1975年,桑格对原有实验步骤进行了巧妙的修改,他通过一系列经过化学改造的碱基(这些变异体与A、C、G和T之间只有非常轻微的差异)来打乱复制反应。虽然上述碱基仍能被DNA聚合酶识别,但是会干扰它们的复制能力。当聚合酶暂缓复制时,桑格便可以在减速反应中利用干扰信号从成千上万的碱基中对基因进行定位,例如:这里是A,那里是T与G等等,依此类推。
1977年2月24日,桑格的研究成果发表于《自然》杂志,他在文中描述了使用这项技术揭示ΦX174病毒完整DNA序列的过程。桑格写道:“通过这些序列可以识别出许多特性,而正是它们负责制造该生物体内9个已知基因所合成的蛋白质。”现在桑格已经读懂了基因的语言。

作为遗传学领域的新技术,基因测序与基因克隆随即被用于基因与基因组新特征的鉴定。而这些技术应用的首个重大发现与动物基因和动物病毒的独特功能有关。1977年,科学家理查德·罗伯茨(Richard Roberts)与菲利普·夏普(Phillip Sharp)分别发现,绝大多数动物蛋白质并非由连续的DNA序列编码,事实上它们会被分为许多独立模块。但是在细菌中,每个基因都是由连续的DNA序列组成,从第一个三联体密码(ATG)开始算起,一直延伸直至最后的“终止”信号。由于细菌的基因内部不存在间隔区,因此它们不含有那些独立模块。但是罗伯茨与夏普发现在动物与动物病毒中,某个基因通常会被较长的DNA填充片段分割成多个部分。
现在我们将“structure”这个词比喻成基因来进行诠释。在细菌中,基因“structure”可以准确无误地嵌入到基因组中,不存在断裂、填充、间插以及中断等现象。但是在人类基因组中会出现完全相反的情况,基因“structure”会被某些DNA间隔片段打断,表现为s…tru...ct...ur...e的形式。那些被标记为省略号(...)的长段DNA并不含有任何蛋白质编码信息。
起初,这些断裂基因的结构令人难以理解:为什么动物基因组要耗时费力地把长链DNA片段变得七零八落,难道只是为了重新恢复这些信息的连续性吗?但是很快断裂基因的内在逻辑就变得显而易见:假如把基因分成不同的功能模块,那么细胞就可以让单个基因产生成令人眼花缭乱的信息组合。由于基因s...tru...ct...ur...e可以被剪接组合成为cure,或是true等基因,因此可以从单个基因中创造出大量各式各样的信息(也称为亚型)。当然你还可以用剪接的方式从g...e...n...om...e中生成gene、gnome与om基因。此外,模块基因还具有进化上的优势:来自不同基因的单个模块经过混合与匹配后可以构建出全新的基因种类(例如:c...om...e...t)。哈佛大学遗传学家沃利·吉尔伯特(Wally Gilbert)为这些模块创造了一个名词,他将其称为“外显子”(exon),而外显子之间的填充片段则被命名为“内含子”(intron)。
内含子并非人类基因的特有产物,它们广泛存在于各种生物体中。这些单词代表着基因。其中单词间的长省略号代表基因间DNA,单词间的短省略号(gen...ome...e)则代表内含子,括号与冒号这样的标点符号相当于调节基因的DNA区域。
除此之外,基因测序与基因克隆这对双胞胎还把遗传学从实验的泥沼中拯救了出来。20世纪60年代末期,人们意识到遗传学的发展已经深陷僵局。那时候所有实验科学的设计理念基本雷同,先是对于某个系统进行有计划的干预,然后再测量干预带来的效果。由于改变基因的唯一手段就是构建突变体(其实这是个随机过程),因此读懂变化的唯一途径就是比较形态与功能的差异。你可以效仿穆勒构建无翅或无眼果蝇突变体的方法将果蝇暴露在X射线下,但是你无法定向操纵那些控制果蝇眼睛或翅膀的基因,而且你也无法准确地理解翅膀或者眼睛的基因发生了何种改变。就像某位科学家描述的那样:“基因遥不可及。”
基因这种遥不可及的属性让“新兴生物学”的救世主(詹姆斯·沃森就是其中一员)感到尤为沮丧。1955年,就在他发现DNA结构两年之后,沃森来到了哈佛大学生物系,但是这一举动也随即招致了哈佛大学内部某些学术泰斗的反感。在沃森看来,生物学是一门横跨传统与现代领域的新兴科学。传统学派由博物学家、分类学家、解剖学家以及生态学家组成,他们仍然专注于动物分类以及对生物解剖学与生理学特征进行定性描述。而“现代”生物学家则与之完全不同,他们开始研究分子与基因在生物体内的作用。当传统学派还在讲授生物多样性与变异时,现代学派已经在讨论通用编码、共同机理以及“中心法则”了。
克里克曾经说过:“每代人都有属于自己的现代音乐。”沃森则直白地表达了自己对古典音乐的轻蔑。沃森认为博物学在很大程度上是一门“描述性”学科,而它终将被具有勃勃生机的实验科学取代。那些研究恐龙的“老古董”很快就会因为自身因素退出历史舞台。沃森将秉承传统学派的生物学家称为“集邮者”,对他们聚精会神于生物标本收集与分类的做法嗤之以鼻。
然而即便是沃森也不得不承认,由于无法定向进行基因干预以及解读基因改变的确切本质,因此现代生物学研究的道路依然崎岖坎坷。如果可以对基因进行测序与操作,那么这个领域将会呈现出波澜壮阔的前景。而在此之前,生物学家只能依靠仅有的研究工具(也就是在结构简单的生物体内产生随机突变)来探索基因的功能。但是让沃森愤懑不平的是,博物学家也可以如此这般来嘲弄他们的工作:如果传统学派的生物学家是“集邮者”的话,那么现代学派的分子生物学家不过是“突变体猎手”。
1970年到1980年,这些突变体猎手摇身一变成为基因操作者与基因解码者。假设时间回到1969年,如果在人类中发现了某种疾病相关基因,那么科学家们根本没有切实可行的方法来理解该突变的本质,他们没有途径去比较该基因与正常基因之间的差异,同样也没有简便易行的方法在其他生物体内重建基因突变来研究其功能。然而到了1979年,这种致病基因已经能够被导入细菌体内,它们在与病毒载体进行拼接后能够转移到哺乳动物细胞的基因组中,随后可以使用克隆与测序手段将该基因与正常基因进行比较。
1980年12月,为了表彰这些基因技术领域中的开创性发现,弗雷德里克·桑格、沃尔特·吉尔伯特与保罗·伯格被共同授予诺贝尔化学奖,他们就是率先读写DNA奥秘的先驱。就像某位科学记者指出的那样,“化学操纵(基因)的武器库”现在已经初具规模。
按照伯格、博耶与科恩的想法,最初发明基因操作、克隆与测序技术是为了在细菌、病毒与哺乳动物的细胞之间转移基因,可是后来这些技术在有机生物学领域产生了巨大反响。对于基因克隆与分子克隆本身来说,虽然这些术语原本被用来指代细菌或病毒中产生的相同DNA拷贝(也就是“无性繁殖”),但是没多久它们就成为整个生物技术领域的象征,正是这些技术使得生物学家们能够从生物体内提取基因,并且在试管中进行基因操纵、构建基因杂合体以及在活体生物中扩增基因(毕竟只能利用这些技术的组合来克隆基因)。伯格说道:“只要掌握了基因操作的实验技术,那么就可以通过这些手段来操纵生物体。通过基因操作与基因测序工具混合搭配,科学家研究的领域将从遗传学扩展至整个生物世界,而这种基于实验科学获得的胆识在过去看来简直是天方夜谭。”
假设免疫学家正打算解决免疫学里的一个基础问题,例如T细胞在体内识别与杀死外源细胞的机制。几十年来,人们已知T细胞可以通过其表面的传感器来获知入侵细胞与病毒感染细胞的存在。这种传感器被称为T细胞受体,它实际上是一种只由T细胞产生的蛋白质。T细胞受体能够识别外源细胞表面的蛋白质并与之结合。而反过来,这种结合又会触发杀死入侵细胞的信号,并且构成生物体的防御机制。
但是T细胞受体的本质是什么呢?生物化学家开始通过擅长使用的减法来解决该问题:他们先是通过细胞培养获得大量的T细胞,接着用脂肪酸盐与洗涤剂将细胞成分溶解形成灰色的细胞泡沫,然后去除提取物中的细胞膜与脂质,并且对这些物质进行反复提纯,从而最终捕获罪犯蛋白(culprit protein)。可是溶解在那些细胞提取物中的受体蛋白依然无影无踪。
此时基因克隆可以提供另一种解决方案。现在我们假设:T细胞受体蛋白的与众不同之处在于它只在T细胞内合成,而不会出现在神经元、卵细胞或者肝细胞中。虽然编码该受体的基因应该存在于每个人类细胞中(人类神经元、肝细胞以及T细胞拥有相同的基因组),但是最终负责转录的RNA却只产生于T细胞。那么人们能否通过比较两个不同细胞的“RNA目录”,然后从该目录中克隆出某个功能相关的基因呢?生物化学家的方法总是以浓度为中心:他们会在蛋白质最有可能聚集的地方找到它,然后将其从混合物中提取出来。相比之下,遗传学家的方法则是以信息为中心:他们通过比较两个密切相关的细胞“数据库”差异来找到该基因,进而使用克隆技术在细菌体内对该基因进行扩增。生物化学技术注重提取方式,而基因克隆手段可以扩增信息。
1970年,病毒学家戴维·巴尔的摩与霍华德·特明的一项重要发现使得上述比较成为可能。巴尔的摩与特明两人各自独立开展了研究工作,他们在逆转录病毒中发现了一种可以使用RNA作为模板构建DNA的酶。由于它逆转了遗传信息流动的正常方向,因此他们将这种酶命名为逆转录酶。这种从RNA到DNA(或者说从转录信息到基因本身)的过程违反了“中心法则”的某个版本(遗传信息只会从基因转录为信息,而且绝不可能反向流动)。
在细胞内逆转录酶的协助下,每条RNA都可以作为模板来构建与之相应的基因。这样生物学家就能为细胞中全部“活跃”基因制作目录或者“文库”,而这种过程就像图书馆根据主题对书籍进行分类。基因文库并不是T细胞的专利,它还存在于其他类型的细胞(包括红细胞、视网膜中的神经元、胰腺里的胰岛素分泌细胞等)里。通过比较源自两种细胞(例如T细胞与胰腺细胞)的基因文库,免疫学家就可以筛选不同细胞中的活跃与不活跃基因(例如胰岛素或者T细胞受体)。只要上述基因被验明正身,那么就可以将其在细菌中成百万倍地进行扩增,然后对该基因进行分离与测序,并且确定相应的RNA与蛋白质序列。此外还可以确定调控区域的位置,当然也可以将发生突变的基因插入到不同的细胞中,从而破译该基因的结构与功能。1984年,这项技术被用于克隆T细胞受体,而此项成果在免疫学领域具有里程碑式的意义。
就像某位遗传学家后来回忆的那样,生物学“被克隆技术解放了……此后生物学领域开始爆发出各种令人惊喜的消息”。在过去几十年里,科学家一直在寻找那些神秘莫测且不可或缺的基因(其中包括凝血蛋白基因、生长调节因子基因、抗体基因、激素基因、神经间递质基因、控制其他基因复制的基因、癌症相关基因、糖尿病相关基因、抑郁症相关基因以及心脏病相关基因等),而我们则可以利用来自细胞的基因文库来进行纯化与克隆。
基因克隆与基因测序让生物学发生了天翻地覆的变化。如果把实验生物学比作“现代音乐”的话,那么基因就是它的指挥、管弦乐队、类韵副歌、首席乐器以及总谱。

第三章 海边的爱因斯坦

尝试理解自然是科学的冲动,而企图操控自然则是技术的野心。重组DNA研究已经将遗传学从科学领域引入技术王国。基因的概念从此不再是抽象的传说。它们可以从尘封千年的生物体基因组内解放出来,自由地在不同物种之间往来穿梭,并且在此过程中历经修饰、提纯、延长、缩短、改造、混合、突变、再混合、匹配、剪切、粘贴以及编辑的改变;它们的功能在人类干预下可以得到无限延伸。基因不再只是研究对象,它们已经成为研究工具。例如,在儿童正常发育过程中,当孩子掌握了语言递归性后会表现出喜悦的神情:他会意识到思想可以构建词汇,而词汇亦可产生思想。重组DNA技术使得遗传学语言具备递归的特点。生物学家曾经花费数十年时间试图阐明基因的本质,但是他们现在却可以通过基因技术来指引生物学的发展。简而言之,我们已经从学习基因语言转变为使用基因语言进行思考。
综上所述,阿西洛马会议恰好成为这些重要成果的展示舞台。这次盛会不仅是遗传学突飞猛进的庆典,同时还在激烈的交锋中提出了评价标准与预警机制。而科学界将阿西洛马会议视为遗传学迈向新时代的标志。

第四章 “克隆或死亡”

通过产品来书写技术的历史令人浮想联翩,例如车轮、显微镜、飞机以及网络。但是通过转换来描绘技术的历史更具启发意义,例如从直线运动到圆周运动、肉眼空间到微观空间、陆地运动到天体运动以及物理连接到虚拟连接。
而对于医学技术的历史来说,通过重组DNA合成蛋白质正是这种具有里程碑意义的转换。为了理解这种转换(从基因到药物)造成的影响,我们需要了解药用化学品的历史。就其本质而言,药用化学品(即某种药物)无非是一种能够对人体生理功能产生治疗效果的分子。药物可能源自某些结构非常简单的化学物质,例如我们赖以生存的水,如果在恰当的条件下以正确的剂量使用,那么它也可以成为具有疗效的药物,此外药物还可以由多种具有复杂功能的分子组成,当然这种类型的化学物质在实际情况中非常罕见。尽管从表面上看人类使用的药物种类成千上万(仅阿司匹林就有几十种剂型),但是实际上这些药物所针对的分子反应数量只占人体中化学反应总数的极少部分。正常人体中包含有数以百万计的生物分子变异体(例如酶、受体以及激素等),然而我们能够使用的药物仅能对其中大约250种(0.025%)分子产生治疗效果。如果将人类生理功能比作遍及全球的电话网络系统,那么现代药物化学能够起到的作用仅仅是沧海一粟;药物化学就像是威奇托小城的一位接线员,只能在庞大的网络空间里充当无足轻重的角色。
缺乏特异性是造成药物治疗手段裹足不前的主要原因。几乎所有药物的作用原理均与靶点结合有关,它们通过开启或者关闭分子开关使靶点活化或失活。为了发挥治疗作用,药物必须与靶点上某些特定的开关结合才能发挥作用,而缺乏特异性的药物无异于毒药。尽管大多数化学分子都无法对此进行鉴别,但是蛋白质从设计伊始就具备选择的特性。众所周知,蛋白质是生物世界的枢纽,它们是细胞反应的推动者、阻断者、策划者、调控者、守卫者以及操作者。它们就是大多数药物寻求开启或关闭的分子开关。
鉴于上述原因,蛋白质有望成为药物世界中最具疗效与特异性的产品。但是为了合成某种蛋白质,我们必须要先了解其基因序列,而重组DNA技术就是通往成功的关键桥梁。克隆人类基因使得科学家能够大规模合成蛋白质,同时这些产物又为特异性作用于人体内数以百万计的生化反应提供了可能。因此从事药物研究的化学家就可以通过蛋白质对人体生理功能进行前所未有的干预。综上所述,重组DNA技术用于生产蛋白质的意义不仅是单个基因到治疗方法的转变,更是从遗传领域到药物世界的飞跃。

第四部分 “人类是最适合的研究对象”——人类遗传学(1970─2005)

第一章 父亲的苦难

核磁共振影像显示,父亲充满脑脊液的脑室出现肿胀扩张,同时将脑组织挤向边缘,这种情况被称为正常压力脑积水(Normal pressure Hydrocephalus,NPH)。神经病学家对此解释说,脑脊液流通障碍是NPH的病因,这将导致脑室出现继发性扩张,在某种程度上类似于“脑部高血压”。典型的NPH患者经常出现步态不稳、尿失禁与痴呆的症状,但是医学界对于上述三联征的原因尚无法做出解释。原来父亲的问题不是意外跌倒,真正的罪魁祸首是NPH。
尽管其“遗传”方式与镰刀形红细胞贫血症和血友病都不同,但是NPH很可能是一种遗传病。然而这种奇特疾病的易感性并非受单一基因控制。就像果蝇翅膀形成受到分布在多条染色体上多个基因的调控一样,位于多条染色体的多个基因在发育过程中参与了大脑导水管形成的过程。我了解到,其中部分基因负责编码脑室中导水管与血管的解剖结构(作为类比,我们可以想象一下“模式形成”基因构建果蝇器官与结构的机制),此外另一些基因负责编码在不同腔隙间转运体液的分子通道,当然还有某些基因负责编码调节液体在大脑与血液之间吸收的蛋白质。但是由于大脑及其导水管的生长受到颅骨固定容积的限制,因此决定颅骨大小与形状的基因也会间接影响分子通道与导水管之间的比例。
这些基因中的任意成员出现变异都可能改变导水管与脑室的生理机能,从而导致脑脊液在分子通道中流动的方式发生改变。此外,老龄化或者颅脑损伤等环境因素将增加上述过程的复杂性。基因的位置与疾病之间并不存在一一对应的关系。即使你遗传了可以导致NPH的全套基因,你或许也还需要某场意外或在某个环境因素的触发下才能将这些基因“释放”出来(在我父亲的病例中,这个触发器很可能是年龄)。但是如果你遗传了上述基因中的某些特殊组合,例如控制脑脊液吸收速率与导水管大小的基因,那么你罹患NPH的风险就可能会大大增加。这就像承载着疾病的德尔斐之船,它告诉我们疾病并非由单一基因决定,其结果受到基因与基因以及基因与环境之间交互作用的影响。
亚里士多德曾经提出一个问题:“生物体如何把创造形态与功能的信息传递到胚胎中呢?”学者们通过观察模式生物(豌豆、果蝇以及面包霉菌)得出了答案并且创立了现代遗传学。经过不懈的努力,我们终于得到了这张诠释生命体系中信息流方向的示意图:

图片发自简书App

但是父亲患病的事实却让我们深切体会到遗传信息对生物体形态、功能以及命运的影响。难道父亲意外跌倒是基因作用的结果吗?我在此很难进行判断。他体内的基因只是间接促进了跌倒发生,而不是直接导致这种结果的因素。难道父亲跌倒是环境因素造成的吗?回答当然不能这样武断。尽管父亲出事的时候正坐在摇椅上,可是这把摇椅在此之前已经陪伴他度过了10年的光阴。难道是巧合吗?当然不是,谁能想到某件沿着特定角度运动的家具能把人给甩出去呢?难道是意外吗?当然也不是,他无法保持身体平衡则注定难逃一劫。
随着遗传学研究对象从简单的生物体逐渐过渡至复杂的人类,它面临的挑战也转变为需要采用全新的方法来思考遗传、信息流、功能与命运的本质。基因与环境交互作用影响常态与病态的机制是什么呢?为了回答这个问题,我们首先要明确什么是常态与病态。基因变异是如何导致人类形态与功能产生变异的呢?多个基因是如何共同影响某个单一结果的呢?不同的基因变异在维持相同生理功能的同时,又是如何产生独特病理变化的呢?

第二章 诊所诞生

不过就人类世界的需求而言,医学是引领遗传学前进或者准确来说是步入正轨的动力。维克多·马克库斯克(Victor McKusick)是位于巴尔的摩市约翰·霍普金斯大学的一位年轻内科医生。
马克库斯克从事的遗传病分类工作具有四项重大意义。第一,马克库斯克意识到单个基因突变可以导致不同器官产生各式各样的临床表现。例如在马方综合征患者中,某个编码纤维样结构蛋白的基因发生突变后会影响所有结缔组织,包括肌腱、软骨、骨骼与韧带,而此类患者经常会出现关节与脊柱的异常。其实马方综合征对于心血管系统的影响非常隐蔽,由于支撑肌腱与软骨的结构蛋白同样用于维系大动脉与心脏瓣膜的功能,因此该基因突变将会导致严重的心功能衰竭与主动脉破裂。这些患者通常在青年时期就死于血管破裂。
然而令人惊讶的是,虽然第二项与第一项的内容相悖,但是同样具有正确的指导意义,也就是说多个基因可以共同影响某一种生理功能。我们在此以血压变化机制为例,血压受到众多遗传回路的调控,而其中一个或多个回路出现异常都将导致高血压。虽然完全可以说“高血压就是一种遗传病”,但是需要进行补充说明的是“单独的高血压基因并不存在”。人体内有许多基因参与调控血压的升降过程,它们就像是牵引木偶手臂的细线。当人们试图改变它们的长度时,木偶的姿态就会随之变化。
马克库斯克的第三项贡献关乎人类疾病中基因的“外显率”与“表现度”。果蝇遗传学家与蠕虫生物学家研究发现,某些特定基因所控制的功能或形态能否真实表达,取决于环境触发器或者随机概率。例如在果蝇的复眼中,某个控制小眼面的基因具有温度依赖性。而在蠕虫体内,另外一种可以改变其肠道形态基因的表达率只占20%。“外显不全”意味着即使某种突变存在于基因组中,那么它也未必能使自己表达出相应的外观或形态特征。
马克库斯克从人类疾病中找到了几种外显不全的案例。例如对于像泰伊—萨克斯二氏病这种外显率接近100%的遗传病来说,患者一旦携带此类突变基因将不可避免地发病。但是在另外一些人类疾病中,基因对疾病的实际影响则更为复杂。我们随后将会了解到,虽然BRCA1基因突变可以显著增加罹患乳腺癌的风险,但是并非所有携带该突变基因的女性都会患上乳腺癌,而且不同的BRCA1基因突变亚型所表现出的外显率也参差不齐。尽管血友病是一种典型的出血性遗传病,但是此类患者在发病时的出血程度也有很大差异。有些患者每个月都会出现致命的大出血,而另外一些患者几乎不出血。
马克库斯克的第四项贡献与本书内容密切相关,因此我必须进行单独阐述。与果蝇遗传学家狄奥多西·多布然斯基一样,马克库斯克清楚突变只不过是变异而已。尽管这句话听起来像是老生常谈,但是它却传递出言简意深的真理。马克库斯克意识到,突变只是个统计学上的概念,它无关病理学或者道德层面的改变。突变并不意味着疾病,亦不能代表功能上的增减。从字面意义上理解,突变指的是偏离正常的程度(“突变体”的反义词不是“正常体”而是“野生型”,也就是在自然状态下更为常见的类型或变异)。因此,与其说突变是某种规范性概念,还不如说是个统计学概念。“正常人群”中的马方综合征患儿会被视为突变体,其意义与矮人国中的巨人或褐发人群中的金发婴儿如出一辙。
突变体或突变本身并不能直接反映躯体疾病或者功能紊乱的信息。疾病是个体遗传因素与所处环境之间失衡导致的特定缺陷,其中涉及个体突变、周边环境、生存目标以及成功终点。最终导致疾病的不是突变,而是众多因素之间的错配。
这些错配会对个体造成无法弥补的损害,例如在某些病例中,疾病就意味着残疾。假如某位儿童患有严重的自闭症,那么他会整天躲在角落里枯燥无味地独自摇摆,抑或不停地搔抓自己的皮肤直至溃烂,而这种不幸的遗传特质将让他几乎无法与任何环境或任何目标相匹配。但是对于另外一个患有少见自闭症亚型的患者来说,他会在大多数情况下表现得神态自若,甚至可能在某些场合(例如象棋比赛或者记忆大赛)中表现得聪慧过人。在该病例中,由于疾病表现与患者处境密切相关,因此基因型与环境之间特殊的平衡关系更为明显。其实“错配”的本质就是个万象更新的过程,疾病也在跟随环境不断变化进行着动态调整。尽管正常人可以在盲人的世界里行动自如,但是如果这片土地笼罩在炫目的强光里,那么只有盲人才能适应这种恶劣的环境。
马克库斯克认为人们关注的重点应该在残疾而不是畸形,他在自己的诊所里接诊患者时就秉承了这种临床思维。例如治疗侏儒症患者的多学科团队会由遗传学顾问、神经病学家、骨科医生、护士以及精神病学家组成,他们将共同为身材矮小的患者解决某些特殊残疾带来的问题。这些专家只有在特定畸形加重时才会采取手术干预措施对其进行矫正。治疗的目的不是让患者重获“正常”的肢体,而是让他们找回人生的意义与乐趣并且改善生理功能。
马克库斯克的工作促进了人类病理学的发展,并且在该领域重新发现了现代遗传学的基本原则。对于人类而言,其无处不在的遗传变异过程与野生果蝇十分相似。遗传变异、环境以及基因—环境交互作用最终将共同导致表型出现,只不过在此处所谈论的“表型”是疾病的外在形式罢了。此外,某些基因还存在外显不全与表现度差异巨大的问题。单个基因可以导致多种疾病,同时某种疾病也可以源自多个基因。在此处,“适应度”并不只是某种绝对的概念。“疾病”也可以被看作缺乏适应性的表现,其根源就在于生物体与环境之间发生了相互错配。

华莱士·史蒂文斯曾经写道:“不完美才是我们的天堂。”而踏入人类世界的遗传学给我们上的第一堂课就是:不完美不仅是我们的天堂,还是我们赖以生存的尘世。遗传变异的程度以及它对人类病理改变的影响令人叹为观止。我们生活在日新月异的大千世界里,遗传多样性是人类与生俱来的属性,它并非隐藏在遥不可及的角落,而是与我们的生命息息相关。那些貌似同源的种群实际上千差万别。其实我们对于突变体早已司空见惯,因为人类就是由庞大的突变体组成。
众所周知,漫画是反映美国人内心焦虑与幻想的传统风向标,而“突变体”在这些作品中的出镜率也与日俱增。1966年春季,所有这些关于缺陷、变种人以及正常人的忧虑已经不再局限于漫画的范畴了,此时人们的注意力已经转移到一只两英尺见方的培养箱上。1968年5月31日,恰逢人工流产还可以作为治疗手段的最后一周,J. G.做出了终止妊娠的决定。尽管这是首例完全参考遗传检测结果进行的“治疗性人工流产”,但是就这样在秘密、痛苦与悲伤的裹挟下被人类历史淹没。
1973年夏季,禁锢产前检查与人工流产的闸门突然被一场出人意料的官司冲破。最高法院对“罗诉韦德案”的裁决迅速在医学界产生了巨大反响。该案看似把生育权交还给了妇女掌控,其实在很大程度上是将胚胎基因组的支配权交给了医学。在麦科维之前,产前基因检测一直处于模棱两可的边缘地带,虽然临床上允许进行羊膜穿刺,但是人工流产的合法性未能明确。然而随着人工流产技术在妊娠早期与中期的应用逐渐合法化,人们对于医学诊疗建议的重要性也更加认可,于是产前基因检测在全美医疗机构受到了广泛欢迎。从此对人类基因进行干预正式步入了“实操阶段”。
对于基因检测与人工流产这两项技术来说,它们产生的正面效应很快就得到了印证。在获得了干预人类基因的能力之后,人们甚至认为步入快速发展阶段的遗传医学可以重塑历史。1973年,就在“罗诉韦德案”判决结束几个月后,马克库斯克主编的新版医学遗传学教材正式发行。在“遗传病的产前检测”一章中,儿科医生约瑟夫·丹西斯(Joseph Dancis)这样写道:
近几年来,无论是医生还是公众都有一种共同的感觉,那就是我们关注的重点不能仅局限于婴儿的安全降生,更应该确保这个孩子不会对社会、父母或者自身造成负担。但是“出生权”也需要得到另外一种保障的支持,那就是婴儿在出生后应该尽可能获得幸福美满的人生。而人们态度上的转变体现在许多方面,其中之一就是要求改革甚至废除堕胎法的全国性运动。
丹西斯通过这种婉转的表述巧妙地改变了遗传学发展史。其实在这场由丹西斯构思的堕胎运动中,医生终止遗传缺陷胎儿继续妊娠并非推动人类遗传学发展的动力。与之相反,人类遗传学将饱受争议的堕胎运动推到台前,然后借助治疗严重先天性疾病改变了人们的“态度”,从而潜移默化地松动了反堕胎运动阵营的立场。丹西斯还认为,任何能够得到确诊的遗传病均可以通过产前检查与选择性人工流产进行干预。“出生权”也可以改写为天生拥有正常基因的权利。
1979年,随着约瑟夫·丹西斯的观点定期在医学文献与流行作品中不断亮相,帕克夫妇决定以提供错误医学意见为由起诉赫伯特·谢森。法院支持了帕克夫妇的主张,并且做出了具有里程碑意义的判决。法官认为:“如果婴儿被确诊为先天畸形,那么父母有权选择是否终止它的生命。”某位评论员曾经指出:“法院的裁决相当于宣布,保护即将出生的婴儿免于(遗传)异常侵害的权利是一项基本社会义务。”

第三章 “干预,干预,再干预”

约瑟夫·丹西斯不仅重塑了历史,同时还宣告了遗传学未来的发展方向。丹西斯主张,每位父母都有责任确保自己的孩子“不会成为社会负担”,或者说防止“遗传缺陷”发生是人类社会的一项基本义务。而任何一位接触过上述宣言的普通读者都能感受到这种重生的呐喊。如果从褒义的角度出发,那么这是优生学在20世纪后期转型的标志。早在1910年,英国优生学家悉尼·韦布(Sidney Webb)就已经在不断强调“干预,干预,再干预”,但是直到60多年后,随着人工流产得到法律认可以及遗传分析科学的逐渐发展,新型优生学作为一种脱胎换骨的遗传“干预”手段才步入正轨。
为了撇清新型优生学与纳粹暴行的关系,支持者们迅速对此做出了正式回应。尽管我们不会忘记20世纪20年代美国推行的优生学政策以及30年代在欧洲进行的各种邪恶运动,但是新型优生学绝对不会采取强迫绝育、强制拘禁以及种族灭绝的手段。没有女性会被遣送到弗吉尼亚州的收容所,也不会再有专案法官用“弱智”“愚钝”与“白痴”来划分人群,当然更不会有将染色体数量作为衡量个人品位标准的行为。新型优生学的支持者坚称,基因检测为胚胎选择奠定了基础,而这种标准化的手段具备客观严谨的特点。基因检测结果与接踵而至的疾病综合征之间存在必然的联系:例如,对于所有先天携带额外21号染色体或是缺少X染色体的儿童来说,他们将会或多或少地表现出某些唐氏综合征或特纳综合征的典型特点。在此需要特别强调的是,国家不会强制孕妇进行产前检查与选择性人工流产,同时不存在任何形式的集中命令,做出上述选择完全取决于个人意志。女性可以自行选择是否进行产前检查以及了解检查结果,即便在知道胚胎异常检查结果为阳性时,依然可以自行决定是否要终止妊娠。此时优生学已经化身为仁慈的象征,其捍卫者则将它称为现代优生学。
现代优生学与传统优生学之间的关键区别在于前者将基因作为选择的基本单位。对于英国的高尔顿、美国的普利迪以及纳粹的优生学家来说,他们认为只有根据表型(身体与精神特征)才能确保遗传选择顺利进行。然而由于这些特征非常复杂,因此想要了解它们与基因的关系并非易事。例如“智力”可能具有一定的遗传因素,但是很明显它是基因、环境、基因—环境交互作用、触发器、概率以及机遇共同作用的结果。因此,期望通过选择智力基因来实现聪明才智的想法并不现实,其难度堪比通过筛选“财富”基因来确保荣华富贵一样。新型优生学的支持者坚持认为,他们与高尔顿和普利迪所采用的方法完全不同,科学家已不再将表型选择作为遗传性状的替代品。现在遗传学家可以通过检查胚胎的遗传组成来获得直接选择基因的机会。
对于现代优生学的众多粉丝来说,它已经摆脱了过去的邪恶烙印并在科学界破茧重生。20世纪70年代中期,其涉及的领域甚至达到了一个前所未有的高度。产前检查与选择性人工流产实现了个体化形式的“消极优生学”,而这也成为某种选择性防治遗传病的手段。当然与之密切相关的“积极优生学”也在努力拓展相同水平的发展空间,并且希望能够从中选择出优良的遗传属性。就像遗传学家罗伯特·辛斯海默(Robert Sinsheimer)所描述的那样:“随着现有主流基因库的规模不断发展,传统优生学的局限性已经有目共睹。从理论上来讲,新型优生学可以按照最优遗传标准来改造人类的所有缺陷。”
1980年,罗伯特·格雷厄姆(Robert Graham)在加利福尼亚州捐资兴建了一座精子库,而这位百万富翁的企业以开发防碎太阳镜著称。使用精子库来储存天才遗传物质的想法显然非常幼稚,然而如果我们从展望未来的角度出发,那么从精子里挑选“天才基因”也是人类非常合理的期待。
在优生学诞生之前,人类只能通过自然选择来实现有益基因型的筛选,同时它也要遵循马尔萨斯与达尔文残酷理论的规律:这里充满了各种形式的生存竞争,同时幸存者的筛选是个缓慢而冗长的过程。克罗写道,自然选择的过程“残酷、愚蠢并且低效”。与之相反,人工遗传选择与基因操作则彰显了“健康、智慧与快乐”。在许多科学家的支持下,各路知识分子、作家与哲学家纷纷投入到这场运动中。其中弗朗西斯·克里克与詹姆斯·沃森都是现代优生学的忠实支持者。美国国立卫生研究院院长詹姆斯·香农(James Shannon)向国会表示,遗传筛查不仅是“医学界的道德义务,更是社会的重要责任”。
当现代遗传学在美国以及国际上蓬勃兴起之时,其创始人开始竭尽全力将这项新兴运动与龌龊的过去做个了断,特别是与带有希特勒色彩的纳粹优生学划清界限。现代优生学家认为,在缺乏科学素养与极端政治路线这两项重大错误的影响下,德国的优生学已经坠入纳粹恐怖的深渊。伪科学被用来支撑伪政权,反过来伪政权也会推动伪科学。但是现代优生学将坚定不移地遵循科学严谨性与选择权相结合的原则,并且将在实际应用时避开这些陷阱。
科学的严谨性能够保证现代优生学不被纳粹优生学的邪恶理论污染。人们在评估基因型的时候将采取严格的科学标准,从而确保整个过程不受来自政府的干扰或命令。同时每一个步骤都要为自主选择留有余地,并且承诺产前检查与人工流产等优生选择完全出自个人意愿。
不过在批评家看来,传统优生学曾经被诟病的重要缺陷如今也同样令现代优生学千疮百孔。人类遗传学曾经为现代优生学的诞生注入了活力,但是对于这门新兴学科最强烈的批评声也恰恰源自这里。马克库斯克与他的同事们逐渐理清了思路,事实上人类基因与疾病之间交互作用的复杂程度要远超出现代优生学的范畴。其中唐氏综合征与侏儒症便是具有典型意义的案例。疾病与健康并不是相互剑拔弩张的敌国,它们其实是不分彼此的亲密邻邦。当然多基因遗传病的临床表现更为复杂,例如常见的精神分裂症和自闭症。如果我们将来有机会重新审视格雷厄姆的天才银行,那么包含所谓特殊基因的优质“天才样本”会在其他条件下成为致病因素吗?(反之亦然:如果“致病”基因变异可以促成天才,那么我们该如何应对呢?)
马克库斯克认为遗传学可以用“多元决定论”来解释,如果该理论肆无忌惮地被应用于人类选择,那么就会导致他所称的“遗传—商业”复合体出现。马克库斯克指出:“艾森豪威尔总统在任期即将结束时对军事—工业复合体的危险性做出了警告。而现在人们也需要对遗传—商业复合体的潜在危害保持清醒的头脑。随着各种用来检测遗传优劣的方法不断涌入市场,商业公司与麦迪逊大道上的推销员都开始紧张地忙碌,他们多少会对选择自身配子(形成受精卵的精子或卵子)孕育后代的夫妻的价值判断产生影响。”
1976年,马克库斯克的担忧似乎很大程度上仍停留在理论阶段。尽管人类中受基因影响的疾病数目还在以指数形式增长,但是其中大部分致病基因的身份尚未得到确认。20世纪70年代末期,基因克隆与基因测序技术横空出世,它们可以从人体中成功识别出上述基因,并且为疾病诊断提供了预测手段。由于人类基因组由30亿个碱基对组成,单个致病基因突变可能只会改变基因组中的某一对碱基,因此对全部基因进行克隆与测序来筛选突变的方法并不现实。为了寻找致病基因,我们需要将目标定位于或局限在基因组中某个较小的范围内。当然这也恰好遭遇现有技术的短板:尽管人体内的致病基因看似数量众多,但是想从浩瀚的基因组中找到它们谈何容易。就像某位遗传学家所描述的那样,人类遗传学正身陷“大海捞针”的窘境。1978年,解决人类遗传学“大海捞针”难题的机缘不期而至,这使得遗传学家能够定位与克隆人类致病基因。而这次巧遇带来的后续发现也成为人类基因组研究的重要转折点。

第四章 基因定位

1978年,两位遗传学家受邀前往位于盐湖城的犹他大学参加研究生论文评审,他们是来自麻省理工学院的戴维·博特斯坦(David Botstein)与斯坦福大学的罗恩·戴维斯(Ron Davis)。就在博特斯坦与戴维斯感觉到索然无味时,突然有一个报告同时引起了他们二人的共鸣。该项目由研究生克里·克拉维茨(Kerry Kravitz)与导师马克·斯科尔尼克(Mark Skolnick)完成,而他们当时正在竭尽全力寻觅引起遗传性血色素沉着症(hemochromatosis)的致病基因。
对于克拉维茨与斯科尔尼克来说,他们要挑战的这个难题尚处于遗传学研究领域的空白。到20世纪70年代中期,人类已经鉴别出成千上万种遗传病,其中就包括血色素沉着症、血友病以及镰刀形红细胞贫血症。不过发现了疾病的遗传属性并不等于确认了真正的致病基因。为了鉴别血色素沉着症基因的位置,克拉维茨与斯科尔尼克设计了一种精妙绝伦的解决方案。寻找致病基因的首要步骤是对染色体上某个特殊的区域进行“定位”:只要在特定染色体上确认了该基因的物理位置,那么便可以运用标准克隆技术完成分离、测序与功能验证。克拉维茨与斯科尔尼克推断,如果想要明确血色素沉着症基因在染色体上的位置,那么他们需要借助基因连锁的属性来进行分析。
现在让我们梳理一下整个实验的思路。假如血色素沉着症基因位于7号染色体,而在同一条染色体上的相邻基因可以决定头发质地(直发、微卷发、卷发以及波浪发)。假设在进化史上某个遥远的时刻,血色素沉着症缺陷基因出现在具有卷发的个体之中。那么父母每次将这个祖先基因遗传给后代时,卷发基因都会跟它一起如影随形:由于上述两个基因位于相同的染色体上,同时此类遗传物质的载体极少出现断裂,因此即便是这两个基因的变异体也不会分离。虽然这种关系可能在一代人中尚不明显,但是在历经几代人之后就可以得出某种统计学模式:该家族中具有卷发的孩子更有可能罹患血色素沉着症。
克拉维茨与斯科尔尼克的研究也得益于这个逻辑推理。通过分析犹他州许多具有错综复杂血缘关系的摩门教徒谱系档案,他们发现血色素沉着症基因在遗传时与某个免疫应答基因连锁,而后者拥有多达几百种变异体。鉴于早期研究已将该免疫应答基因定位于6号染色体,因此这就意味着血色素沉着症基因必定也潜伏在这条染色体上。
细心的读者可能会对此提出异议并且认为以上案例先入为主:血色素沉着症基因碰巧与相同染色体上的某个基因连锁,而该基因既容易辨别又具有高度的变异性状。不过这样的性状确实极为罕见。这种免疫应答蛋白存在多种易于识别的变异体,同时编码该蛋白的基因恰好与斯科尔尼克的目的基因比肩而立,因此这种幸运着实可遇而不可求。如果要使用同样的方法为其他基因定位,那么人类基因组中就需要分布着各式各样容易辨认的标记物,这岂不是相当于在染色体上均匀地设置好明亮的路标吗?
然而博特斯坦心里非常清楚,这种路标很可能就存在于染色体中。在经历了几个世纪的进化之后,人类基因组已经可以让DNA序列产生成千上万个微小的变异。而这些序列变异被称为“多态性”,也就是“多种形式”的意思。实际上它们与等位基因或变异体非常相似,只不过自身并不需要出现在基因中,它们可能就存在于两个基因之间的长段DNA或者内含子中。
20世纪70年代,当博特斯坦与戴维斯首次从酵母菌与细菌基因组中发现DNA多态性时,他们二人还不知道这种现象能有什么用处。与此同时,他们发现人类基因组中也散布少量多态性,不过这些人类变异序列的规模与位置尚不明确。然而就在犹他州的那个上午,博特斯坦在听完克拉维茨的报告后脑海中突然灵光乍现:如果人类基因组中存在上述变异的基因路标,那么只要将某个遗传性状与这种变异连锁在一起,就可以大致确定任意一个基因在染色体上的位置。这种像雀斑一样分布的遗传标记地图潜力巨大,它可以用来绘制反映基因位置的大体解剖图。多态性相当于基因组内部的全球导航系统,我们可以通过某个基因与序列变异的关系实现精准定位。
博特斯坦意识到,定位致病基因的关键步骤不是寻找基因而是要找到目标人群。如果某个人数足够庞大的家族成员携带有任意相同的遗传性状,并且假设该性状可以与散布在基因组中的任意一种变异标记物相关联,那么基因定位的工作将变得易如反掌。对于罹患囊性纤维化的家族成员来说,如果他们全部“共同继承”了某些变异的DNA标记物,并且这些所谓的X—变异体就位于7号染色体的顶端,那么囊性纤维化基因也应该距离此处不远。
1980年,博特斯坦、戴维斯与斯科尔尼克将基因定位的概念发表于《美国人类遗传学杂志》(American Journal of Human Genetics)。博特斯坦写道:“我们为描绘人类基因组遗传图谱提供了新方法。”这项内容古怪的研究隐藏在某本名不见经传的杂志中,字里行间充斥着统计学数据与数学公式,而这不由让人联想起当年孟德尔那篇遗传学经典之作。
由于上述研究的内容非常新颖,因此需要人们逐渐理解其深刻内涵。我之前曾经说过,遗传学发展的关键在于概念转变,其间历经了从统计性状到遗传单位以及从基因到DNA的变迁。如今博特斯坦同样也实现了重要的概念转变,他将染色体描绘成遗传生物特征的人类基因分布图。

1978年,心理学家南希·韦克斯勒(Nancy Wexler)了解到博特斯坦关于基因定位的概念。之所以韦克斯勒会关注此项研究,是因为她自己的亲人曾经深受其害。19世纪70年代,来自美国长岛的乔治·亨廷顿医生首次报道了此类患者,而该病也因此得名为亨廷顿病。
造成亨廷顿病患者预后不良的原因部分在于它起病时间较晚。亨廷顿基因携带者到了三四十岁才发现自己的宿命,而彼时他们已经为人父母。该病就以这种方式躲过了残酷的进化并悄然蛰伏在人体中:自然选择甚至还没来得及清除致病基因,它就已经传递至下一代。由于每位亨廷顿病患者都具有一份正常拷贝与一份突变拷贝基因,因此其子女的患病概率为50%。对于这些孩子来说,他们的生命将陷入一场残酷的赌局。
1979年7月,韦克斯勒来到马拉开波湖。只用了几个月,她就已经整理出一份包含有数百位亨廷顿病患者的名单。在接下来的日子里,韦克斯勒组建了一个包括专业医生与护士在内的团队,他们深入这些零星分布的村落逐一收集患者血液样本。随后这些血样被送往波士顿麻省总医院詹姆斯·古塞拉(James Gusella)与印第安纳大学遗传学家迈克尔·康奈利(Michael Conneally)的实验室。
在波士顿,古塞拉用酶把从血液细胞中提纯出的DNA切断,然后试图找出一个与亨廷顿基因连锁的变异序列。而康奈利的研究小组则对数据进行了统计分析,并且通过量化手段来了解DNA变异与亨廷顿病之间的联系。原本这个三方团队预计工作不会开展得那么顺利,毕竟需要筛选成千上万个多态变异序列,但是他们很快就有了惊人的发现。1983年,也就是在收到血样后仅仅3年,古塞拉的团队碰巧发现一段位于4号染色体的变异DNA与亨廷顿病密切相关。值得注意的是,古塞拉的团队也给一群人数要小得多的美国亨廷顿病患者采集了血样,他们同样在其中发现了4号染色体上与亨廷顿病密切相关的DNA标记。由于上述两个独立人群表现出相似的内在联系,因此可以说该病与遗传关联的事实确凿无疑。
1983年8月,韦克斯勒与古塞拉在《自然》杂志发表论文,他们明确指出亨廷顿基因就位于4号染色体上的一处远端位点—4p16.3。人们对于此处基因组的结构非常陌生,甚至可以说是研究领域的荒野,这里仅发现了少数几个不知名的基因。在遗传学家眼中,这就像是船舶突然搁浅在废弃的滩头,放眼望去却找不到任何可供参考的标志物。
运用连锁分析确定基因染色体定位相当于从外太空观察地球上的某个大都市:虽然该方法可以让基因定位的精确度得到极大提升,但是距离找到真正的基因仍有很长一段路要走。接下来,我们还需要使用更多的连锁标记物来改进遗传图谱,然后逐步将基因定位至最小的染色体区块中。既往粗犷的遗传学研究方法已经落伍,取而代之的是更为精准的全新手段。
基因定位的最后阶段非常烦冗复杂。携带有可疑罪犯基因的染色体片段将被继续细分成节,当这些染色体片段从人类细胞中分离出来后,它们会被嵌入到酵母菌或细菌的染色体中进行克隆。这些完成克隆的染色体片段将接受测序与分析,然后研究人员会对这些经过测序的片段进行基因扫描,从而确定该片段中是否含有潜在基因。研究人员将不断重复与精炼上述过程,其中每个染色体片段都要接受测序与复验,直到在某段单一DNA片段上识别出候选基因为止。检验的终极环节是对正常人与患者体内的同种基因进行测序,并且以此来确定遗传病患者体内该基因片段是否发生改变,可以说该过程就像是挨家挨户搜捕犯罪嫌疑人。
1993年2月某个阴冷的早晨,詹姆斯·古塞拉收到一名资深博士后研究员发来的电子邮件,通篇内容言简意赅:“成功了!”而这也意味着此项研究终于瓜熟蒂落。自1983年古塞拉的团队首次将亨廷顿基因定位于4号染色体开始,他与另外58名科学家为了寻找亨廷顿基因顽强拼搏了10年。他们曾经尝试过各种分离基因的捷径,但却总是无功而返。由于在研究早期阶段爆发出的灵感早已耗尽,因此他们只得沮丧地采取逐个基因筛选的传统方法。1992年,他们逐步聚焦于一个最初被命名为IT15(interesting transcript 15)的基因,随后它被重新命名为“亨廷顿基因”。
尽管亨廷顿基因已经找到,但是其蛋白质的功能仍不为人所知。正常的亨廷顿蛋白质存在于神经元与睾丸组织中,并且大脑在发育时也需要这种蛋白质。然而导致亨廷顿基因发生突变的原因却颇为神秘。正常亨廷顿基因中包含有一段高度重复的DNA序列CAGCAGCAGCAG……而这种单调的重复序列数量平均为17个(某些人为10个,而另一些人可能会达到35个)。亨廷顿病患者体内发现的基因突变十分怪异。镰刀形红细胞贫血症的病因源自蛋白质中的某个氨基酸发生突变,可是在亨廷顿病患者体内,发生突变的部位并不是一两个氨基酸,其原因在于亨廷顿基因重复序列的数量增加,从正常基因中小于35个增长到突变基因中大于40个。重复序列数量增多延长了亨廷顿蛋白的尺寸。此类延长的蛋白质将在神经元中被切割成碎片,并且在细胞内日积月累缠绕成团,这可能是导致细胞死亡与功能障碍的症结。
虽然只是亨廷顿基因中的重复序列的数量发生了改变,但是造成这种奇特“断续”结构的原因却令人百思不得其解。这也许与基因复制时发生的错误有关,DNA复制酶可能在重复序列片段中加入了多余的CAG碱基,就像小孩在拼写单词Mississippi时多写了一个字母s。亨廷顿病在遗传时有一个非常显著的特征叫作“早发”现象:亨廷顿病家族患者体内的重复序列数量将逐代增多,其结果就是致病基因将出现50个或60个重复序列(就像那个出现拼写错误的孩子,还在不停在Mississippi中添加s)。随着致病基因中的重复序列数目与日俱增,亨廷顿病患者的症状将会逐渐加重,同时其家族成员的起病年龄也出现低龄化趋势。研究人员在委内瑞拉甚至发现了年仅12岁的患者,其中某些患者携带的亨廷顿基因含有70个或80个重复序列。

戴维斯与博特斯坦发明的基因定位技术以其在染色体上的物理位置为基础,而这个后来被称为定位克隆的方法也标志着人类遗传学走入新纪元。1989年,该技术被用于鉴定囊性纤维化(这种严重危害人体健康的疾病可以累及肺、胰腺、胆管以及肠道等器官)的致病基因。尽管导致亨廷顿病的突变基因在人群中非常罕见(在委内瑞拉出现的聚集性患者实属例外),但是引起囊性纤维化的突变基因却较为常见:平均每25个欧洲后裔中就有一人携带这种突变。只具有单个突变基因拷贝的个体并不会出现症状。如果两个无症状携带者结为夫妻,那么他们生下的孩子携带两个突变基因的可能性为四分之一。而遗传两份突变囊性纤维化基因拷贝将会导致患者死亡。此外,某些突变基因的外显率接近100%。截至20世纪80年代,携带两份突变等位基因拷贝的青少年平均寿命为20岁。
几个世纪以来,人们一直怀疑囊性纤维化与盐和分泌物异常有关。1857年,瑞士出版了一本有关儿童歌谣与游戏的年鉴,提醒人们要注意那些“眉毛舔起来有盐味”的儿童的健康问题。患有囊性纤维化的儿童会通过汗腺分泌大量盐分,如果把汗水湿透的衣服搭在金属晾衣绳上,那么其对金属产生的腐蚀作用与海水相仿。由于患者肺部排出的分泌物过于黏稠,因此一口痰咳上不来就可以阻塞呼吸道。此外充满痰液的呼吸道也将成为细菌滋生的温床,并且经常会导致患者出现致命性的肺炎,而这也是患者死因中最常见的并发症之一。囊性纤维化的发展过程非常恐怖,患者的身体将淹没在自己排出的分泌物中,他们最终会以悲惨的结局离开人世。
1985年,在多伦多工作的人类遗传学家徐立之(Lap-Chee Tsui)发现了一个“匿名标记”,而这就是博特斯坦在基因组中发现的DNA变异序列,他发现这个DNA标记与突变的囊性纤维化基因连锁出现。虽然上述标记很快就被定位于7号染色体,但是囊性纤维化基因却仍旧迷失在染色体的荒野中。为了寻找囊性纤维化基因,徐立之开始逐步缩小可能的目标区域。随后,密歇根大学的人类遗传学家弗朗西斯·柯林斯(Francis Collins)与同样来自多伦多的杰克·赖尔登(Jack Riordan)也加入了这场围猎。柯林斯对标准基因捕获技术进行了巧妙的改进。以往在进行基因定位时,研究人员通常采用的是染色体“步移”法,也就是按照先后顺序与重叠情况逐个克隆DNA片段。这种传统方法着实耗时费力,就像人们在攀爬绳索时双手不停地在交替换握。而柯林斯采用了染色体“跳查”法,这样他就可以越过染色体上那些不易被克隆的区段。
到了1989年春季,柯林斯、徐立之与赖尔登已经利用染色体跳查技术将几个候选基因锁定在7号染色体上。他们当下的任务就是进行基因测序与身份识别,然后明确导致囊性纤维化基因功能改变的突变位置。柯林斯终于不负众望找到了囊性纤维化基因:患儿体内持续存在两份突变基因拷贝,而他们未患病的父母仅携带一份突变基因拷贝。
囊性纤维化基因可以编码一种协助电解质跨膜转运的分子。该基因最常出现的突变类型是DNA中出现三个碱基缺失,从而导致蛋白质中某个氨基酸(按照基因语言,DNA上的三个碱基编码一个氨基酸)缺失。上述氨基酸的缺失将造成蛋白质功能障碍,无法实现氯离子(食盐就是由氯化钠组成的)的跨膜转运。由于汗液中的盐不能被重新吸收至体内,因此会出现特征性的高盐汗液。同时人体向肠道分泌电解质与水分的功能也出现异常,进而出现各种腹部症状。
对人类遗传学家来说,成功克隆囊性纤维化基因具有划时代的意义。几个月之后,用于检测突变等位基因的诊断试验就闪亮登场了。到了20世纪90年代早期,人们不仅可以对携带者进行突变基因筛查,还可以对子宫内的胎儿进行常规诊断,而这也让父母有机会考虑是否为受累的胎儿实施人工流产,或者能够从孩子身上发现早期囊性纤维化的临床表现。由于“携带者夫妻”的父母都拥有至少一份突变基因拷贝,因此他们可以选择不生育或者考虑领养子女。在过去10年间,随着针对父母的靶向筛查与胚胎诊断得到联合应用,对于那些突变等位基因出现频率最高的人群来说,其先天性囊性纤维化的发病率降低了大约30%~40%。

1971年,伯格与杰克逊构建了第一个重组DNA分子。到了1993年,人们成功分离出亨廷顿基因。现在我们非常有必要将在此期间遗传学实现的转换进行系统梳理。尽管在20世纪50年代末期,DNA已经被确认是遗传学的“主控分子”,但是当时却没有任何手段可以对它进行测序、合成、改变或操作。除了为数不多的几个知名案例以外,人类疾病的遗传基础在很大程度上仍是一个未知数。当时致病基因被明确定位的人类疾病只有寥寥几种,其中就包括镰刀形红细胞贫血症、地中海贫血以及B型血友病。而当时临床上唯一可行的遗传学干预手段就是羊膜穿刺与人工流产。虽然科学家已经从猪内脏与人血中分离出胰岛素与凝血因子,但是没有人能利用基因工程制造出治疗疾病的药物。人类基因从来不会主动在人类细胞以外的地方进行表达。为了实现改变生物体基因组的目的,人们可以采用引入外源基因或者使内源基因发生突变的方法,而它们产生的影响要远远超出任何其他技术所能达到的范围。如果我们查阅那个年代出版的牛津词典,那么根本找不到“生物技术”一词。
仅仅20年之后,遗传学就发生了巨大的变化:人类已经实现了基因的定位、分离、测序、合成、克隆与重组。与此同时,基因还可以进入细菌细胞与病毒基因组,并且用于生产治疗疾病的药物。就像物理学家与历史学家伊夫林·福克斯·凯勒(Evelyn Fox Keller)所说描述的那样:一旦“分子生物学家(发现)可以让他们操纵(DNA)的技术”,那么他们就会“总结出某种专业知识,并且彻底改变我们认为‘先天’永恒不变的历史观”。
“传统观点认为,‘先天’来自遗传,而‘后天’在于培养。现在看来二者的角色可以发生互换……对我们来说,控制前者(即基因)比控制后者(即环境)更为简单,并且可以让这些遥不可及的目标变得近在咫尺。”
1969年,就在遗传学发生巨大变革的10年到来前夕,遗传学家罗伯特·辛斯海默发表了一篇关于未来的随笔。他认为掌握合成、测序与操纵基因的能力开启了“人类历史上的新纪元”。
“有些人可能会嘲笑这种说法,他们或许觉得这不过是当年制造完美人类的旧梦重温。尽管终极目标的确如此,但是其内涵已经日渐丰满。旧梦中的完美人类总是受限于自身与生俱来的缺陷与瑕疵……我们现在发现了另外一种捷径,也可以说是一种千载难逢的机遇,能够让人类超越20亿年来生物进化所创造的奇迹,然后创造出梦寐以求的完美世界。”
然而也有科学家在展望这场生物学革命时并没有表现得那么乐观。1923年,遗传学家J. B. S.霍尔丹曾经说过,只要人类掌握了控制基因的能力,那么“所有信仰、价值观以及制度都将岌岌可危”。

第五章 基因组时代

其实科学技术史与航海史也存在相似之处,它们的突破性进展往往都是以两种形式呈现的。其中一种是规模上的改变,许多重要进展不过是得益于尺寸或者范围的改变(就像某位工程师做出的形象比喻,登月火箭就是径直飞向月球的大型喷气式飞机)。而另一种则是概念上的转换,通常这类进展都是由某种全新的概念或想法引起的。实际上,这两种形式非但不会相互排斥,反而还能彼此巩固。规模改变促进了概念的转换,而新概念又对规模产生了新的诉求。显微镜为人类打开了微观世界的大门,从而让细胞与细胞器的结构尽收眼底,并且引发了人们对于细胞解剖学与生理学的关注,但是为了理解亚细胞区室的结构与功能,我们需要功能更为强大的显微镜。
从20世纪70年代中期到80年代中期,遗传学领域已经见证了许多概念的诞生,其中就包括基因克隆、基因定位、断裂基因、基因工程以及基因调控新模式,但是在规模层面并没有发生任何根本性的改变。在过去10年间,科学家已经完成了成百上千个基因的分离与测序,并且可以根据它们的功能特点对其进行克隆,然而反映细胞生物全基因组的综合目录尚未完成。从理论上说,虽然全基因组测序技术已经问世,但是纷繁复杂的测序过程却令科学家们望而却步。
成功分离致病基因使得开展全面测序的必要性显得格外迫切。从20世纪90年代早期开始,完成重要人类基因的定位与测序令大众媒体欢呼雀跃,但是遗传学家与患者却对这些烦冗拖沓的过程深感忧虑。蠕虫生物学家约翰·萨尔斯顿曾经指出:“尽管有许多优秀的科学家都在寻觅人类致病基因,但是他们那些纸上谈兵的理论知识不过是徒劳。”萨尔斯顿担心,这种逐个辨别基因的方法将使研究工作陷入停滞。
詹姆斯·沃森曾经谈起“单基因”遗传病研究中遇到的挫折。“到了20世纪80年代中期,即便我们已经掌握了功能强大的重组DNA技术,但是依然无法分离大多数疾病的致病基因。”沃森希望能够从头到尾完成整个人类基因组30亿个碱基对的测序。其中不仅包含全部已知的人类基因(全部遗传密码、调控序列、内含子与外显子),还涉及所有基因之间的长段DNA序列与所有编码蛋白质的片段。全基因组序列将为今后发现的基因提供注释模板:例如,如果遗传学家发现了某种使乳腺癌风险增加的新型基因,那么通过与基因组主序列进行比较就应该能破译出该基因的精确位点与对应序列。而且全基因组序列也可以为异常基因(例如突变基因)提供“正常”模板来进行注释——通过对比患病女性与健康女性体内的乳腺癌相关基因,遗传学家们就有可能找出致病的突变基因。

除此之外,开展人类全基因组测序的动力还来自其他两个方面。虽然单基因测序方式在囊性纤维化与亨廷顿病等单基因病的研究中大获成功,但是大多数常见的人类疾病并非由单基因突变引起。它们不仅是遗传病,更是基因组病:这些疾病涉及多个基因并且影响到整个人类基因组,而它们才是决定患病风险的重中之重。我们无法通过研究单一基因的作用来理解上述疾病的本质,只能通过分析多个独立基因之间的相互关系来进行诊断或预测。
众所周知,癌症是典型的基因组病。医学界在一个多世纪前就将其认定为遗传病。到了20世纪70年代末期,也就是在德·戈维亚提出“遗传因子”概念整整一个世纪后,科学家们开始集中意识到,癌症是正常细胞生长调控基因发生突变的结果。由于这些基因在正常细胞生长过程中发挥着强大的调节作用,因此皮肤创面在自愈后会停止生长从而避免形成肿瘤(我们也可以使用基因语言来表述:基因将会告诉创面细胞生长或者停止的时间)。遗传学家意识到,癌细胞中的这些调控通路已经在某种程度上遭到破坏。其中启动基因与终止基因会出现功能障碍,而维护细胞代谢与完整的基因也将难以维系,最终导致细胞生长失控。
其实癌症就是这种内源性遗传通路改变的结果。就像癌症生物学家哈罗德·瓦默斯(Harold Varmus)所言,癌症是“对正常自我的扭曲”。这种疾病的蔓延趋势令人极为不安:科学家曾经在过去的数十年里心存期待,希望将某些细菌或者病毒之类的病原体与癌症发生联系起来,并且可以通过注射疫苗或抗菌治疗来治愈该病。然而癌基因与正常基因之间的亲密关系形成了针对癌症生物学的挑战:当细胞在未受干扰的情况下正常生长时,如何让突变基因恢复到原有的“开放”或“关闭”状态?无论从过去到现在,医学界都始终将上述目标作为治疗癌症的努力方向,它不仅承载着人们长期以来的梦想,同时也是癌症治疗过程中的最大障碍。
正常细胞可以通过四种机制发生致癌突变。首先,突变可能源自环境危害,例如吸烟、紫外线或者X射线,它们均能攻击DNA并改变其化学结构。其次,细胞在分裂过程中产生的自发错误将导致突变(每次DNA在进行胞内复制时都有可能会出现小概率错误,例如,碱基A可能会转变为碱基T,G或C)。第三,癌基因可以遗传自父母,从而导致遗传性癌症综合征,例如具有家族遗传特点的视网膜母细胞瘤与乳腺癌。第四,病毒是专业的基因载体,它可以携带基因进入细胞并且在微生物世界内完成基因互换。最终,上述四种原因将导致相同的病理过程——控制细胞生长的遗传通路出现异常活化或者失活,最终导致细胞分裂失去正常调节并且开始恶性增殖,而这也就是癌细胞的与众不同之处。
作为人类历史上最为常见的疾病之一,癌症涉及生物学中两个最为重要过程的改变绝非偶然:癌症发生沿袭了遗传学与进化论的逻辑理念,同时也是孟德尔与达尔文理论的病理性交集。癌细胞在经过突变、生存、自然选择与增殖后实现了永生,它们还通过基因将恶性指令传给子代细胞。20世纪80年代早期,生物学家意识到,癌症是一种“全新”概念的遗传病,其结果是遗传、进化、环境与概率交互作用的产物。
但是到底有多少种基因参与了某种常见癌症的发生过程呢?其致病基因是一个、一打还是一百个呢?20世纪90年代末期,约翰·霍普金斯大学的癌症遗传学家伯特·福格尔斯泰因(Bert Vogelstein)做出了一项惊人之举,他决心要创建一个涵盖几乎全部人类癌症相关基因的综合索引目录。福格尔斯泰因发现,癌症发生是个循序渐进的过程,它由细胞内各种各样的突变积累而成。随着基因突变不断出现,正常细胞开始向癌细胞转变,最终导致调控增殖的生理功能走向失控。对于癌症遗传学家来说,这些数据清楚地表明,单次单基因测序将无法满足研究、诊断或者治疗癌症的需求。遗传多样性差异巨大是癌症的基本特征之一:假设某位女性双侧乳房均发生乳腺癌,那么在同期采集的标本中基因突变谱可能会大相径庭。这些肿瘤的临床表现、进展速度以及化疗反映也各不相同。为了掌握癌症的发病机制,生物学家需要对整个癌细胞基因组进行分析。
如果癌症基因组测序(并非针对个别癌基因)对了解其生理机能与遗传多样性必不可少,那么我们应该首先完成正常人类基因组的测序工作。而人类基因组就可以作为癌症基因组的正常对照。只有明确了正常或“野生型”基因的结构,我们才能准确识别出基因突变的类型。如果没有正常DNA序列模板作为参照,那么我们根本无法解决那些基本的癌症生物学问题。

遗传性精神病与癌症的相似之处在于它们都涉及多基因突变。在休伯蒂惨案发生7个月之后,某项由美国国家科学院(NAS)主持的大型研究结果证实了精神分裂症与遗传因素的关系。
对于遗传学家来说,这种遗传模式隐含着影响疾病遗传的重要线索。假设精神分裂症是由单个显性基因的高度外显突变引起的,如果同卵双胞胎中的某一个遗传了突变基因,那么另一个也必将携带这个基因。于是这两位都将表现出疾病症状,并且他们之间的一致率应该接近100%。异卵双胞胎与其他兄弟姐妹有一半的可能会遗传该基因,因此他们之间的一致率应该降为50%。
现在我们假设精神分裂症并非单基因病而是多基因病。我们可以把大脑的认知区域看作某台复杂的机械引擎,它需要通过中心轴、主变速箱、数十个小活塞以及垫片来对功能进行调节与优化。如果中心轴断裂或变速箱卡顿,那么整个“认知引擎”就会崩溃。该比喻也可以用来说明重症精神分裂症患者的认知变化过程:少数控制神经传导与发育的基因发生了高度外显突变,它们相互协同可以导致中心轴与变速箱彻底崩溃,从而使患者产生严重的认知缺陷。因为同卵双胞胎遗传了相同的基因组,所以上述突变基因也趁势进入他们的体内。由于这些突变基因的外显率较高,因此同卵双胞胎的患病一致性仍将接近100%。
我们现在也可以假设一下,如果只是几个小垫片、火花塞与活塞出现异常,那么认知引擎也会发生故障。可是在这种情况下,引擎并不会完全失灵,它可能会发出噼里啪啦的声响。当然其功能障碍也可能与所处的环境有关,例如引擎在冬季的表现都会较差。以此类推,我们就可以推出轻症精神分裂症的发病机制。虽然此类疾病受到多种突变基因的影响,但是每种突变基因的外显率都较低,就这些功能类似于垫片、活塞与火花塞的基因来说,它们对于认知的整体机制发挥着更为精妙的调控作用。
这些道理同样也适用于同卵双胞胎。他们彼此都拥有相同的基因组,并且遗传了导致精神分裂症(分为五种类型)的全部基因,但是由于其外显不全,而且触发器容易受到环境影响,因此同卵双胞胎的发病一致率可能会下降到30%~50%。相比之下,异卵双胞胎与兄弟姐妹之间只有几个突变基因相同,根据孟德尔定律,异卵双胞胎与兄弟姐妹遗传全部致病突变基因的概率极低。异卵双胞胎与兄弟姐妹之间的发病一致率也将大幅度下降至5%~10%。
其实这种遗传模式在精神分裂症患者中极为常见。由于同卵双胞胎之间的一致率为50%,也就是说,如果双胞胎之中的一个受到影响,那么另一个双胞胎受到影响的概率为50%,因此该结果清晰地表明某些触发器(环境因素或随机事件)对于遗传倾向起到了重要作用。但是,如果父母是精神分裂症患者,孩子在出生后就被无精神分裂症病史的家庭收养,那么这个孩子仍有15%~20%的患病风险,大约是普通人群患病风险的20倍。以上结果说明,尽管环境因素发生了重大改变,但是遗传因素自发产生的影响仍然具有强大的力量。所有这些发病模式均证实,精神分裂症是一种复杂的多基因病,它涉及多种基因的突变且临床表现扑朔迷离,同时潜在的环境因素或者随机触发器也会对疾病产生影响。就像癌症以及其他多基因病一样,通过单次单基因分析根本无法揭示精神分裂症的奥秘。

20世纪80年代,美国民众对于暴力犯罪的关注正在持续发酵。人们不仅期待着基因组研究可以揭示疾病的奥秘,而且还希望它能够阐明社会弊病(例如出轨、酗酒、暴力、腐败、堕落、毒瘾等)产生的原因。

虽然公众对于开展人类基因组测序已经翘首以待,但是为这项计划举办的首次协调会却令人泄气。从表面上来看,阿尔塔会议没有取得任何成果。参会的科学家们意识到,20世纪80年代中期兴起的测序技术还不具备定位人类基因组中突变基因的能力。但是这次会议却成为启动全面基因测序的关键转折点。本次会议上公布了一系列最新的研究成果,而这也让基因组测序突然间从技术上变得触手可及。
经过长时间的内部辩论后,各执己见的双方最终达成了一致,他们决定先从蠕虫与果蝇等结构简单的生物体基因组入手。这些项目将根据研究对象被命名为蠕虫基因组计划或果蝇基因组计划,参与实施的科学家则会对涉及的基因测序技术进行微调。与此同时,人类基因的测序工作也将同步进行。在总结简单基因组测序经验教训的基础上,人们开始向错综复杂的人类基因组测序进发。而这项对整个人类基因组进行全面测序的宏伟工程最终被命名为人类基因组计划(Human Genome Project)。

第六章 基因地理学家

从客观角度来讲,人类基因组计划所取得的第一个成果与基因毫无关系。1989年,当沃森、津德与同事们正在全力以赴筹备人类基因组计划时,美国国立卫生研究院一位名不见经传的神经生物学家克雷格·文特尔(Craig Venter)却提出了基因组测序的捷径。
文特尔实现快速基因组测序的秘诀就在于大幅精简原有的步骤。尽管人类基因组由许多基因组成,但是其结构大部分为非编码序列组成。这种存在于基因之间的序列被称为基因间DNA,它就像是连接加拿大小镇之间绵延不绝的高速公路。菲尔·夏普与理查德·罗伯茨已经证实,基因的编码序列并不是连续排列,那些介于它们之间的非编码序列被称为内含子。
对于基因间DNA与内含子来说,它们就是编码序列之间的间隔序列与间插序列,本身并不编码任何蛋白质信息。某些DNA序列所包含的信息可以决定基因表达的时间与空间,它们负责编码基因调控开关的启动与终止,而其他序列所编码的功能尚不得而知。我们可以把人类基因组的结构用以下例句进行说明:
This.........is the......str...uc......ture... , , , ...of...your...( ...gen ... ome...) ...
其中每个单词对应基因编码序列,省略号对应间隔序列与间插序列,偶尔出现的标点符号则代表基因调控序列的界限划分。
文特尔在测序时首先要忽略掉的就是人类基因组中的间隔序列与间插序列。他认为,既然内含子与基因间DNA并不携带编码蛋白质的信息,那么为何不聚焦于编码“活性”蛋白质的片段呢?在对测序步骤进行反复精简之后,他大胆提出,如果只对基因组中的某些序列进行测序,那么将可能加快完成上述活性片段评估的进程。文特尔在论证了这种基因片段测序法的可行性后,开始应用该方法对脑组织中数以百计的基因片段进行测序。
如果我们把前述英文例句比作基因组的结构,那么文特尔就是通过搜寻例句中的单词片段(struc,your与geno)来完成基因组测序。虽然采用这种方法可能无法了解整句话的内容,但是或许能从中得到足以了解人类基因关键要素的信息。
文特尔发明的“基因片段”测序法令沃森都感到震惊。毫无疑问,这种方法使用起来更加方便且成本非常低廉,但是对于许多遗传学家来说,通过该方法得到的基因组信息支离破碎。不同观点之间的矛盾日趋激化。1991年夏季,当文特尔的团队正致力于脑组织中基因片段的测序工作时,美国国立卫生研究院的技术转让办公室与文特尔联系商讨新基因片段的专利问题。对沃森来说,这种不和谐的局面令他感到十分尴尬:现在看来,美国国立卫生研究院的研究人员正在分裂为两个阵营,其中一派在为申请新基因片段的专利而努力,而另一派却希望将测序结果免费开放。
1992年6月10日,文特尔厌倦了无休止的争吵,他离开美国国立卫生研究院成立了自己的私人基因测序机构。文特尔起初将其命名为基因组研究所(Institute for Genome Research),但是他随即就敏锐地发现了这里面的问题:基因组研究所的缩写为IGOR,而这恰巧与科学怪人手下那个长着斗鸡眼的邪恶管家同名。于是文特尔将其改名为The Institute for Genomic Research,英文缩写为TIGR。
根据媒体报道宣传,或者说至少在学术期刊层面,TIGR取得了非凡的成就。文特尔与贝尔特·福格尔斯泰因以及肯·凯泽等杰出科学家合作,他们共同发现了某些与癌症相关的新基因。除此之外,文特尔还一直奋斗在基因组测序工作的最前沿。他对外界的批评格外敏感,当然对此也会予以强有力的反击。
虽然文特尔使用的方法是既往在脑组织中采用的基因片段测序法的延续,但是这次基因组测序研究却标志着某种重要的转折。在本次试验中,他将会使用类似霰弹枪的装置将细菌基因组击碎成为上百万个小片段。接下来,他将随机选取数十万个片段进行测序,然后利用片段之间的重叠序列将其组装,并且最终得到整个基因组的序列。而我们将再次使用英文例句对此进行说明,假设需要通过下列单词片段来构成某个完整的单词:stru, uctu, ucture, structu以及ucture,那么计算机可以根据其重叠部分拼出完整的单词:structure。
综上所述,该测序方法有赖于重叠序列的存在:如果单词片段之间不存在重叠部分,或者说其中某些片段已经缺失,那么都将无法拼出正确的单词。尽管如此,文特尔依然坚信他可以借助这种方法来粉碎并重组大多数基因组。此类方法非常像童谣中矮胖子采取的招数:为了完成拼图,他让国王的手下充当里面的零件。虽然自从20世纪80年代起,基因测序的开拓者桑格就已经使用过这种“鸟枪法”测序,但是文特尔对流感嗜血杆菌基因组的测序堪称该方法应用史上最为大胆的尝试。1993年冬季,文特尔与史密斯启动了流感嗜血杆菌基因组测序项目。到了1995年7月,这项创举就已经大功告成。在众人眼中,上述项目的顺利完成简直就是个奇迹!

当文特尔在TIGR进行细菌基因组测序工作时,人类基因组计划却经历了剧烈的内部变化。1993年,沃森与美国国立卫生研究院的负责人吵得难解难分,随后他辞去了项目负责人的职务。这个位置很快由来自密歇根大学的遗传学家弗朗西斯·柯林斯接替,而他为人们熟知的工作就是曾于1989年成功克隆了囊性纤维化基因。如果人类基因组计划没有选择柯林斯的话,那么其后续的发展可能就会陷入泥潭,没有人比他更适合来引领该项目克服困难并且勇往直前了。
对于人类基因组计划的早期领导者而言,逐步克隆法是完成基因组装唯一路径。兰德是一位由数学家转型而来的生物学家,他对鸟枪法测序的反感可以表述为一种审美观的厌恶。他喜欢通过分段的方法来完成基因组测序,而该过程就像是在解决代数问题。兰德担心,文特尔的方法难免会在基因组测序时留下遗漏。兰德问道:“假如你将某个单词拆分成字母,那么还能保证还原这个单词吗?如果你能找到构成该词的所有片段,或者每个片段之间都有重叠部分,那么这种方法也许还说得通。但是一旦某些字母丢失了又该怎么办?”你可能会根据现有的字母拼出某个与原意截然不同的单词,例如,假设原词是“profundity”,可是你只找到了“p...u...n...y”这几个字母。
与此同时,公共基因组计划的支持者也担心这些半成品会带来假象:如果在测序中有10%的基因组序列被忽略,那么人们将永远无法得到完整的基因组。兰德后来说道:“人类基因组计划的真正挑战并不是测序工作的启动,而是如何完整地实现基因组序列测定……如果在基因组测序过程中留下遗漏,同时又给公众造成已经实现的假象,那么人们就会对于基因组测序计划失去信心。尽管科学家们也会对此表示祝贺,然后一身轻松地回去继续其他工作,但是基因组的序列草图将永远停滞在现阶段。”
逐步克隆法不仅需要大量资金与基础设施的投入,而且更需要从事基因组研究的科学家具有锲而不舍的精神。

1998年5月,春风得意的文特尔再次做出了重大决定。尽管TIGR推出的鸟枪测序法已经取得了无可争议的成功,但是文特尔却对研究所的组织架构感到不满。随后文特尔成立了一家新公司,专注于人类基因组测序工作。文特尔将新公司命名为Celera(塞莱拉),取自“accelerate”(加速)的缩写。

1998年12月,蠕虫基因组项目取得了决定性的胜利。在约翰·萨尔斯顿、罗伯特·沃特森(Robert Waterson)以及其他研究人员的共同努力下,他们采用逐步克隆法(也就是人类基因组计划支持者所认可的方法)完成了整个秀丽隐杆线虫基因组的测序工作。
如果说流感嗜血杆菌基因组完成测序曾让遗传学家们欣喜若狂,那么作为多细胞生物代表的蠕虫基因组亮丽登场才值得人们顶礼膜拜。虽然蠕虫要远比流感嗜血杆菌复杂,但是它与人体结构却有许多相似之处。蠕虫的身体由口部、消化道、肌肉以及神经系统(甚至还有原始的大脑)组成,它们具有触觉与感觉并且能够移动。蠕虫会转动头部躲避有害刺激,而且它们彼此之间还存在着社交关系。蠕虫可能会在食物耗尽后表现出焦虑,也可能在交配时感到短暂的快乐。
秀丽隐杆线虫基因组由18891个基因组成。其体内36%的编码蛋白质与人体蛋白质相类似,而剩余的大约10000个基因与已知的人类基因毫无关系。上述10000个基因为蠕虫所特有,或者说其中蕴含着某种特殊的含义,它们仿佛在提醒人们对于自身基因了解程度的匮乏(事实上,人们后来发现其中许多基因都与人类基因同源)。值得注意的是,只有10%的蠕虫编码基因与细菌中发现的基因结构相似,其余90%的线虫基因组专注于构建复杂的生物体结构。该事实再次验证了进化创新的伟大作用,而单细胞祖先需要经过数百万年的演化才能形成多细胞生物。
就像人类基因一样,单个蠕虫基因也可以拥有多种功能。与之相反,多个蠕虫基因也可能具有相同的“功能”。
如果我们发现了一万种新型蛋白质,那么它们具有的功能绝对会超过一万种,而这种现象足以证实该项目的与众不同之处。但是蠕虫基因组最引人注目的特征并不是蛋白质编码基因,而是能够转录成RNA信息(不是蛋白质)的基因数量。由于这些基因不能编码蛋白质,因此它们被称为“非编码”基因。尽管它们分布在基因组的各个角落,可是却会聚集于特定染色体上。这些“非编码”基因的数量从几百到几千各不相同。我们已经掌握了某些非编码基因的功能:例如细胞器中体型巨大的核糖体就是蛋白质合成的场所,其中还有可以协助制造蛋白质的特殊RNA分子。其他非编码基因还包括最终被证实可以编码某种名为“microRNA”的小RNA,它们在调控基因表达时具有强大的特异性。尽管如此,多数非编码基因的神秘功能时至今日仍不得而知。虽然这些基因不是暗物质,但是它们却笼罩在基因组的阴影下。即使遗传学家发现了此类基因,人们也难以明确理解其功能或意义。
然而什么是基因呢?1865年,当孟德尔在研究中首次发现“基因”时,他只知道这是一种令人匪夷所思的现象:它是以离散状态进行代际传递的决定因素,并且可以左右生物体的外在性状或者表型,例如花的颜色或豌豆种子的质地。接下来摩尔根与穆勒通过证实基因是位于染色体上的物质结构加深了人们的感性认识。随后埃弗里根据其化学形态确认DNA就是遗传信息的载体。而沃森、克里克、威尔金斯和富兰克林最终解开了基因的分子结构之谜,它是由两条互补配对的DNA链组成的双螺旋结构。
20世纪30年代,比德尔与塔特姆在研究基因的作用机制时发现,它可以通过改变蛋白质的结构来“发挥作用”。接着布伦纳与雅各布发现了信使RNA这种中间体分子,它在遗传信息翻译成蛋白质的过程中扮演着至关重要的角色。莫诺与雅各布则引入了基因的动态概念,其中信使RNA就像是附着在基因上的调控开关,并且可以通过其数量增减来启动或关闭相应基因。
成功实现蠕虫全基因组测序使基因概念的内涵得到了发扬光大。虽然生物体中某个基因可以对应某种功能,但是单个基因却可以对应多种功能。基因不能直接发出合成蛋白质的指令,它首先要转录为RNA而不是蛋白质。基因结构未必由连续的DNA片段组成,它可能会被非编码序列分成不同的区域。此外,基因上还附着调控序列,它们会与编码基因保持距离。
全基因组测序为人类开启了通向有机生物学未知世界的大门。它就像一部内容浩瀚的百科全书,其中的词条必须不断更新。现在基因组测序已经颠覆了传统的基因概念,甚至从某种意义上说也改变了基因组本身的意义。

1998年12月,《科学》杂志专刊登载了秀丽隐杆线虫基因组的测序结果,而本期杂志的封面就是一条毫米级别的线虫,该文一经发表便得到了科学界的广泛好评,当然这也是对于人类基因组计划强有力的辩白。在蠕虫基因组测序完成后几个月,兰德自己领导的团队也传来了好消息:人类基因组计划已经完成了四分之一的测序工作。
2000年3月,《科学》杂志在另外一期专刊上发表了果蝇基因组的测序结果,其封面采用了1934年完成的一幅以雌雄果蝇为题材的版画。即便是鸟枪测序法最坚定的反对者也不得不为这些数据的质量与深度所震撼。虽然鸟枪法在测序时遗漏了某些重要的序列,但是果蝇基因组的关键片段依然可以保持完整。如果将人类、蠕虫以及果蝇的基因进行比较,那么就会发现某些惊人的相似之处。在已知的289个人类致病基因中,有177个(超过60%)可以在果蝇体内找到同源序列。由于果蝇体内没有红细胞且不能形成血栓,因此并未发现与镰刀形红细胞贫血症和血友病相关的基因。目前研究人员已经在果蝇基因组内发现了与结肠癌、乳腺癌、泰伊—萨克斯二氏病、肌肉萎缩症、囊性纤维化、阿尔茨海默病、帕金森病以及糖尿病相关的基因或者同源序列。虽然长着四条腿与一对翅膀的果蝇经历了数百万年的进化,但是它与人类却享有共同的核心通路与遗传网络。就像威廉·布莱克在1794年的作品中描述的那样,小巧的苍蝇“就像我一样”。
众所周知,基因组的大小并不是决定性因素,因此数量有限的果蝇基因却令人感到非常困惑。与那些具有丰富经验的果蝇生物学家的预期相反,果蝇基因组只有区区13601个基因,比线虫的基因数量少了5000个。但是果蝇通过数量有限的基因就构建出了结构更为复杂的生物体,它不仅具有雌雄交配、繁衍后代、生老病死与代谢酒精的特征,同时还拥有痛觉、嗅觉、味觉、视觉与触觉等功能,并且与人类一样渴望夏季成熟的瓜果。鲁宾曾经说过:“我们从果蝇基因组研究中获得了启示,生物体的基因数量与其复杂性并不成正比。人类基因组……很可能就是果蝇基因组的放大版……此类复杂特征的进化轨迹从本质上讲是一个循序渐进的过程,而这些交互作用的结果起源于结构相似基因在时空上的隔离。”
就像理查德·道金斯所描述的那样:“所有动物都具有结构相似的蛋白质库,它们随时处于待命状态……”下面我们举例说明复杂生物体与简单生物体之间的区别,“人类与线虫之间的差异并不在于基因数量的多少,而是生物体能否在千变万化的环境中发挥基因错综复杂的功能”。如果将果蝇基因组比作德尔斐之船,那么船体的大小并不是主要问题,关键在于船板的连接方式。

2000年5月,塞莱拉与人类基因组计划之间的竞争已经到了白热化的程度,它们都希望能够率先发布人类基因组序列草图。此时文特尔接到了美国能源部的朋友阿里·帕特里诺斯(Ari Patrinos)的电话,而之前帕特里诺斯已经邀请弗朗西斯·柯林斯晚上到自己家里小聚。一周之后,文特尔与柯林斯在帕特里诺斯位于乔治敦的家的地下娱乐室见了面。对于文特尔、柯林斯与帕特里诺斯来说,在阿里·帕特里诺斯家地下室进行的会面是他们之间进行的首次磋商。在随后的三个星期里,柯林斯与文特尔经过深思熟虑制定了发布联合声明的日程:克林顿总统将首先致辞,接着是英国首相托尼·布莱尔表态,随后柯林斯与文特尔将会发表演讲,最终塞莱拉与人类基因组计划将分享人类基因组测序竞赛的并列冠军。白宫方面旋即在知晓双方态度的基础上要求迅速确定日期,而文特尔与柯林斯在征得各自团队的同意后将时间定在2000年6月26日。
2000年6月26日上午10:19,克林顿总统在白宫接见了文特尔与柯林斯,他在众多科学家、记者与外国政要面前宣布人类基因组“初步测序”首战告捷(事实上,无论是塞莱拉还是人类基因组计划均未完成测序工作,但是两大阵营共同发表联合声明将具有象征性意义;即便白宫宣布了基因组“初步测序”成功的消息,但是塞莱拉与人类基因计划的科学家仍然在计算机前夜以继日地工作,他们正在努力将完成测序的基因片段组装成为有实际意义的基因组)。英国首相托尼·布莱尔则在伦敦通过卫星转播参加了本次会议。此外在观众席就座的还有诺顿·津德、理查德·罗伯茨、埃里克·兰德以及哈姆·史密斯,当然还有身着纯白西装的人类基因组计划首任负责人詹姆斯·沃森。

与众多停战协定一样,文特尔与柯林斯之间的约定几乎从达成伊始就面临着危机。在某种程度上,他们二人之间的冲突仍集中在既往的争论上。虽然基因专利申请能否得到受理尚不明确,但是塞莱拉已经决定将收取测序项目订阅费作为盈利模式,而其付费对象就是相关领域的科研人员与制药公司(文特尔机敏地察觉到,大型制药公司可能会根据基因序列来研发新药,尤其是针对某些特殊蛋白质的靶向药)。此外文特尔还希望能够在《科学》杂志这本重量级刊物上发表文章,但是这就需要塞莱拉将遗传图谱告知天下(科学家不应在公开发表论文的同时还坚持为实验数据保密)。可想而知,沃森、兰德与柯林斯均对塞莱拉企图名利双收的行为进行了尖锐抨击。文特尔曾经对某位采访者说道:“我最引以为荣的成就当属被商界与学术圈嫉恨。”与此同时,人类基因组计划也遇到了技术瓶颈。就在采用逐步克隆法完成了大部分测序工作之后,这项计划也需要解决把基因序列组装成遗传图谱的难题。虽然该任务从理论上看来并不复杂,但是实际操作中的计算量却非常庞大,更何况某些重要序列在测序过程中会出现缺失。由于克隆与测序手段并不能涵盖基因组的每个角落,因此组装非重叠片段要远比预料中复杂得多,这个过程就好比是在组装一幅残缺不全的拼图。于是兰德又额外招募了一批科学家来帮忙。
由于部分人类基因组充满了奇怪的相似重复序列,因此塞莱拉也在基因序列组装时陷入了窘境。就像文特尔所描述的那样:“仿佛迷失在拼图游戏中那片广阔的蓝天里。”尽管负责组装基因组的计算机学家们马不停蹄地工作,并且尽力将完成测序的基因片段进行有序排列,但是组装好的基因组中仍有部分序列不知所踪。
到了2000年冬季,随着塞莱拉与人类基因组计划即将完成,两大阵营之间的蜜月期也走到了尽头。
2001年2月15日与16日,人类基因组计划联盟与塞莱拉的文章分别在《自然》与《科学》杂志上发表。上述论文均是内容丰富的长篇巨著,并且几乎占据了这两份杂志的全部篇幅(人类基因组计划撰写的文章大约有66000字,成为《自然》杂志有史以来刊登过的最长论著)。每部科学著作都是各自时代的写真,而发表在《自然》杂志上的文章在开篇就充分认识到了其所处的历史时刻:
“20世纪初,孟德尔遗传定律的重新发现指明了探索科学之路,而这也让人们对于上个世纪推动生物学发展的遗传信息性质与内容产生了浓厚的兴趣。从此以后,遗传学发展逐渐演化为四个阶段,大约每隔25年就会上一个台阶。“在第一阶段,染色体被正式确认为遗传学的细胞基础;到了第二阶段,DNA双螺旋结构成为遗传学跨入分子时代的里程碑;而在进入第三阶段后,遗传学已经驶入信息高速路的轨道(例如遗传密码)。同时人们还发现了细胞读取基因中遗传信息的机制,并且根据重组DNA技术实现了遗传物质的克隆与测序。”
这篇文章在结尾之处断言,完成人类基因组测序标志着遗传学从此晋级“第四阶段”。“基因组”时代已经悄无声息地降临,我们将对包括人类在内的所有生物体基因组进行评估。然而这样将再次陷入哲学悖论的迷局:智能机器能否破译控制其自身的指令手册呢?虽然我们已经获得了完整的人类遗传图谱,可是如何进行破译、读取以及理解应另当别论。

第七章 人之书(共23卷)

人类基因组由3088286401个碱基对组成(该数字前后出入不大,而最新的估算结果是32亿个碱基对)。

  • 假如将人类基因组比作以标准字体印刷的图书,那么该书的内容将仅由ATGC这四个字母循环往复组成:……AGCTTGCAGGGG……它们会按照碱基配对的原则无限延伸下去,而本书的页数也将达到150万页以上,是《大英百科全书》的66倍。
  • 人体大多数细胞具有23对(46条)染色体。大猩猩、黑猩猩与猩猩等类人猿细胞则具有24对染色体。当人类进化到达某个节点时,猿类祖先体内两条中等大小的染色体会发生互相融合。几百万年前,人类基因组彻底从猿类基因组中分离出来,它们随着时间推移获得了新的突变与变异。虽然人类少了一对染色体,但是却从此脱颖而出。
  • 人类基因组共编码大约20687个基因,其数量仅比蠕虫多1796个,比玉米少12000个,比水稻或小麦少25000个。当然“人类”与“早餐谷物”之间的区别不在于基因数量多少,而在于其细胞内部基因网络的复杂性。也许我们在数量上不占优势,但是却懂得发挥到极致。
  • 人类基因组极具创新性。它可以把复杂问题简单化。它能在特定的时间与空间内激活或抑制某些基因,并且根据时空变化为每个基因匹配独特的环境与搭档,从而利用有限的基因库演化出无限的功能。此外,在外显子的作用下,单个基因可以获得比基因谱系本身更为复杂的多样性。对于基因调控与基因剪接这两种方法来说,它们在人类基因组中的应用要远比其他物种广泛得多。基因具有数量庞大、类型多样以及功能繁杂的特征,因此诠释人类复杂性奥秘的关键就在于基因组的创新性。
  • 人类基因组时刻处于动态变化中。在某些细胞中,基因通过对自身序列进行重排来构建新型突变体。免疫系统细胞可以分泌“抗体”,而这些像导弹一样的蛋白质将附着在入侵的病原微生物上。但是由于病原体在不断变化,因此抗体也必须随之改变,而这些变化多端的病原体需要机体做出及时调整。基因组可以通过对遗传物质进行重排获得令人惊奇的多样性(例如,利用s...tru...c... t...ure与g...en...ome可以重排出c...ome...t这个新词)。而经过重排后的基因能够产生抗体多样性。在这些细胞中,基因组可以通过重排生成完全不同的基因组。
  • 某些基因的功能着实无懈可击。例如,在第11号染色体上,有一条专门用于嗅觉感知的通路。该基因簇由155个基因组成,其编码的蛋白质受体就是嗅觉传感器。每个受体都会与某种结构独特的配体结合,而它们之间的关系可以用锁和钥匙的关系来形容,并且最终在大脑中生成各种各样的嗅觉,例如,薄荷、柠檬、香菜、茉莉、香草、姜或是辣椒的味道。这是一种精密的基因调控方式,它将确保从上述基因簇中选择某个气味受体基因,然后使该基因在位于鼻子的嗅觉神经元中表达,于是我们就可以区分出成千上万种不同气味。
  • 然而令人不解的是,基因在基因组中所占的比例非常小。基因组序列的绝大部分(98%)是由大量散布在基因之间(基因间DNA)或者基因内部(内含子)的DNA片段组成。这些长段的间插DNA序列并不编码RNA或蛋白质:它们存在于基因组中的意义可能与调控基因表达有关,当然还可能有某些我们尚不了解的原因,或者说它们本身没有任何作用(也就是所谓的“垃圾DNA”)。假如把基因组比喻成为横跨大西洋连接北美洲与欧洲之间的交通线,那么基因就是散落在狭长幽暗水域中星罗棋布的小岛。而即便它们首尾相连也无法与加拉帕戈斯群岛中最大的岛屿相媲美,更不用说日本东京市内蜿蜒曲折的地铁路线了。
  • 人类基因组铭刻着历史。在很久以前,某些特殊的DNA片段就已经嵌入人类基因组,而它们中的部分成员来自古代病毒,并且自那时起已经被动地传承了成千上万年。其中某些DNA片段曾经能够在基因与生物体之间灵活地“跳跃”,但是现在大多数此类片段已经失活或者沉默。它们就像生活中无处不在的旅行推销员,永远藏在我们的基因组里无法移动或剔除。这些DNA片段的规模要远远超过基因的数量,从而产生了人类基因组的另一个重要特征:人类基因组中的大多数DNA片段并非人类特有。
  • 人类基因组中的DNA序列具有高度重复性。例如,Alu是一个由300个碱基对组成的重复序列,虽然它在基因组中的拷贝数可能达到数百万份,但是这个神秘序列的起源、功能及意义仍然不得而知。
  • 人类基因组中包含有数量庞大的“基因家族”,这些基因在结构与功能上具有相似性,它们紧密排列在一起形成基因簇。某些染色体上200个密切相关的基因可以形成基因岛,它们可以编码“同源基因”家族成员,并且在决定胚胎的命运、身份与结构、体节形成以及器官分化中起着重要作用。
  • 人类基因组中还存在成千上万的“假”基因,这些曾经发挥作用的基因现在已经丧失功能,也就是说它们现在并不能编码蛋白质或者RNA。这些灭活基因的序列散落在基因组中,看上去就像海滩上饱经风霜的石子。
  • 正是基因组携带的海量信息造就了人类的千姿百态。虽然人类与黑猩猩和倭黑猩猩的基因组一致性高达96%,但是人类与这些灵长目动物相比却有着天壤之别。
  • 1号染色体上的第一个基因可以编码鼻子中的嗅觉蛋白(又是那些无处不在的嗅觉基因)。而基因组中最后一个基因位于X染色体上,它可以编码某种用来调节免疫系统细胞间交互作用的蛋白。(染色体编号只是人为设定的结果,而1号染色体因其长度独占鳌头而得名。)
  • 染色体的末端存在“端粒”这种结构。端粒就像是鞋带末端的塑料绳花,这些DNA序列可以保护染色体免于磨损与退化。
  • 尽管我们已经掌握了遗传密码(即单个基因携带的信息如何构建蛋白质)的奥秘,但是我们对于基因组密码(即基因组中的多个基因如何根据时空变化来协调基因表达,然后实现构建、维护以及修复人体的功能)几乎一无所知。遗传密码的作用机制一目了然:DNA经转录后生成RNA,随后RNA通过翻译来合成蛋白质,同时DNA中的三个连续碱基对可以对应蛋白质中的某个氨基酸。相比之下,基因组密码的作用机制十分复杂——附着在基因上的调控序列携带有决定基因表达的时空信息。我们并不了解某些基因位于基因组特定位点的原因,也不清楚基因间DNA片段如何调控基因的生理功能。因此我们可以用山外有山来形容这种错综复杂的关系。
  • 人类基因组能够根据环境变化产生化学标记,并且构建出某种特殊的细胞“记忆”模式(该理论尚需要进行深入研究)。
  • 虽然神秘莫测的人类基因组容易受到外界影响,但是它却具有强大的适应性与重复性,从而令其在遗传学研究中傲视群雄。
  • 人类基因组进化的脚步从未停歇,我们可以从中发现历史遗留的蛛丝马迹。
  • 人类基因组的功能以生存为导向。
  • 人类基因组就是我们自身的写照。

第五部分 镜中奇遇——遗传一致性与“常态”(2001─2015)

第一章 “不分彼此”

社会学家埃弗里特·休斯(Everett Hughes)曾经以某种嘲讽的口吻评论道,医学只是通过“镜像书写”的方式来感知世界。纵观人类生物学的主要历史,镜像书写在推进基因研究发展的过程中功不可没,我们可以通过鉴别异常或者突变基因来发现相关疾病,其中的典型代表就包括囊性纤维化基因、亨廷顿基因以及与乳腺癌发病相关的BRCA1基因。在生物学家看来,基因的命名简直就是荒诞不经。令人不解的是,果蝇体内无翅基因的真正功能是编码构建翅膀的指令,而这与该基因的字面含义完全相反。科学作家马特·里德利(Matt Ridley)曾经评论过囊性纤维化基因(或者简称CF)的命名:“这种方法简直就像用疾病来命名人体器官一样荒谬,例如,使用肝硬化、心肌梗死与中风来替代我们习以为常的肝脏、心脏与大脑。”
随着人类基因组计划的横空出世,遗传学家彻底摆脱了对镜像书写的依赖。目前完成的综合目录已经涵盖了人类基因组的每个角落,同时人类在此过程中也创造出直接洞悉遗传学奥秘的工具,从此再不需要利用病理学标准来划定正常生理学的边界。1988年,美国国家研究理事会(NRC)在一份关于基因组计划的文件中对其未来做出了重要预测:“DNA序列编码不仅决定了学习、语言与记忆等智力要素,它们还构成了人类社会的文明基础。除此之外,这些序列还可以编码众多致病或增加疾病易感性的突变与变异,并且让人类在漫长的历史中饱受苦难的折磨。”
思维敏捷的读者可能已经注意到,上面这两句话对于新兴学科发展方向的判断释放出了双重信号。传统的人类遗传学研究主要关注病理学改变,其核心无外乎那些“影响人类健康的疾病”。但是随着研究工具与方法的日新月异,现在遗传学已经可以在生物学的世界里自由翱翔,其研究重点早就从病理改变跨越至生理功能。这门新兴学科能够帮助人类领悟历史、语言、记忆、文化、性别、身份以及种族的变迁。此时此刻,它正怀揣着伟大的梦想扬帆起航,努力成为反映健康、身份与命运常态的科学。
与此同时,遗传学研究方向的转换也预示着基因的故事将要随之发生变化。到目前为止,虽然从基因到基因组计划的旅途中各种概念与发现层出不穷,但是它们整体的演化规律还是以年代为主线展开的,因此本书内容的组织结构也是按照历史沿革的顺序进行设计。但是当人类遗传学的重点由病态转为常态后,墨守成规已经无法满足这门学科多维度发展的渴求。遗传学所关注的焦点已经深入生物学的各个角落,其中就包括种族、性别、性、智力、气质与人格等因素,而它们之间的组织结构彼此迥异却又相互重叠。
就在基因研究所覆盖的领域不断扩展时,我们对于其带来的影响也有了更加清晰地认识。由于通过基因来解决人类常态的尝试未必能够一帆风顺,因此遗传学也不得不直面历史中某些颇为棘手的科学与道德难题。

为了理解基因到底在人类进化中发挥了何种作用,我们或许应该从基因在人类起源中的角色开始入手。19世纪中期,那时候人类遗传学尚未问世,但是人类学家、生物学家与语言学家经常就人类起源问题争得不可开交。1854年,出生于瑞士的博物学家路易斯·阿加西斯(Louis Agassiz)成为人类起源多祖论最积极的倡导者。
1859年,阿加西斯的多祖论遭到了达尔文《物种起源》的挑战。然而即便是阿加西斯也不得不承认,多祖论所面临的挑战已经从“单一个案”上升至大量证据确凿的事实。1848年,在德国尼安德河谷(Neander Valley)的某个石灰石采石场,工人们偶然间挖掘出了一个外形奇特的头骨。研究人员根据最初发现这些原始人的地点将其命名为尼安德特人(Neanderthal)。
起初,许多科学家都相信尼安德特人就是现代人类祖先的代表,它们的出现弥补了从猿类到人类进化链中的重要一环。但是到了20世纪70年代到80年代,尼安德特人作为人类祖先的假设被推翻,取而代之的是一种更为新颖的理论,它认为早期现代人类曾经与尼安德特人同时存在。按照修正后的“进化链”演示图,人类进化并非按照从长臂猿猴、大猩猩、尼安德特人到现代人的顺序进行,它们应该全部起源于某个共同的祖先。
其实我们的真正祖先可能来自较为接近的克罗马农人,他们有着与现代人相似的解剖学特征,例如头颅狭小、面部扁平、眉弓中断与下颌轻薄(严格来说,克罗马农人应该被称为欧洲早期现代人类,或者EEMH)。这些早期现代人至少在欧洲部分地区与尼安德特人存在交集,并且很有可能与他们相互争夺生产资料、食物以及领地。根据这种说法,我们可以认为尼安德特人曾是现代人祖先的邻居与对手。某些研究证据显示,现代人的祖先曾经与尼安德特人交配,并且在争夺食物与生产资料的过程中使他们走向灭绝。尽管我们的祖先与尼安德特人曾朝夕相处,但是最终还是将他们送上了不归之路。

但是尼安德特人与现代人之间的差别又让我们回到问题的起点:人类的历史有多长?我们到底从何而来?20世纪80年代,加州大学伯克利分校的生物化学家艾伦·威尔逊开始用遗传学工具来解答这些问题。其实威尔逊的实验设计思路简单明了。假设你突然来参加某场圣诞晚会,可是却与在场主宾素不相识。就在上百位男女老少齐聚一堂觥筹交错时,主持人突然宣布要开始做一个游戏:你需要按照家庭、亲缘与血缘来给这群人进行分类。你非但不能询问他们的名字或年龄,而且还要被蒙上双眼,无法根据长相或举止来建立谱系图。
然而上述问题对于遗传学家来说却易如反掌。尽管上述问题貌似难以回答,但是基因与突变却为此提供了捷径。总而言之,任意两个家族成员之间的辈分差异与他们之间的基因多样性呈正比。威尔逊意识到该技术不仅可以分析家族成员之间的差异,而且还适用于整个生物界种群的研究。我们可以根据基因变异来绘制亲缘关系图,然后通过基因多样性来判定谁是物种中最古老的种群:部落成员的基因多样性越高,这个部落的历史也就越久。
通过了解基因组携带的信息,威尔逊几乎可以预估任意物种的生存年代,但是这种方法也有美中不足的地方。假如基因变异全部由突变产生,那么威尔逊的方法当然无懈可击。但是威尔逊知道,绝大多数人类细胞都含有两个基因拷贝,它们可以在配对染色体之间发生“交叉互换”,并且将以这种替代方式产生变异与多样性。毫无疑问,此类基因变异产生的途径将会动摇威尔逊研究的说服力。为了构建完美的遗传谱系,威尔逊需要找到一段不受基因重排与交叉互换影响的DNA片段,而它就隐藏在基因组的角落里经受着突变累积作用的考验,并且最终成为调控遗传物质的完美分子时钟。
然而他在哪里才能找到此类基因片段呢?聪慧过人的威尔逊提出的解决方案令人耳目一新。尽管绝大多数人类基因储存在细胞核中的染色体内,但是线粒体这种用于产生能量的亚细胞结构却是一个例外。线粒体自身的微型基因组只包含有37个基因,大约是人类染色体上基因数目的六千分之一。(某些科学家提出,线粒体起源于某些侵入单细胞生物的古代细菌。这些细菌与单细胞生物形成了某种共生关系:它们可以为单细胞生物提供能量,同时利用细胞环境来获取营养、新陈代谢以及自我防卫。而停留在线粒体内的基因也随着这种古老的共生关系保留下来。研究显示,与人类染色体基因相比,人类线粒体基因与细菌基因的组成更为接近。)
线粒体基因组几乎不会发生重组,它们只会以单拷贝形式存在。由于线粒体基因突变得到完整的代际传递,并且在岁月磨砺的过程中不会发生交叉互换,因此线粒体基因组就成为理想的基因计时员。最为关键的是,威尔逊发现这种年代重建的方法完全独立且不受任何偏倚的影响:人们根本无须参考化石记录、语言谱系、地层数据、地图信息或是人类学调查的结果。对于人类来说,基因组中铭刻着物种进化发展的历史,而这就好比钱包里永远放着一张包含所有祖先的全家福照片。
1985年至1995年间,威尔逊与他的学生们摸索出了将此类技术用于人类样本(1991年,威尔逊因白血病去世,此后由他的学生们继续其未竟的工作)检测的方法,而人们通过这些研究结果可以得出三项重要结论。首先,当威尔逊测量了人类线粒体基因组的整体多样性后,他发现其多样性非常之低,甚至还不如同等级别的黑猩猩线粒体基因组。换句话说,现代人的历史本质上比黑猩猩的历史更短且同源性更强(虽然在我们眼中,所有黑猩猩看起来都大同小异,但是在具有分辨能力的黑猩猩眼里,反倒是所有人类都长得不分彼此)。根据推算,人类的历史大概只有20万年左右,而这在漫长的进化历程中不过是沧海一粟。
随着基因测序与基因注释技术的发展,遗传学家对于上述分析方法进行了改进,其应用领域也不再局限于线粒体基因组突变,而是扩展到来自全球数百个人类种群中成千上万的个体。
2008年11月,来自斯坦福大学的路易吉·卡瓦利—斯福扎(Luigi Cavalli-Sforza)、马库斯·费尔德曼(Marcus Feldman)与理查德·迈尔斯(Richard Myers)组织召开了一场研讨会,他们在会上宣布已经从全世界51个亚种群中的938名个体身上获取了642690个基因变异体。而我们根据上述结果得出了人类起源中第二项重要结论:现代人的祖先似乎均生活在地球上一处非常狭小的区域里,其具体位置就在撒哈拉沙漠以南地区的某个地方。现代人出现于距今约10万至20万年前,随后他们向北部与东部迁徙并在中东、欧洲、亚洲与美洲定居下来。费尔德曼写道:“人类越是远离非洲大陆,其基因变异就会越少。这种模式与源出非洲的理论相吻合,即首批现代人大约在10万年前离开非洲,他们以跳跃的方式分布到世界各地。每当某个分支离开种群去开辟新的领地时,他们只会带走总群基因多样性中的一小部分。”
历史最悠久的人类种群(这些人类种群的基因组变异既丰富多彩又历史悠久)是分布于南非、纳米比亚与博兹瓦纳的桑族人(San tribes),以及生活在刚果伊图里(Ituri)森林深处的姆布蒂俾格米人(Mbuti Pygmies)。相比之下,最“年轻”的人类种群则是来自北美洲的原住民。在距今约1.5万年到3万年前,他们离开欧洲后穿越白令海峡的冰裂来到阿拉斯加的苏厄德(Seward)半岛。这种人类起源与迁徙的理论得到了化石标本、地质数据、出土工具以及语言模式的佐证,同时也被绝大多数人类遗传学家充分认可。该理论后来被称为“源出非洲”学说(The Out of Africa Theory),或“晚近源出非洲”模型(The Recent Out of Africa Model。“晚近”反映了现代人进化历程的跌宕起伏,其首字母缩写ROAM也可以理解为漫步,它似乎是一段情意绵绵的告白,诉说着源自人类基因组深处那段历经沧桑的岁月)。
现在我们需要借助某些概念来加深对于第三项重要结论的理解。假设卵子与精子完成受精形成了单细胞胚胎,那么该胚胎的遗传物质分别源自父体基因(来自精子)与母体基因(来自卵子)。但是构成胚胎的细胞质却全部来源于卵细胞,精子只不过是某种光鲜亮丽的雄性DNA运载工具,或者也可以把它描述成为活蹦乱跳的基因组。除了蛋白质、核糖体、营养物质与膜结构之外,卵细胞还为胚胎提供了一种名为线粒体的特殊结构,其作用就相当于细胞中的能量工厂。由于其解剖结构各异且功能上高度专一,因此细胞生物学家将它们称为“细胞器”,也就相当于细胞内的迷你器官。我们曾经在前面提到,人类的23对染色体(大约包含21000个基因)均位于细胞核内,但是携带有独立微型基因组的线粒体却位于细胞质中。
胚胎线粒体全部源自母系的现象具有重要意义。无论男性还是女性,所有人类的线粒体只能从母亲那里继承,而线粒体来源又可以追溯至她们的母亲,并且沿袭着某条绵延不绝的血脉延伸至无限遥远的过去。(女性细胞里携带有未来全部后代的线粒体基因组。具有讽刺意味的是,假如世界上真的存在某种“缩微人”的话,那么构成它们身体的物质必定源自女性,而从技术上来看,这不就是“女性缩微人”吗?)
现在假设某个部落由200位女性组成,且她们每人都只有一个孩子。如果某位女性的孩子恰好是个姑娘,那么她将把线粒体基因组传给女儿,然后再由女儿传给外孙女。但是如果她的后代中只有儿子没有女儿,那么这位女性的线粒体谱系就会陷入绝境并且从此消失(由于精子的线粒体不能遗传给胚胎,因此男性无法将线粒体基因组遗传给自己的后代)。在部落进化过程中,成千上万的线粒体的谱系将在意外落入绝境后被清除出局。那么问题的症结来了:如果某个物种的缔造人群规模非常小,那么具有母系血统的人群数量将随着时间延长而持续萎缩,并且最终会在种群中变得无足轻重。如果这200位部落女性中有半数的人只有一个儿子,那么将有100种线粒体谱系受制于男性遗传的窘境并会从下一代中消失,而剩下一半女性的线粒体谱系也将止步于其男性后代并以此类推。当经过几代人之后,所有该部落后代的线粒体祖先都可能会指向某几位女性。
对现代人类来说,每个人的线粒体谱系均可以追溯至某位女性。而作为我们这个物种的母系祖先,她应该生活在距今20万年前的非洲大地。尽管其亲缘关系与生活在博茨瓦纳或纳米比亚的桑族女性最为接近,但是我们并不知道她到底长什么样子。我发现这种众生之母的概念可以令人产生无尽的遐想,而她在人类遗传学研究中被称为线粒体夏娃(Mitochondrial Eve)。

1994年夏季,我在读研期间突然对于免疫系统的遗传起源产生了兴趣,于是从肯尼亚沿着东非大裂谷来到津巴布韦,然后穿过赞比西河盆地进入南非平原。整个行进的路线恰好与人类进化之旅相反。本次旅途的终点位于南非某处的不毛之地,这里距离纳米比亚与博茨瓦纳的距离大致相等,曾经是某些桑族部落居住的地方。
只需稍加想象,我们就能以这座饱经沧桑的台地为起点来重建人类历史。现在将时钟拨回到20万年前,那时有某个早期现代人的种群开始在此处栖身,当然也可能是在附近某个环境与之相似的地方(进化遗传学家布伦娜·亨、马库斯·费尔德曼与莎拉·蒂什科夫曾经指出,人类迁徙的起源地位于更靠西部的纳米比亚海岸附近)。事实上我们对于这个古老部落的文化习俗一无所知。他们没有留下包括工具、绘画以及洞穴在内的任何手工制品,但是却将基因这种最具价值的遗产永久融入人类的血脉中。
这个种群的规模似乎非常有限,大约不超过6000人到1万人,按照现代标准来看的话简直是微不足道。另有学者曾经估计其人数可能最多只剩下700人,甚至无法与居住在某个街区或者村庄的人数相比。线粒体夏娃可能就生活在他们之中,她应该至少有一个女儿与一个外孙女。虽然我们并不了解该部落成员停止与其他原始人杂交的具体时间与原因,但是他们从大约20万年前开始出现相对排他性并且仅在彼此之间交配。(诗人菲利普·拉金曾经写道:“我的性生活始于1963年。”与之相比,他已经落后了大约20万年。)而出现上述情况的原因可能与天气变化、地理障碍以及谈情说爱有关。
就像现在大部分初来非洲大陆旅行的年轻人一样,当年人类祖先的迁徙路线也是从这里先向西部进发然后再转向北部的。尽管我们现在描述的人类迁徙路线貌似简单明了,但是在实际过程中却并非像地理分布那样简单。研究结果发现,某些早期现代人种群曾经返回了撒哈拉地区,而那时的撒哈拉还是一片郁郁葱葱,到处是密布的湖泊与河流。他们闯入当地的类人种群中,与其共存甚至发生杂交,并且可能在进化中产生了回交。就像古人类学家克里斯托弗·斯特林格(Christopher Stringer)描述的那样:“这对现代人意味着……某些现代人比其他种群拥有更多的古老基因。由于在现实中也似乎确实如此,因此这就导致我们再次提出疑问——现代人究竟源自何方?在接下来的一两年里,某些颇具吸引力的研究课题将重点关注尼安德特人的DNA……科学家在看到这些DNA时也许会情不自禁地发问——难道它们有什么功能吗?它真的会在尼安德特人体内发挥作用吗?它会对大脑、解剖以及生理等方方面面产生影响吗?”
尽管人类迁徙之路充满艰辛,但是这场长征依然在继续。在当时的自然环境下,还从来没有人能够漂洋过海。我们无从知晓究竟是什么力量让他们穿越了海峡,也不知道他们通过什么方式到达了彼岸。与此同时,另有学者提出了人类迁徙的多扩散理论,他们认为某些较小的灾难事件会贯穿人类历史的不同年代。某项主流理论显示,历史上至少出现过两次独立的横渡事件。其中最早的横渡发生在13万年前。当时移民们由中东出发,他们沿着海岸线穿越亚洲抵达印度洋,随后又南下来到缅甸、马来西亚与印度尼西亚。而第二次横渡发生在距今较为接近的6万年前左右。这些移民北上进入欧洲,他们在那里邂逅了尼安德特人。由于上述两种迁徙路径都以也门半岛为枢纽,因此这里才是真正的人类基因组“大熔炉”。
毋庸置疑,能够在这种冒险跨海横渡中幸存的人寥寥无几,也许只剩下不足600名男女老幼。无论我们的祖先经历了何种艰难险阻,最终他们还是遍布欧洲、亚洲、大洋洲以及美洲的各个角落,而历史的脚步也在人类的基因组中留下了独特的印迹。从遗传学角度来说,我们的祖先为了获得空间与资源走出非洲,他们之间的亲缘关系要比以前我们所想象的更为紧密。其实人类彼此就是同舟共济的兄弟。

那么人类进化史对于种族与基因有何意义呢?其实这些故事蕴含的内容非常丰富。首先它提醒我们,人种分类本身是个有先天局限性的问题。政治学家华莱士·塞尔(Wallace Sayre)讽刺地说道,学术争论的赌注几乎可以忽略不计,而它们之间的较量往往非常险恶。按照相同的逻辑,我们在对种族问题展开激辩之前也许应该先明确一点,那就是人类基因组的变异程度微乎其微,甚至要比许多其他常见物种都要低(例如,人类基因组要比黑猩猩基因组的变异程度低)。由于人类作为物种在地球上存在的时间并不长,因此我们之间的相似之处要远胜于不同之处。人类的蓬勃发展是进化推动的必然结果,甚至于我们的祖先都没有机会偷吃到禁果。
然而即便是那些新兴物种也拥有自己独特的历史。众所周知,基因组学具有强大的分析能力,它可以将基因组按照相似程度进行分类。假如我们希望在种群中发现可供识别的特征,那么其前提是这些特征自身就存在与众不同之处。我们只要仔细观察就不难发现,人类基因组变异不仅具有地域分布的特点,而且还符合传统的种族界限。由于任何基因组都铭刻有祖先的烙印,因此通过研究个体遗传特征就能够精确地指出其所属地区、国别、省份甚至是部落。可以肯定的是,基因组技术已经成为鉴别这些细微差异的典范。但是假如这就是人们理解的“种族”,那么其概念不仅经受了基因组时代的考验,并且还在此期间得到了发扬光大。
对于种族歧视来说,它并非通过遗传特征来推断种族分类,而是通过种族分类来判断遗传特征。种族歧视不是根据肤色、发质或者语言来判别人们的祖先或者起源。这个问题涉及生物系统学,其中涵盖了谱系、分类学、人种地理学以及生物鉴别等内容。尽管你可以根据相关信息做出推断,但是基因组学能够让上述结果的准确性大为提升。你也可以在审视任意个体的基因组后,对于其祖先或发源地提出自己的真知灼见。然而目前争议最大的领域在于其逆命题:假如你已经知道了某人的种族身份,例如非洲人或者亚洲人,那么你能推断出该个体的特征吗?这里的特征并不仅局限于皮肤或者头发的颜色,它还包括了更为复杂的人类功能,例如智力、习惯、个性与天赋。基因无疑能够反映种族的信息,但是种族能够诠释基因的信息吗?
为了能够回答这个问题,我们需要掌握遗传变异在不同种族之间的分布情况。种内或种间的遗传多样性到底孰高孰低呢?如果我们已知研究对象是来自非洲与欧洲的后裔,那么这会改变人们对于其遗传性状、个人属性、身体素质与智力水平的认识吗?还是说由于非洲人与欧洲人的种内变异巨大,以至于其种内多样性在进行比较时占据了主导地位,因此根本没有必要将他们分为“非洲人”或“欧洲人”呢?
其实现在我们对于这些问题已经有了明确的量化答案。许多学者曾经尝试过使用定量手段来研究人类基因组的遗传多样性。最新研究结果显示,绝大多数遗传多样性(85%~90%)就发生在这些所谓的种族内部(例如亚洲人或非洲人),而仅有极少部分(7%)发生在种族之间[早在1972年,遗传学家理查德·莱旺顿(Richard Lewontin)就已经计算出近似的分布结果]。当然有些基因的确在不同种族或族群间存在巨大差异,例如常见于加勒比黑人与印度人中的镰刀形红细胞贫血症,以及经常发生在阿什肯纳兹犹太人中的泰伊—萨克斯二氏病。但是在大多数情况下,种内遗传多样性会超过种间遗传多样性,并且将会始终占据着主导地位。其实种内变异性的程度会使“种族”失去鉴别的意义:根据遗传学对“种族”的定义来看,由于来自非洲的尼日利亚人与纳米比亚人彼此“迥然各异”,因此将他们划分为同类简直是无稽之谈。
对于种族与遗传来说,基因组是衡量它们之间关系的黄金标准。尽管利用基因组可以推测X染色体或者Y染色体的来源,但是即便掌握了A或B的身份却依然无法让你知晓其基因组的详情。或者说每个人的基因组都携带有个体祖先的印记,可是根据个体种族血统却无法反映基因组的奥秘。你可以给某位非洲裔美国人进行DNA测序,然后判定他的祖先是否来自塞拉利昂或尼日利亚。但是如果此人的曾祖父来自塞拉利昂或尼日利亚,你却说不出来这个人到底有什么特别之处。此时,遗传学家可以感到志得意满,种族主义者则铩羽而归。
就像马库斯·费尔德曼与理查德·莱旺顿指出的那样:“种族分类已经失去了在生物学领域的价值。对于人类物种而言,将个体进行种族划分不会对遗传分化产生任何影响。”1994年,斯坦福大学遗传学家路易吉·卡瓦利—斯福扎发表了一项具有划时代意义的研究结果,其内容涉及人类遗传学、迁徙与种族之间的关系。卡瓦利—斯福扎将种族划分问题描述为“缘木求鱼”,他认为文化仲裁的作用要远大于遗传分化的驱使。“至于何时停止这种划分完全取决于人们的主观意识……虽然我们可以从种群中辨别出这些‘群体’的差异……‘但是’不同水平的聚类均会影响划分方式的选择……因此从生物学角度来讲,我们这种做法并不具备充分的依据。”卡瓦利—斯福扎继续说道,“进化学对于此类现象的解释非常简单。种群中存在巨大的遗传变异,而出现这种情况与其规模大小无关。当然遗传变异发生需要经过漫长岁月的积累,因为大多数‘遗传变异’出现在大陆分裂之前,有些甚至可能发生于物种出现前50万年左右……所以并没有充裕的时间来形成显著差别。”
最后这段描述实际上是对遗传学发展史上那些谬论的反驳:其中就包括阿加西斯与高尔顿、19世纪的美国优生学家以及20世纪的纳粹遗传学家。尽管遗传学于19世纪释放出了科学种族主义的幽灵,但是幸运的是基因组学终于将它重新降伏。就像电影《相助》(The Help)里描述的那样,非洲裔美国人女佣爱比(Aibee)直截了当地对白人梅·莫布利(Mae Mobley)说:“其实我们本质相同,只不过肤色有别。”
1994年,就在路易吉·卡瓦利—斯福扎有关种族与遗传的综述问世同年,另外一部描写种族与基因的前卫作品也让美国社会陷入了极度的焦虑。《钟形曲线》(The Bell Curve)这本畅销书由行为心理学家理查德·赫恩斯坦与政治学家查尔斯·默里(Charles Murray)合著。就像《时代周刊》杂志评论的那样:“这部有关阶级、种族与智力的作品极具煽动性。”《钟形曲线》让我们看到基因与种族的概念在是非曲直面前的无奈,同时也感受到这些涉及遗传与种族的内容能够在当前社会引起的强烈反响。
赫恩斯坦不愧是策划社会舆情的行家里手:1985年,他在《犯罪与人性》这部引起广泛争议的作品中声称,犯罪行为与个体的先天特征(性格与气质)密不可分。仅仅过了10年,《钟形曲线》又在人们的思想领域掀起了惊涛骇浪。默里与赫恩斯坦提出,智力不仅主要依赖先天(也就是遗传),并且其水平在不同种族之间参差不齐。总体来说,白人与亚洲人的智商(IQ)较高,而非洲人与非洲裔美国人的智商较低。默里与赫恩斯坦认为,这些“智力水平”的差异是非洲裔美国人社会与经济地位落后的主要原因。之所以这些非洲裔美国人会落后于时代发展,并不是因为美国的社会契约机制有系统性缺陷,而是因为他们自己的心智结构存在根本问题。
为了便于理解《钟形曲线》这部著作的观点,我们首先需要明确作者对于“智力”的定义。不出所料,默里与赫恩斯坦刻意选用了一种狭义智力的定义,而这又把我们带回到19世纪计量生物学与优生学的时代。我们应该不会忘记,高尔顿与他的追随者们曾经痴迷于进行智力测量。在1890年至1910年间,欧洲与美国学者设计了几十种不同的测试手段,他们希望能够找到某种准确的定量方法来测量智力。1904年,英国统计学家查尔斯·斯皮尔曼(Charles Spearman)注意到这些测试手段均具有一种相同的重要特征:如果人们在某项测试中取得良好结果,那么他们在其他测试中也会有同样的表现。斯皮尔曼根据此类正相关现象进行了大胆地猜测,他认为这些测试手段中存在某种神秘的共同因素。他指出该因素本身并不是知识,而是获取与掌握抽象知识的能力。斯皮尔曼将其称之为“一般智力”并用字母g来表示。
到了20世纪早期,g因素已经引发了公众的无限遐想。首先,它令早期的优生学家十分着迷。斯坦福大学的心理学家路易斯·特曼是美国优生运动的狂热支持者,他于1916年发明了一套可以快速定量评估一般智力的标准化测试手段,并且希望通过该方法为人类优生事业筛选出聪明伶俐的个体。特曼意识到其测量结果在儿童生长发育阶段会受到年龄的影响,因此他提出了一种全新的度量方法来量化分年龄智力。如果某人的“心理年龄”与他(她)生理年龄相一致,那么其智商就被定义为100。如果心理年龄小于生理年龄,那么其智商就小于100;如果心理年龄大于生理年龄,那么其智商就大于100。
在第一次与第二次世界大战期间,数字智力测试也曾被用于满足战争的需要。例如在新兵接受作战任务之前,人们希望能够对他们的技能迅速做出定量评估。当老兵于战争结束后重返平民生活时,他们将发现自己的生活完全被智力测试主宰。到了20世纪40年代早期,这些测试已经成为美国文化不可或缺的一部分。智商测试被广泛用于求职排名、学生择校以及特工招募。在20世纪50年代,美国人通常会把他们的IQ值写在简历上,并且会为应聘工作提交某项智力测试的结果,甚至还可能根据测试结果来选择配偶。当年在“健康婴儿大赛”上展览的婴儿身上都标明了自己的IQ(但是如何给两岁的孩子测量智商仍然存疑)。
由于后续段落的内容也将涉及智力的概念,因此我们需要注意它在修辞与历史转换中的角色。一般智力(g)最初只是被用来反映特定条件下特定人群智力测试结果之间的统计相关性。然而在人类先天具有获取知识的能力这一假设的支持下,它逐渐演变为“一般智力”的概念。随后为了满足战争的需求,它又被加工整理以“智商”的形式出现。如果我们从文化的角度理解,那么g的定义可以被视为一种微妙的自我强化现象:那些拥有高智商的人仿佛天生就是“智者”,并且他们会被赋予进行智力质量测定的权力,因此这些人会不遗余力地在世界范围内将其定义发扬光大。进化生物学家理查德·道金斯曾经将模因(通过非遗传的方式,特别是模仿而得到传递)定义为文化的基本单位,它可以通过突变、复制与选择的方式像病毒一样在社会中传播。而我们也可以将g想象成自我传播的单位,甚至可以称之为“自私的g”。
20世纪60年代到70年代,席卷美国的反主流文化运动撼动了一般智力与智商概念的根基。随着民权运动与女权主义风起云涌,美国社会中长期存在的政治与社会不平等现象也日渐凸显。研究结果显示,人们的生理与心理特征并非与生俱来,社会背景与生存环境可能对其产生深刻的影响。此外,教条的智力观点也遭到了来自各方科学证据的挑战。作为发展心理学领域的权威,路易斯·瑟斯顿(50多岁时)与霍华德·加德纳(快80岁时)认为“一般智力”测试是一种非常愚蠢的方法,它不过是将许多特定背景下的智力细分类型(例如视觉空间、数学或语言智力)混为一谈罢了。遗传学家在分析这些数据后可能得出这样一种结论,g可能是某种与基因毫不相干的性状,不过是为了迎合特定背景而杜撰出的假定测量方法。尽管反对之声不绝于耳,但是默里与赫恩斯坦却不为所动。默里与赫恩斯坦的主要理论依据来自心理学家阿瑟·詹森(Arthur Jensen)早年发表的一篇论著,现在他们开始着手印证g因素的遗传性与种群之间的差异性,并且以白人与非洲裔美国人之间的先天不同来解释种族差异这个至关重要的问题。
g可以遗传吗?从某种意义上来说可以。20世纪50年代,大量研究结果显示g具有很强的遗传倾向,而其中的双胞胎实验最具说服力。20世纪50年代早期,当心理学家对于共同生活的同卵双胞胎(即基因与环境都一样)进行智力测试时,他们发现这些双胞胎的智商具有惊人的一致性,其相关系数可以达到0.86。20世纪80年代末期,心理学家又对分开抚养的双胞胎进行了智力测试,尽管他们发现上述相关系数下降到0.74,但是这个结果依然令人感到吃惊。
此外,无论某种性状的遗传性有多强,它都可能是多基因共同作用的结果,而其中每个基因产生的影响非常微弱。假如事实果真如此,那么g应该在同卵双胞胎之间表现出很强的相关性,同时父母与子女之间的一致性应相差较远。研究结果显示,IQ确实符合这种遗传模式。例如,共同生活的父母与子女的IQ相关系数降至0.42,分开生活的父母与子女的相关系数则暴跌至0.22。无论IQ测试的结果是什么,IQ只是一种可遗传的因素,它将受到多基因与环境修饰作用的影响,也就是说IQ是先天与后天因素相互融合的结果。
我们根据这些事实能够得出以下结论,虽然某些基因与环境的组合可以对g产生强烈影响,但是这种组合几乎不可能完整地从父母遗传给子女。众所周知,孟德尔定律可以确保特殊的基因排列只在每代中呈离散分布。由于环境交互作用难以捕捉与预测,因此它们不能随着时间推移被复制。简而言之,智力可以遗传(受到基因的影响),但是(完整地传给后代)并非易事。
假如默里与赫恩斯坦能够得出这些结论,那么他们出版的有关智力遗传的著作就会更为客观,或者说至少不会那么充满争议。但是《钟形曲线》的核心并不是IQ的遗传力,而是IQ在不同种族之间的分布情况。默里与赫恩斯坦首先回顾了156个有关种间IQ的独立研究。总体来说,这些研究发现白人的平均IQ是100(根据定义,标准人群的平均智商为100),而非洲裔美国人的平均IQ是85,两者之间存在15分的差异。虽然默里与赫恩斯坦曾经试着从这些测试中发现歧视非洲裔美国人的成分,但是他们只选取了1960年以后在美国南部地区以外开展的项目,并且希望通过这种方法来减少地方性偏倚。然而事与愿违,两者之间15分的差异依然存在。
难道非洲裔美国人与白人之间IQ分数的差异是社会经济地位不同导致的结果吗?在过去几十年中,人们发现贫穷儿童在IQ测试中的表现较差,而该结果与他们的种族无关。时至今日,在所有解释种间IQ差异的假说中只有以下说法看似最为合理:贫穷的非洲裔美国儿童所占比例过高是造成白人与非洲裔美国人之间IQ差异的主要原因。20世纪90年代,心理学家埃里克·特克海默(Eric Turkheimer)证明,在极度贫穷的环境下,基因对IQ所起的决定作用非常微弱,从而有力地支持了上述理论。假如某位儿童集贫穷、饥饿与疾病于一身,那么这些变量将会对IQ产生重要影响。只有在摆脱上述限制的束缚后,控制IQ的基因才会起主导作用。
我们可以很容易在实验室里验证此类影响的作用:假设高茎与矮茎植株均生活在营养匮乏的环境中,那么其内在遗传驱动力也无法改变植株矮小的现实。相比之下,假如它们的生长环境营养充足,那么高茎植物将会生长至正常高度。综上所述,究竟是基因还是环境或者说是先天还是后天在起主导作用将取决于具体情况。如果环境因素作用明显,它可以产生更大的影响。当环境因素的限制被去除后,基因的优势才逐步凸显。
虽然贫穷与匮乏的影响完美地解释了非洲裔美国人与白人IQ差异的原因,但是默里与赫恩斯坦并未就此止步,而是对于该问题进行了更深层次的挖掘。他们发现,即便研究对象的社会经济地位得到改善,但是依然无法完全消除非洲裔美国人与白人IQ之间的差异。如果以社会经济地位为横坐标绘制反映白人与非洲裔美国人的IQ曲线,那么他们的IQ都会随着社会经济地位的提升而增高。尽管富裕家庭儿童的IQ分数要高于出身贫穷的同伴,但是白人与非洲裔美国儿童之间的IQ差异却仍然存在。令人感到自相矛盾的是,随着社会经济地位的提升,白人与非洲裔美国人之间的IQ差异会继续扩大。此外,富有的白人与非洲裔美国人之间的IQ差异不但没有缩小反而更为显著,并且这种缺口在高收入人群中还将进一步扩大。
与此同时,上述研究结果也成为各种书籍、杂志与报刊竞相追踪的热点。例如,进化生物学家斯蒂芬·杰·古尔德(Stephen Jay Gould)在为《纽约客》撰稿时言辞犀利地指出,由于这些测试的效果非常有限,并且各种测试方法之间的变异千差万别,因此根本无法得出任何能够解释这些差异的统计学结论。来自哈佛大学的历史学家奥兰多·帕特森(Orlando Patterson)则巧妙地将自己的文章命名为“钟形曲线之殇”(For Whom the Bell Curves)。他在文中提醒读者,奴隶制、种族主义与偏见的遗毒加深了白人与非洲裔美国人之间的文化芥蒂,我们无法根据客观公正的方法来对种间的生物属性进行比较。事实上,社会心理学家克劳德·斯蒂尔(Claude Steele)曾经证实,在对非洲裔美国学生进行IQ测试之前,如果告诉他们只是在试用某种新型电子笔或记分方式,那么他们在测试中就会有良好的表现。但是如果告诉他们要进行“智力”测试,那么他们的分数将会一落千丈。总体来说,IQ测试中真正的变量并不是智力,而是受试者的天赋、自尊、自我以及焦虑。在这个非洲裔美国人经常遭受阴险歧视的社会里,认同这种IQ差异的倾向得到了充分的自我强化:由于非洲裔美国儿童在接受测试之前就被告知不被看好,因此他们在IQ测试过程中的表现往往不尽人意,而测试结果又造成了智商不高的负面影响,并且将进入永无止境的恶性循环。
但是《钟形曲线》却犯了个致命的低级错误,它其实就淹没在这部厚达800页作品的一个段落里,以至于几乎不会引起读者的注意。假设非洲裔美国人与白人的IQ分数完全相同(例如均为105),然后开始衡量他们在不同智力分项测试中的表现。研究结果显示,非洲裔美国儿童在某些测试项目中(例如短期记忆力与长期记忆力测试)得分较高,而白人儿童在另外一些项目中表现更好(例如视觉空间与感知变化测试)。换句话说,IQ测试方法的配置将对不同种族以及基因变异体的表现产生重大影响:只要调整同一测试中各项变量的权重,那么就可以改变智力测试的结果。
1976年,桑德拉·斯卡尔(Sandra Scarr)与理查德·温伯格(Richard Weinberg)已经证实上述测试存在严重偏倚,但就是这项实验的结果几乎被人们遗忘。斯卡尔对于跨种族收养(非洲裔美国儿童由白人父母收养)进行了研究,他发现被收养的非洲裔美国儿童平均智商为106,与年龄相仿的白人儿童没有区别。斯卡尔通过仔细分析对照组的数据得出结论:这些被收养儿童的“智力”并未得到提升,他们只是在参加特定智力分项测试时正常发挥罢了。
对于IQ测试而言,虽然它可以预测人们在现实世界中的表现,但是我们不能因此就草率地认为这种方法绝对正确。当然IQ概念的确具有非凡的自我强化功能:它反映的特质不仅蕴含着某种出类拔萃的意义与价值,还可以令其自身得到发扬光大,并且可以塑造成为某种坚不可摧的逻辑闭环。由于IQ测试的实际配置相对随意,因此智力不会受到某项测试内部权重改变的影响(例如从视觉空间感知力到短期记忆),但是这会导致非洲裔美国人与白人之间的IQ分数出现差异。g概念的微妙之处就在于,它本应是某种可测量与可遗传的生物属性,然而却在很大程度上被文化优先掌控。其实这种情况极其危险:简单来说就是误把模因当成了基因。
假如说人类从医学遗传学中汲取了某种教训的话,那么就是要时刻提防生物学与文化之间的差异陷阱。我们现在已经知晓,不同人种的遗传物质大同小异,而体内各种变异才是产生多样性的真正原因。或者更为准确地说,尽管变异对于基因组的影响微乎其微,但是如果我们从文化或者生物学角度出发就很容易将它们放大。这些精心设计的测试手段当然可以检测出能力上的差异,同时还会发现此类差异很有可能沿着种族界线分布,但是如果我们把这种测试结果称为“智力”的话,尤其是当分数只依赖于某种测试的配置时,那么简直是对其严谨性的侮辱。
基因的作用与环境、文化、地理以及历史不可相提并论,它无法告诉我们该如何对人类多样性进行分类或者判别。我们曾试图用语言来诠释这种现象,但是却总觉得难以自圆其说。我们将某种统计学上最普遍的遗传变异称为“常态”,该词不仅代表了统计学上的优势,并且还是品质甚至是道德优越的象征(韦氏词典中对“常态”一词的定义至少有8种,其中就包括“自然发生”以及“心理与生理健康”的概念)。如果某种变异非常罕见,那么它将被称为“突变”,该词不仅代表了统计学上的劣势,还是品质低下甚至道德败坏的表现。
随着语言歧视介入遗传变异,人们逐渐将生物学与主观愿望混为一谈。在特定环境下,当某种基因变异导致生物体的适应性下降时(例如生活在南极的男性容易秃顶),我们就将这种现象称为“遗传病”。而在另外一种环境下,如果同样的变异使生物体的适应性得到了提升,那么我们会说生物体发生了“遗传增强”。其实进化生物学与遗传学的统一提醒我们这些评判毫无意义:“增强”或“疾病”只是判断某个基因型在特定环境中适应能力的词语;如果环境因素发生改变,那么这两个词语的含义甚至可以彼此互换。心理学家艾莉森·高普尼克(Alison Gopnik)曾经写道:“如果没有人去读书,那么就不存在阅读障碍。如果你在大家狩猎的时候走神,那么这不仅无大碍而且还可能是某种优势的体现(例如狩猎者可以同时注意多个目标)。但是如果你在大家学习期间开小差,那么就要成为反面典型了。”
无论是按照种族界线对人类进行分类的愿望,还是将智力、犯罪、创造力与暴力等遗传特征凌驾于种族界线之上的冲动,它们展现的主题都离不开遗传学与分类学的领域。如果把人类基因组比作各式各样的小说或面部表情,那么它产生的变化种类可以说不胜枚举,并且所有这些表现形式均是基因组做出的选择。当某种与众不同的可遗传生物特征(例如遗传病中的镰刀形红细胞贫血症)占据主流时,通过基因组分析来确定其位点就会具有重要意义。如果能够细化对于可遗传特征或性状的定义,那么我们发现该基因位点的可能性就越大,而且该性状局限于某个亚种群的可能性也就越大(例如阿什肯纳兹犹太人中的泰伊—萨克斯二氏病或者加勒比黑人中的镰刀形红细胞贫血症)。人们熟悉的马拉松正日益成为一项由遗传因素决定的运动:来自肯尼亚与埃塞俄比亚(位于非洲大陆东部一处狭长的楔形区域)的运动员经常占据此类赛事的排行榜,这不仅与他们自身的天赋与艰苦训练有关,还在于马拉松是一种挑战人体极限的特殊测试,而自然选择会筛选出这种决定性格刚毅的基因(例如特定基因变异的组合能够产生独特的解剖、生理以及代谢特征)。
相对而言,如果我们对于某种特征或性状(例如智力或气质)的定义越广,那么就会发现它与单个基因关联的可能性就越小,而这种模式也可以扩大到种族、部落或亚种群的范围。由于智力与气质不同于马拉松比赛,它们不存在获胜标准也没有起点或终点,因此想要进行比较需要另辟蹊径。
无论采取狭义还是广义的标准,生物学特征事实上涉及人类的身份问题,也就是我们该如何从文化、社会与政治角度来定义、分类以及理解人类自身。尽管我们对于种族定义的表述看起来含混晦涩,但是其中缺失的关键部分就是在讨论身份的定义。

第二章 遗传算法

只有愚昧无知的人才会怀疑基因对于个体身份的决定作用,他们没有意识到人类实际上是由男女这两种基本的变异体组成。随着文化评论家、酷儿理论家、时尚摄影师以及流行歌手Lady Gaga的出现,上述这些传统的“基本”分类概念已经出现了令人不安的动摇。尽管目前各种议论众说纷纭,但是以下三项事实却毋庸置疑:第一,男性与女性在解剖与生理上存在很大差异;第二,基因是决定这些解剖与生理差异的根本原因;第三,这些差异会介入自身的文化与社会建构,从而对个体身份的确立产生潜在影响。
对于生理性别(sex)、社会性别(gender)与性别认同(gender identity)来说,历史上从未有人想到它们的形成与基因有关,然而这三个概念之间的区别与后续讨论的内容密不可分。生理性别指的是男性与女性身体的解剖和生理特征。社会性别的概念较为复杂,它是个体所扮演的精神、社会与文化角色。性别认同是个体对于性别的自我认识(女性或男性,两者均不是,或介于二者之间)。
几千年来,人们对男性与女性间的解剖差异(性别的“解剖二态性”)知之甚少。
1903年冬季,就在摩尔根非正式公布放弃遗传决定性别论的同年,正在攻读博士学位的内蒂·史蒂文斯却开始了一项具有划时代意义的研究。1903年,史蒂文斯选取了黄粉虫这种结构简单的生物体作为研究对象,然后开始分析其染色体组成与性别之间的联系。当史蒂文斯使用波弗利的方法对雄虫与雌虫染色体进行染色后,问题的答案随即就暴露于显微镜下:黄粉线虫的性别与其中一条染色体的变异密切相关。史蒂文斯认为这条小型染色体可以决定性别,于是她将其命名为性染色体。对于史蒂文斯来说,该现象暗示着某种简明扼要的性别决定理论。她的发现得到了重要合作伙伴细胞生物学家埃德蒙·威尔逊(Edmund Wilson)的验证。
我们根据史蒂文斯与威尔逊发现的XY系统可以得出如下重要结论:如果Y染色体携带有决定雄性性状的所有信息,那么它必定携带能够制造雄性胚胎的基因。起初,遗传学家希望能够在Y染色体上找到多个雄性决定基因:毕竟性别与多种解剖、生理与心理特征形影不离,因此很难想象单独某个基因能够实现上述全部功能。但是对于那些细心的遗传专业学生来说,他们都清楚Y染色体并非基因停留的理想场所。Y染色体与其他染色体不同,它没有姐妹染色体与副本拷贝,而这种“未配对”状态使得染色体上的每个基因都需要进行自我保护。如果其他染色体出现任何突变,那么它们可以通过复制配对染色体上的完整基因得到修复。但是由于Y染色体基因缺少相应的备份或指南(实际上,Y染色体具有某种独特的基因修复系统),因此无法对它们进行修理、修复或复制。当Y染色体遭遇突变攻击时,它根本不具备恢复遗传信息的机制,于是在漫长的历史演化中留下累累伤痕,并且成为人类基因组中最为脆弱的地方。
在接二连三的遗传突变轰炸下,人类Y染色体从几百万年前就开始出现信息流失。对于具有生存价值的基因来说,它们可能会被转移到基因组的其他部位并且被安全地储存起来,而那些价值有限的基因将被废弃、停用或替代,也就是说只有最重要的基因才会保留下来。随着遗传信息不断流失,Y染色体自身在循环往复的突变与基因丢失的作用下开始萎缩。因此,Y染色体作为全部染色体中最小的一条绝非偶然:它很大程度上是计划报废(2014年,科学家发现某些极其重要的基因就位于Y染色体)的受害者。
按照遗传学的逻辑,上述现象反映出某种奇特的悖论。作为人类最复杂的性状之一,性别不大可能由多个基因编码。然而对于某个隐藏在Y染色体上的单个基因来说,它却有可能成为决定雄性的主控因子。男性读者在此需要注意了:我们能活到现在实属不易。

20世纪80年代早期,伦敦一位叫作彼得·古德费洛(Peter Goodfellow)的年轻遗传学家开始在Y染色体上寻找性别决定基因。
1955年,英国内分泌学家杰拉尔德·斯威尔(Gerald Swyer)在研究女性不孕症的时候发现了一种罕见的综合征,这些携带男性染色体的患者却具有女性生物学特征。虽然这些生来患有“斯威尔综合征”的“女人”在童年期间具有女性的解剖与生理特征,但是进入成年早期后却无法达到女性性成熟。遗传学家对她们的细胞进行分析后发现,这些“女人”的细胞中居然携带有XY染色体。从染色体角度来说,每个细胞都表现为男性,而这些细胞所构成的个体却表现为女性的解剖、生理与心理特征。患有斯威尔综合征的“女人”体内所有细胞天生携带有男性染色体(XY染色体),但是却不知为何没能在她们身体上释放出“男性”信号。
研究显示,斯威尔综合征很可能与决定男性特征的主控基因有关,该基因在发生突变后失活并且使患者表现为女性特征。在麻省理工学院,由遗传学家戴维·佩奇(David Page)领导的科研团队已经取得了进展。在古德费洛的项目在稳步向前推进时,他却得到了一个令人震惊的消息。1989年夏季,他听说佩奇已经找到了雄性决定基因,同时还以该基因在Y染色体上的位置将其命名为ZFY。
1989年,古德费洛在ZFY基因附近经过仔细搜寻后,他发现了另一个颇具希望的候选基因。虽然这个名为SRY的小型基因很不起眼,但是它的结构非常致密且无内含子序列,同时该基因给人留下的第一印象就是非他莫属。当然最终验证SRY真实性的权威数据还是源自患者队列分析结果:SRY基因突变只见于女性斯威尔综合征患者,人们在其他正常的兄弟姐妹里没有发现该基因突变。
现在古德费洛还需要完成最后一项实验就可以尘埃落定了,当然这也是他的研究成果中最为精彩的部分。假如SRY基因是“雄性”的单一决定因子,那么如果在雌性动物体内强行激活该基因会发生什么呢?雌性动物难道会被迫变为雄性吗?当古德费洛与罗宾·洛弗尔—巴杰(Robin Lovell-Badge)将一份额外SRY基因拷贝插入雌性小鼠细胞后,他们发现其全部后代细胞正如预期的那样都携带有XX染色体(遗传学上的雌性),然而这些小鼠在发育过程中却表现出雄性的解剖特征(其中包括阴茎与睾丸)、骑跨雌性小鼠以及雄性小鼠的行为特征。此时只要古德费洛启动遗传开关,那么他就可以改变某种生物体的性别,甚至可以构建出与斯威尔综合征完全相反的基因。
难道单个基因就可以决定性别吗?几乎可以这么认为。尽管女性斯威尔综合征患者体内的全部细胞均携带有男性染色体,但是由于雄性决定基因在突变作用下失活,因此Y染色体相当于遭到了阉割(此处使用阉割这个词没有任何贬义,纯粹是出自某种生物学角度)。对于那些女性斯威尔综合征患者来说,细胞内的Y染色体确实阻碍了某些女性解剖结构的发育。其中较为突出的问题就包括乳房与卵巢发育异常,而这将导致女性患者体内的雌激素处于较低水平。但是她们不仅完全没有感到任何生理方面的异常,同时大部分解剖特征也与正常女性完全相同:例如外阴与阴道完好无缺,同时尿道口与二者的位置也像教科书上描写的那样准确。然而令人惊讶的是,女性斯威尔综合征患者对于性别认同非常明确,实际上她们与正常女性之间只差一个基因。尽管雌激素无疑对于第二性征发育与某些成年女性解剖特征的强化至关重要,但是女性斯威尔综合征患者却从未对她们的性别与性别认同产生过困惑。
女性斯威尔综合征患者并不是“具有女性外表的男性”,她们实际上是携带男性染色体的女性(其中仅有一个基因不同)。SRY基因突变的个体不仅在身体结构上与正常女性相差无几,更为重要的是她们拥有成为完整女性的意识。其实该基因的功能可谓平淡无奇,就像按下开关一样简单。

假如基因单方面就可以决定男女的解剖结构,那么它又是如何影响性别认同的呢?大卫·利马(David Reimer)是一名家住加拿大温尼伯(Winnipeg)的男子,他于2004年5月5日清晨走进一家杂货店的停车场,然后用一把短管霰弹枪结束了自己38年的生命。大卫·利马的情况并非个案。在20世纪70年代到80年代,文献报道中还描述过其他几宗变性(通过心理与社会训练将具有男性染色体的儿童转变为女性的尝试)病例,而他们都毫无例外地遇到了各种各样的困扰。在某些病例中,尽管他们表现出的性别焦虑症并不像大卫那样激烈,但是这些接受变性治疗的对象会经常出现焦虑、愤怒、烦躁与定向障碍,并且此类症状将一直延续至成人阶段。
2005年,某个来自哥伦比亚大学的团队对这些病例进行了分析,他们通过纵向研究确认了“遗传学男性”(即出生时具有XY染色体的儿童)的事实。由于他们的生殖器解剖结构往往发育不良,因此这些“遗传学男性”的社会性别在出生时就被认定为女性。虽然某些病例不像大卫·利马或C那样痛苦,但是根据报道,绝大多数被认定为女性的男性曾在童年经历过中度至重度的性别焦虑。许多人在此期间遭受了焦虑、抑郁与困惑的折磨,而到了青春期与成年期之后,主动将性别恢复成男性的人也不在少数。最值得注意的是,当两性畸形的“遗传学男性”在出生后按照男孩而不是女孩进行抚养时,研究人员在文献中没有发现一例有关性别焦虑或在成年期要求性别转换的报道。
尽管这些病例报道最终令此类假设得到了平息,但是上述观点依然在某些圈子里颇受欢迎,其支持者坚信可以通过训练、建议、强制执行、社会表现或文化干预等手段对性别认同实现全方位甚至颠覆性的改造。现在我们已经清醒地意识到,基因在性别认定与性别认同上的影响力要超越任何其他因素,仅有某些性别特征可以在限定情况下通过改变文化与社会背景或激素水平来获得。既然连激素都是由“遗传”(本身就是基因的直接或间接产物)决定,那么完全指望通过行为治疗与文化强化来改变性别简直就是异想天开。事实上医学界已经对此达成共识,除了某些极其罕见的病例以外,判断儿童性别应该以其染色体(遗传学检测)为准,而与解剖变异和外在差异无关。如果他们在日后迫切希望改变性别,那么我们理应尊重个人选择的权利。值得一提的是,就在我撰写本章内容的时候,这些儿童中没有一人要求改变基因赋予他们的性别。

性别认同在人类社会中以某种连续分布的形式存在,同时性别又是人类身份中最为复杂的问题之一,那么我们该如何诠释单个基因开关把控全局的现象呢?社会性别的多样性得到了各种文化的认可,它们并不是以非黑即白的形式存在,而是由众多深浅不一的灰度组成的。
从遗传学的角度来看,这种表述并没有自相矛盾之处:基因的主控开关和层级结构与行为、身份和生理特征组成的连续曲线完美契合。毫无疑问,SRY基因以某种开/关的形式掌控了性别决定。启动SRY基因可以让动物在解剖与生理上表现为雄性,而关闭SRY基因会使它们在解剖与生理上表现为雌性。
但是如果想让SRY基因在性别决定与性别认同方面发挥更深层次的作用,那么该基因必须选择更多的靶点,然后通过控制它们的启动与关闭来激活或抑制某些基因,而这个过程就像比赛中接力棒的交接。于是这些基因在依次整合自身与环境(包括激素、行为、暴露、社会表现、文化角色扮演与记忆)输入的基础上就产生了性别。我们在此讨论的性别实际上是一个结构复杂的遗传与发育级联,SRY基因位于整个层级的最顶端,排在它后面的则是具有修饰、整合、策动以及翻译功能的基因。此外,这种遗传与发育级联还决定了性别认同。我们可以打个比方,性别决定基因就像是制作糕点的文字说明,其中SRY基因起着至关重要的作用,它提醒糕点师要事先准备好面粉。如果连基本的原材料都没备齐,那么也别指望能做出什么像样的糕点。虽然前期准备工作没有任何差异,但是面粉经过加工后就可以变成法式长棍面包或是中式蛋黄月饼等各式美味。
对于遗传—发育级联来说,跨性别身份的存在为它提供了强有力的证据。从遗传与生理的角度来看,性身份具有二元性的特点:也就是说只需要一个基因就可以决定人类的性身份,并且会使男女之间在解剖与生理上出现非常明显的二态性。然而社会性别与性别认同的形成十分复杂。
这些男性(或女性)与斯威尔综合征患者的身份有类似之处:他们的染色体与解剖性别是男性(或女性),但是其染色体或解剖状态并不能产生同义信号。特别是在大鼠中,如果改变雌性胚胎大脑内的某个单一基因,或是将胚胎暴露在可以阻断向大脑发送“雌性特征”信号的药物中,那么均可以导致上述综合征发生。虽然转基因或经过药物处理的雌鼠均具有雌鼠的解剖与生理特征,但是它们却表现出骑跨雌鼠等雄鼠的行为。也就是说,这些解剖结构为雌性的大鼠具有雄性的行为特征。
综上所述,遗传级联的层级组织总体上反映了基因与环境之间内在联系的核心原则。人们在持续多年的激辩中始终难分胜负,占据主导地位的到底是先天还是后天,或者说是基因还是环境呢?这种针锋相对的争论所带来的仇恨让对阵双方均两败俱伤。我们现在能够达成的共识是,身份是先天与后天、基因与环境以及内部输入与外部输入共同作用的结果。但是这种表述简直就是废话,完全没有任何实际意义。如果控制性别认同的基因是按照层级关系组成的话(SRY基因位于整个层级的最顶端,然后由此延伸出成千上万条信息流),那么无论是先天还是后天都无法占据绝对的优势,其结果在很大程度上取决于它们在组织层级中的位置。
处于遗传—发育级联顶端的先天因素拥有运筹帷幄的强大实力,它只需要通过主控基因的启动或关闭就可以决定性别。如果我们能够掌控这个开关(例如通过遗传学方法或药物干预手段),那么就可以决定人类的男女性别,而他们也会具有非常完整的男女身份(甚至包括大部分解剖结构)。相比之下,假如先天因素作用于遗传—发育级联的底部,那么它根本无法实现遗传物质的宏伟蓝图,性别或性别认同的概念将无法被精准提炼。在这片幅员辽阔的大地上,历史、社会以及文化因素推动着纵横驰骋的信息流与遗传物质相互碰撞交融。那些浪花有时看似平静却在转瞬间又掀起波澜。虽然单个因素的力量非常有限,但是它们凝聚产生的合力却组成了一道亮丽的风景线,而这也就是我们所说的个体身份。

第三章 最后一英里

实际上在寻觅同性恋基因的过程中,机遇往往就在不经意中悄然到来。迪安·哈默(Dean Hamer)是美国国家癌症研究所的一位研究员,他并没有参与这场声势浩大的激辩。虽然哈默公开承认自己是同性恋者,但是他从未对遗传学在身份、性或者任何其他领域的作用产生过兴趣。
对于生物学家来说,《人类的由来》的地位就相当于文学研究生眼中的《战争与和平》:尽管几乎每位生物学家都声称拜读过这本著作,或者对于其基本观点已经了然于心,但是实际上很少有人真正翻阅过此书,当然这其中也包括哈默。他惊讶地发现,达尔文在此书中用了很大篇幅来讨论性、性伴侣选择及其对支配行为与社会组织的影响。达尔文清楚地意识到,遗传对性行为起着重要的影响。但是达尔文描述的“性行为终极因素”,也就是性行为与性取向的遗传定子依然神秘莫测。
时至今日,将性行为或者任何行为与基因挂钩的观点已然落伍。哈默买的第二本书是1984年理查德·路温顿(Richard Lewontin)撰写的《基因之外:生物,思想与人性》(Not in Our Genes:Biology, Ideology and Human Nature)。路温顿在书中对于大部分人类天性由基因决定的观点进行了猛烈抨击。在他看来,那些由基因决定的行为要素不过是统治阶层为了强化文化与社会建设采用的手段罢了。路温顿写道:“没有确凿的证据表明同性恋具有任何遗传基础……这种观点完全是凭空杜撰。”他还认为,达尔文在生物进化上的观点基本正确,但是对于其人类身份演化的观点却持否定态度。
那么这两种理论中到底孰对孰错呢?就哈默而言,至少性取向这个复杂的问题不可能完全由文化力量决定。“为什么路温顿这位令人尊敬的前辈会坚决否定行为的遗传基础呢?”哈默对此深表疑惑,“难道是由于他无法在实验室里证明行为遗传学的谬误,因此转而利用政治上唱反调的方法来进行回击?也许这其中真的存在什么奥秘。”于是哈默决定抓紧时间自学行为遗传学知识。他在会议结束后便赶回自己的实验室着手新的研究,但是这个领域可供参考的资料少得可怜。哈默在科技期刊数据库中检索了自1966年以来发表的全部文章,他在其中只找到了14篇与“同性恋”和“基因”有关的文献。相比之下,同期关于金属硫蛋白基因的文章达到了654篇。
虽然这些文献报道中的线索并不明显,但是依然逃不过哈默敏锐的目光。20世纪80年代,心理学教授J.迈克尔·贝利(J. MichaelBailey)曾经试图借助双胞胎实验来研究性取向与遗传学的关系。贝利的出发点非常明了:如果性取向受到遗传因素的部分影响,那么同卵双胞胎中同性恋的比例要高于异卵双胞胎。
当贝利对双胞胎中同性恋的一致性进行统计后,他得出了令人震惊的结果。在56对同卵双胞胎中,有52%的双胞胎双方都是同性恋。而在54对异卵双胞胎中,只有22%的双胞胎兄弟都是同性恋,虽然这个数字要低于同卵双胞胎中同性恋的比例,但还是要明显高于整个人群中10%的预估比例。
贝利发现男同性恋者的性取向并不完全取决于基因。包括家庭、朋友、学校、宗教信仰以及社会结构在内的各种因素都可以对性行为产生明显影响。甚至可以这样说,如果同卵双胞胎中的某个兄弟是同性恋,那么另一个有48%的概率是异性恋。也许内外部因素的影响会触发不同的性行为模式。毫无疑问的是,由于笼罩在同性恋者周围的传统文化信仰如影随形,因此这种压力足以动摇双胞胎中的某个对于“异性”身份的选择。但是该研究以无可辩驳的证据说明基因可以影响同性恋,并且要明显强于基因对于1型糖尿病倾向的作用(双胞胎中的一致率仅为30%),甚至几乎等同于基因在身高中的地位(一致率大约为55%)。
贝利的研究为性身份的话题带来了深远影响,人们不再束缚于20世纪60年代流行的“选择”与“个人取向”理论,逐渐开始从生物学、遗传学以及继承权的角度来解释这些现象。如果我们无法自主决定身高以及是否发生阅读障碍或1型糖尿病,那么我们也同样无法选择性身份。
可是影响性身份的基因到底是一个还是多个呢?这个(或这些)基因是什么?它定位在哪里?为了能够识别出“同性恋基因”,哈默需要扩大研究的规模,并且最好能够追踪某个家庭中多代成员的性取向。此时哈默却遇到了资金问题,他需要申请新项目以获得科研经费。然而哈默只是个研究金属硫蛋白调控的普通科研人员,究竟谁能为他寻找影响人类性取向基因的项目提供资金呢?
1991年初,以下两个领域的研究进展为哈默的项目创造了条件。首先,人类基因组计划正式公布。其次,艾滋病研究领域受到重视。20世纪80年代末期,该疾病曾使同性恋社群名誉扫地,但是社会活动家与艾滋病患者并未放弃努力,他们通过各种温和或激进的方式来表达诉求,最终美国国立卫生研究院做出承诺要在艾滋病研究领域投入上亿美元的经费。哈默则机智地将寻找同性恋基因的工作归为与艾滋病相关的研究。
到了1992年夏末,哈默已经采集到近1000名家庭成员的信息,并且为其中114位男同性恋者绘制了各自的谱系图。当哈默仔细阅读这些数据后,他多少感到有些失望。除了孪生兄弟间性取向具有较高的一致性之外,他没有发现任何与同性恋有关的模式或趋势。
该结果对于哈默来说无疑是个沉重的打击。他曾经试着将这些数据分组归类,但最终还是一无所获。就在哈默几乎要放弃谱系图的时候,他突然在随手边写边画之间获得了灵感,而这种模式只有用肉眼才能辨别出细微的不同。在偶然一次绘制谱系图的过程中,哈默把每个家庭的父系亲属置于左侧,同时将母系亲属置于右侧,并将其中的男性同性恋者用红色标记。当哈默将这张谱系图展开时,他立即察觉到了某种不同寻常的趋势:红色标记趋于集中于图右侧,而未标记的男性集中在图左侧。男同性恋者的舅舅往往也是同性恋,并且这种特征只会出现在母系亲属中。随着谱系图中具有亲属关系的同性恋者数量不断增多(他将其称为“同性恋溯源计划”),这种趋势也愈发明显。其中表兄弟有着较高的一致性,但是这种趋势在堂兄弟中并不明显。此外,姨表兄弟较任何其他同辈兄弟具有更高的一致性。
研究结果显示这种模式代代相传。此时,哈默猛然从同性恋的表型描述(性取向)跨入到对基因型(潜在的染色体位点)的研究。虽然哈默还没有鉴别出同性恋基因,但是他已经证明了与性取向有关的DNA片段可能就位于人类基因组中。但是同性恋基因到底位于X染色体的哪个区域呢?现在哈默将注意力集中在40对已经获得血液样本的同性恋兄弟。值得注意的是,哈默从中发现33对同性恋兄弟均携带有一个名为Xq28的染色体片段。根据随机原则,这种情况只应出现在半数(20对)的同性恋兄弟中,而另有其他13对同性恋兄弟携带这种染色体片段的概率可以说是微乎其微(甚至不到万分之一)。因此哈默非常自信地认为,决定男性性身份的基因就位于Xq28片段附近。
哈默采用的方法不仅客观公正而且科学严谨。他在研究过程中不断地改进分析方法,积极尝试通过各种手段来验证Xq28的功能。他甚至怀疑Xq28可能不是同性恋基因,它也许只是某种编码“娘娘腔”的基因(唯有男同性恋者才敢于在科学论文中采用这种说法)。携带Xq28的男性在性别特定行为或者传统的男子气概上并没有显著差异。那么Xq28编码的基因是否可以决定同性恋对于肛交行为的接受态度呢?(哈默问道:“难道它是肛交基因吗?”)当然这种假设并不存在。那么该基因可能与叛逆性格有关吗?还是它能够起到反抗世俗束缚的作用?或者说它是不良行为的根源?由于无法找到它们之间的内在联系,因此这些假设被接连推翻。当所有的可能性均被排除后只剩下一个结论:Xq28片段附近的某个基因参与了男性性身份的决定过程。
1993年,哈默的论文在《科学》杂志上发表,随后有几个研究团队开始对哈默的数据进行验证。当然上述研究的共同之处就在于时至今日都没有人能够分离出某个影响性身份的确切基因。就连强大的连锁分析法都无法鉴别出这个神秘的基因,研究人员只能为它在染色体上划定某个可能存在的范围。经过将近10年的艰苦努力后,遗传学家并没有发现“同性恋基因”,只是找到了“同性恋基因的位置”。虽然该位置上的某些基因的确与性行为调控有关,但是迄今尚未有哪个基因被证实与同性恋直接相关。例如,对于某个位于Xq28区域的基因来说,它可以编码一种调节睾酮受体的蛋白质,而睾酮受体是众所周知的性行为中介物质。但是我们并不清楚该基因是否就是学者们梦寐以求的同性恋基因。
其实所谓的“同性恋基因”可能根本就不是基因,或者至少不是传统意义上的基因。它也许只是某种DNA片段,可以对远处的基因产生调控与影响。它也可能处于某个内含子的掩护下,而这些非编码的DNA序列将基因分隔成为各种模块。无论这种决定因素的分子身份源自何方,我们迟早会发现影响人类性身份遗传要素的确切性质,而哈默对Xq28判断的对错已经无关紧要。双胞胎实验清晰地证实,影响性身份的某些决定因素就位于人类基因组。随着遗传学领域各种基因定位、辨别与分类方法不断完善,我们终将发现它们的庐山真面目。这些元件可能具有类似于性别决定中的层级组织,其中主控基因位于整个级联的顶端,具有整合与修饰功能的基因位于底部。但是它与性别决定机制的不同之处在于,性身份不可能由某个主控基因左右,该过程可能是多个基因共同作用的结果,尤其是那些调节并整合环境因素输入的基因很可能与性身份决定有关。

当然重新确立基因在生理功能调控上的重要地位并非易事。在某种程度上,我们需要对双胞胎实验这种饱受诟病的经典人类遗传学方法进行彻底改造。遗传学家在研究来自相同家庭的同卵双胞胎时发现,想要理清先天与后天之间错综复杂的关系简直是天方夜谭。由于在相同环境下成长的异卵双胞胎平均只有半数基因一致,因此将同卵双胞胎与其进行比较就可以部分解决这个问题。但是也有批评人士指出,这种把同卵与异卵双胞胎进行比较的方法从本质上就存在谬误。与异卵双胞胎相比,同卵双胞胎的父母也许对待孩子们的方式更加均等。
1979年,明尼苏达大学的一位科学家找到了打破这种僵局的办法。就在同年2月的某个晚上,行为心理学家托马斯·布沙尔(Thomas Bouchard)在整理邮箱时注意到自己的学生留下了一则新闻报道。1979年,布沙尔开始招募此类双胞胎作为研究对象。到20世纪80年代末期,他已经打造出世界上最大的双胞胎研究队列,其中就包括分开抚养与共同抚养的双胞胎。布沙尔将其称为明尼苏达双胞胎实验(或“MISTRA”)。
1990年夏季,布沙尔研究团队的详细分析报告登上了《科学》杂志的头版。他们收集的数据源自56对分开抚养的同卵双胞胎与30对分开抚养的异卵双胞胎。这篇文章仅用一个表格就诠释了研究结果的精华,而这与《科学》杂志中充斥着大量图表的其他论文风格截然不同。在明尼苏达双胞胎实验中,这些具有高度相关性的受试双胞胎非常耐人寻味。与此同时,其他有关同卵双胞胎的研究也相继展开,它们为了解基因对于人类性格与行为的影响提供了更多证据。布沙尔曾经尽量把各种特征进行量化处理,但是他明白只有通过实例才能诠释这种似曾相识的感觉。明尼苏达双胞胎实验并不是为了反映分开抚养双胞胎的相似之处,而是要说明他们在相似或者趋同行为上具有强大的共性。尽管双胞胎的身份千差万别,但是在遗传算法中却具有相同的一阶导数。

20世纪90年代早期,以色列遗传学家理查德·艾伯斯坦(Richard Ebstein)拜读了托马斯·布沙尔发表的有关分开抚养双胞胎实验的文章。其结果令艾伯斯坦非常着迷:布沙尔的研究将我们对性格与气质的理解从文化与环境因素上升至基因领域。艾伯斯坦与哈默的想法一样,他也希望能够找出那些决定不同行为的确切基因。实际上人们在以前就注意到了基因与性格的关系:心理学家早就发现唐氏综合征患儿往往表现得特别乖巧顺从(其他遗传综合征经常会突然出现暴力与攻击行为)。但是艾伯斯坦的兴趣所在不是这种病态的外在表现,而是它在正常人群中变化多端的气质类型。极端的遗传学改变显然会导致气质产生过激变化。那么是否存在能够影响正常人类性格的“正常”基因变异体呢?
艾伯斯坦深知,在着手寻找此类基因之前,他必须首先严格定义那些可能与基因相关的性格亚型。20世纪80年代末期,研究人类气质的心理学家设计了一份问卷,其内容由100道是非题组成,它可以有效地把气质划分为四种维度:探求新奇(冲动与谨慎)、奖赏依赖(热情与疏远)、回避伤害(焦虑与平静)、坚持有恒(忠诚与善变)。双胞胎实验结果显示,上述性格类型都具有很强的遗传倾向:对于同卵双胞胎来说,他们的问卷得分一致率超过50%。
艾伯斯坦对于其中的探求新奇亚型产生了浓厚的兴趣。具有这种性格的人也被称为“猎奇者”,他们的性格特点就是“冲动任性、乐于探索、反复无常、容易激动以及奢侈浪费”(例如杰伊·盖茨比、爱玛·包法利与夏洛克·福尔摩斯)。相比之下,“恐新者”表现为“教条死板、深思熟虑、忠诚坚忍、慢条斯理以及节俭朴素”(例如尼克·卡拉维、命运多舛的查尔斯·包法利以及忠厚老实的华生医生)。作为猎奇者最典型的代表,盖茨比几乎完全沉浸在心醉神迷的生活里。此外,撇开成绩不论,猎奇者甚至在考试时情绪也会出现剧烈波动。他们要么交白卷,要么在房间里来回踱步冥思苦想,并且还经常会感到令人绝望的厌倦。
为了深入了解这些人群的特点,艾伯斯坦开始通过民意测验、刊登广告与问卷调查(例如,假设大多数人觉得尝试新鲜事物浪费时间,那么你是否经常会为了开心与刺激而固执己见呢?或者说,你在处理问题时只是基于当下感受而不考虑既往结果吗?)的方式来募集队列研究所需的猎奇者。经过3年多的努力,艾伯斯坦找到了124位具有这种性格的男女。他先是将研究目标缩小到某些可能与之相关的基因上,然后再通过分子与遗传技术确定以上受试对象的基因型。艾伯斯坦发现,极端猎奇者体内某个遗传标记的比例表达明显异常,后来这种多巴胺受体基因的变异体被命名为D4DR。(由于该方法可以通过特定表型的关联来识别基因,因此我们将其称为关联研究。在这个案例中,极度冲动就是特定表型。)
多巴胺是一种神经递质,它可以在大脑神经元之间传递化学信号,特别是涉及大脑对“奖赏”的识别。众所周知,多巴胺是人体内最为强大的神经化学信号之一:如果我们对大鼠脑中的多巴胺应答奖赏中枢进行电刺激,那么实验动物将会因为拒绝进食与饮水死亡。
D4DR相当于多巴胺的“系泊部位”,刺激信号将从这里被传递给多巴胺应答神经元。生化检测结果显示,其中一种名为D4DR——7的变异体扮演着猎奇者的角色,该基因上包含有7段重复的DNA序列,它可以使人体对多巴胺奖赏变迟钝,而也许只有提高外部刺激的强度才能让应答水平恢复到以前。它就像某个被卡在半截的开关,或是被天鹅绒盖住的收音机扬声器,需要用力把开关按下或是将音量调大。猎奇者试图通过增加风险来刺激大脑使信号放大。他们就像长期吸毒的瘾君子或是多巴胺奖赏实验中的大鼠,只不过这种所谓的毒品是大脑中产生冲动的化学物质。
艾伯斯坦的原始研究结果也得到了其他团队的验证。非常有趣的是,如果根据明尼苏达双胞胎实验的结果,那么D4DR基因根本不可能“导致”性格或气质发生变化。与之相反的是,D4DR基因与寻求刺激或兴奋的冲动气质倾向呈线性相关。尽管刺激的确切性质各不相同,但是它能够在人类中产生最为奇妙的特质,例如探究驱力、激情以及创新紧迫性,但是刺激同样也能产生反向冲动、成瘾、暴力以及抑郁。D4DR——7这种突变体不仅与创造力爆发有关,还是注意力缺失症的重要原因,而此类看似矛盾的现象实际上源自相同的冲动。某些与众不同的研究甚至将D4DR变异体的地理分布进行了归纳,结果发现游牧与流动人口具有较高的基因突变率。此外,随着个体远离位于非洲的人类发源地,其D4DR基因发生突变的频率也会逐渐增高。也许正是在D4DR突变体潜移默化的推动下,人类祖先才敢于冒险穿越海洋“走出非洲”。甚至就连我们情绪中那些不安与焦虑的成分也都是基因的产物。
由于猎奇行为无疑取决于年龄大小,因此D4DR变异体研究难以在不同人群与环境中复制。或许可以预见,人们到了50岁左右就不会再那么血气方刚。尽管地理与种族差异也会干扰D4DR对气质的影响,但是造成该研究难以复制的最可能原因是D4DR变异体的效应较弱。某位研究人员曾经估计,D4DR效应只能解释个体猎奇行为差异的5%,而且它可能只是众多(也许多达10个)决定具体性格基因中的一员。

以上讨论的内容涉及性别、性取向、气质、性格、冲动、焦虑与选择。虽然它们是人类经验中最为神秘的领域,但是却在悄然之间被逐个赋予基因的概念。人们曾经相信行为取决于文化、选择与环境因素,或者把它当作自我与认同的特殊产物,可是现如今居然证明这一切都是基因作用的结果。
其实真正出乎意料的是,所有这些结果均超出我们的想象。如果我们承认基因变异可以导致人体发生病理改变,那么我们对于基因变异影响正常人体功能就不应感到诧异。由于基因的致病机制与其影响正常行为与发育的机制非常相似,因此我们可以通过某种基本的对称性概念来诠释这个问题。爱丽丝曾经说道:“如果我们能够进入镜中世界该多好啊!”而对于人类遗传学来讲,它本身的镜中世界就是现实世界的写真。
那么我们该如何描述基因对正常人类表现与功能的影响呢?实际上我们应该对此并不陌生,而且这些内容也曾经被用来描述基因与疾病之间的联系。例如,你从父母那里继承的基因变异要先经过混合与匹配,然后它们将引起细胞功能与身体发育异常,并且最终导致生理状态发生改变。如果此类变异影响了位于级联顶端的主控基因,那么它对人体产生的效应将十分明显(例如男性与女性,矮小与正常)。但更为普遍的情况是,这些变异或者突变基因位于信息级联的底层,它们只能引起个体的某些倾向发生改变。总体来说,有数十种基因参与了这些倾向或者体质的形成过程。
这些倾向在不同环境暗示与机会因素的作用下会产生种类繁多的结果,其中就包括种类、功能、行为、性格、气质、身份与命运。可是在大多数情况下,它们仅具有某种概率上的意义,例如,某些结果之间的权重与平衡发生改变,或者导致它们发生的可能性与可信性出现增减。
尽管上述过程只涉及某些可能性的变化,但是它们却足以令我们看上去与众不同。当受体的分子结构发生改变,它可以让大脑内的神经元产生“奖赏”信号,并且使某个分子与受体的作用时间发生改变。虽然神经元内不同受体产生的信号持续时间不过半秒钟,但是这种变化足以让人陷入冲动与冷漠或者狂躁与抑郁的对立面。此外,这些身心状态会导致人们在感知、选择与情感方面出现复杂的改变。随着此类化学作用的时间不断延长,它们最终将演化为进行情感互动的渴望。例如,某个具有精神分裂症倾向的男子可能会认为,卖水果的商贩言语中流露出要谋害他的企图。与之相反的是,他那位表现为躁郁症倾向的兄弟会把这些话作为前程似锦的祝福,哪怕此类恭维之词只是出自某个卖水果的商贩口中。上述案例说明个体之间对于相同事物的判断截然不同。
尽管这些内容看上去并不复杂,但是我们该如何解释个体的表现、气质与选择呢?或者说,抽象的遗传倾向是如何具化为特定人格的呢?我们在此可以将其描述为遗传学研究中的“最后一英里”。虽然基因能够从可能性与概率的角度描述复杂有机体的表现或命运,但是它却无法准确诠释产生这些表现或命运的机制。特定的基因组合(基因型)可能会影响鼻子或性格的构成,但是却无法决定鼻子的具体轮廓或长度。我们应当注意不要把倾向与性格相互混淆,它们分别代表了出现某种结果的统计概率与具体现实。根据目前取得的研究成果,遗传学似乎很快就可以揭开人类表现、身份或行为的奥秘,然而它却始终无法跨越这最后一英里。
为了重新梳理基因领域面临的“最后一英里”问题,我们可以把两项完全不同调查的结果进行整合。20世纪80年代以来,人类遗传学已经在研究分开抚养的同卵双胞胎相似性方面花费了大量精力。如果这种出生后便分离的双胞胎仍然共享冲动、抑郁、癌症或者精神分裂症的倾向,那么他们的基因组中必定包含编码此类特征的信息。
但是如果我们想要理解倾向转变为性格的机制,那么就得采用逆向思维的方式。也就是说,我们可以通过提出某个相反的问题作为解答工具:为什么在相同环境与家庭中成长的同卵双胞胎会拥有迥异的生活与特征呢?为什么相同的基因组能够造就拥有不同人格、气质、性格、命运与选择的个体呢?
20世纪80年代以来的30年里,心理学家与遗传学家一直致力于同卵双胞胎的研究,他们尝试着对于某些细微差异进行分类与测量,希望能够解释成长于相同环境下同卵双胞胎之间迥然不同的命运。然而所有试图在现实中找到可供测量的系统化差异的努力均以失败告终:尽管这些双胞胎的成长环境(家庭、学校、营养、知识、文化以及朋友圈)毫无二致,但是他们之间的差异有如天壤之别。
到底是什么原因造成了这些差异呢?在过去的20多年间,有43项权威研究得出了相同的结论:“非系统性因素造成了此类特殊的意外事件。”例如疾病、事故、创伤与触发器,还有错过的火车、丢失的钥匙以及暂停的思绪。分子改变引发了基因变异,最终导致个体表现出现细微的变化。而这种意外就像跌入威尼斯运河或者坠入情网一样充满了偶然性。
可是这种毫无意义的答案有什么用呢?难道说我们在深思几十年后只能得出命中注定的结论吗?其实结果并非如此悲观,我反而觉得此类提法值得期待。在莎士比亚的作品《暴风雨》中,普罗斯彼罗与变形怪物凯列班进行了殊死搏斗,他将对方描述为“一个恶魔,一个天生的恶魔,后天因素根本无法影响其先天本质”。凯列班最可怕的地方在于他的内在本质不受任何外界信息左右。由于他生来就是个冷血的食尸鬼,因此其下场也比任何人都更为可悲。
其实所有这些结果均是基因组无穷魅力的外在表现,只有它们才能让大千世界如此多彩。我们的基因会对特定环境做出灵活的应答:如果缺乏此类自我调节的能力,那么我们将退化成为机器人。长期以来,印度教哲学家一直把生命历程描述成为某种特殊的网络(jaal)。其中基因相当于构成网络的线程,它们将单个网页链接起来组成了互联网。由于基因对于环境应答的要求非常苛刻,因此该网络系统势必精益求精,否则其后果将无法控制。与此同时,这种网络系统也为变幻莫测的机会留下了充足的空间。我们将这种交集称为“命运”,而把自身做出的应答称作“选择”。对于具有对生拇指且直立行走的生物来说,它们会在进化过程中逐渐摆脱原有的束缚,于是我们将此类特殊的生物变异体称为“自我”。

第四章 冬日饥荒

在前述章节中隐藏着一个亟待解决的问题:如果“自我”只是事件与基因之间交互作用产生的偶然现象,那么我们又该如何证明这个过程呢?例如,双胞胎中的一个在冰面摔倒导致膝盖骨折,然后受伤部位形成骨痂,而另一个双胞胎却安然无恙。再如,某位孪生姐妹嫁入了德里的名门望族,而另一个却只能委身于加尔各答的没落人家。那么细胞或机体是通过何种机制来记录这些“命运”的呢?
其实在过去的几十年间,人们公认基因就是解决上述问题的标准答案。更确切地来讲,答案在于如何调控基因的启动或者关闭。20世纪50年代,莫诺与雅各布在巴黎已经证实,当细菌所需的养分从葡萄糖转换为乳糖时,它们将关闭葡萄糖代谢基因并启动乳糖代谢基因。将近30年以后,两位研究蠕虫的生物学家发现,邻近细胞发出的信号可以决定某个细胞的命运,它们将通过启动或者关闭主控基因导致细胞谱系发生改变。当某个双胞胎在冰面摔倒后,其体内促进伤口愈合的基因就会启动,并且让骨折断端硬化形成骨痂。甚至就连大脑在储存复杂记忆的时候也伴随着基因的启动与关闭。当夜莺遇到其他同类发出与众不同的鸣叫后,其大脑中的ZENK基因表达水平就会升高。可是如果这种叫声来自不同的物种或者表现为降调,那么ZENK基因的表达水平将大打折扣,而夜莺也不会对于这种声音留下记忆。
但是对于细胞与机体(针对环境输入做出应答:跌倒、意外与创伤)中的基因活化与抑制作用来说,它们能给基因组留下某种永久性的标志或印记吗?当生物体进行复制的时候,这些标志或印记可以传递给其他生物体吗?来自环境的信息能否跨代进行传递呢?

我们现在即将进入基因发展史上最具争议的领域,理清某些重要的历史脉络是当务之急。20世纪50年代,英国胚胎学家康拉德·沃丁顿(Conrad Waddington)就曾经尝试着去理解环境信号对于细胞基因组的影响。他在胚胎发育过程中注意到,成千上万种不同类型的细胞(神经元、肌细胞、血细胞以及精细胞)均源自同一个受精卵。沃丁顿为此做了一个非常形象的比喻:胚胎分化的过程就像无数颗弹珠从沟壑纵横的斜坡上滚落。他认为每个发育中的细胞在“沃丁顿景观”中都有自身独特的路径,但是由于它们在途中被困在某些特殊的沟坎或缝隙中,因此限制了细胞分化的类型。
在沃丁顿看来,细胞周围环境对于基因的影响方式令他十分好奇。他将这种现象称为“表观遗传”,其字面含义就是“基因之外”。沃丁顿写道,表观遗传学关注的是“基因与其周围环境交互作用后产生的表型”。
如果仅凭基因的瞬间启动与关闭就可决定机体的命运,那么这个过程为何无法逆转呢?尽管上述问题看似无足轻重,但却是长期困扰生物学家的难题:如果不存在“锁定”命运的正向机制,那么也就无从谈起什么反向机制。如果基因开关的作用时间转瞬即逝,那么为何命运或记忆却无法做到昙花一现呢?为什么我们不能返老还童呢?
此时沃丁顿从一项可怕的人体实验中找到了理论依据,万幸其结果并没有对受试人群的后代产生显著影响。1944年9月,第二次世界大战进入最为残酷的阶段,占领荷兰的德国军队禁止将粮食与煤炭运往该国的北部地区,并且全面封锁了水陆交通。时至今日,这段历史依然铭刻在荷兰人民的记忆中,并且被正式称为“冬日饥荒”(Hunger Winter)或“饥饿冬天(Honger winter)”。
这场饥荒一直持续到1945年。虽然死于营养不良的男女老幼数以万计,但是最终还是有几百万人得以幸免。在这种营养条件剧烈变化的过程中,实际上催生出某种可怕的自然实验:当人们摆脱了冬日饥荒的煎熬后,研究人员开始审视突如其来的灾难对特定人群的影响,而他们曾经预测人们会出现诸如营养不良与生长迟缓之类的表现。此外,饥荒中幸存的儿童也面临着慢性健康问题:抑郁、焦虑、心脏病、牙龈病、骨质疏松症与糖尿病等。(著名女演员奥黛丽·赫本也是幸存者之一,她曾经饱受各种慢性病的折磨。)
然而到了20世纪80年代,研究人员却发现了一种非常有趣的模式:对于那些在冬日饥荒期间怀孕的女性来说,她们的孩子在长大成人后具有较高的肥胖症与心脏病发病率。当然这一发现也在预料之内。由于子宫内的胎儿在营养不良的条件下会出现生理机能变化,因此在营养物质缺乏的情况下,胎儿的代谢方式将改为通过储存大量脂肪来抵御热量损失,从而导致迟发性肥胖与代谢紊乱。但是如果想要从冬日饥荒中获得具有说服力的结果,那么我们还需要把其后代的数据纳入综合考虑。20世纪90年代,研究人员发现冬日饥荒幸存者的孙辈也存在较高的肥胖症与心脏病发病率。不知什么原因,突如其来的饥荒不仅对于经历浩劫的幸存者基因产生了影响,而且这些遗传信息还传递到了他们的孙辈。因此某些遗传因素或因子必定已经在饥饿人群的基因组中留下烙印,并且其作用还至少延续了两代人。冬日饥荒不仅载入了史册,同时也形成了这个民族的遗传记忆。
但什么是“遗传记忆”呢?遗传记忆是如何超越基因本身进行编码的呢?沃丁顿并未接触过关于冬日饥荒的研究,尽管大部分结果直到他于1975年去世时都未引起重视,但是遗传学家还是机敏地发现了沃丁顿假说与上述多代疾病之间的联系。其中的“遗传记忆”现象显而易见:饥荒幸存者的子孙容易发生代谢性疾病,仿佛他们的基因组携带有祖辈代谢异常的记忆。但是基因序列的改变不可能是产生此类“记忆”的原因:这项队列研究涵盖的人数成千上万,他们的基因不会在祖孙三代人中均发生同样的突变。对于冬日饥荒的幸存者来说,“基因与环境”之间的交互作用改变了他们的表型(例如,发展成某种疾病的倾向)。当人们遭遇饥荒的折磨后,必定会有某种成分融入了基因组,而这些永久性的遗传标记可以世代相传。
假如上述信息能够插入基因组,那么它将带来前所未有的改变。首先,它将挑战经典达尔文进化论的本质特征。从理论上来讲,达尔文进化论的一个重要观点就是,基因无法以某种永久性的可遗传方式来记住生物体的经历。即便羚羊使劲伸长脖子想去够到高处的树叶,其基因也不会为这种努力留下印记,而它的后代更不可能变成长颈鹿(请不要忘记,拉马克进化论的谬误之处就是把适应性直接作为遗传性状)。更确切地来说,长颈鹿的出现是自发变异与自然选择的结果:它们的祖先中可能会出现某些颈部较长的突变体,而在饥荒肆虐期间,这些具有长颈的个体经过自然选择后得以生存。奥古斯特·魏斯曼曾经切断五代小鼠的尾巴来验证环境因素是否能够永久性地改变它们的基因,可是他没有想到第六代小鼠依然长出了完整的尾巴。进化可以在不经意之间造就完美适应环境的生物体:理查德·道金斯认为进化是个丢三落四的“盲眼钟表匠”。生存与选择是进化的唯一驱动力,突变则是它仅存的记忆。
对于冬日饥荒幸存者的孙辈来说,他们获得祖辈饥荒记忆的机制与突变和选择无关,而是把环境信息转化成为某种可以遗传的因子。我们可以将此类“记忆”遗传的形式视为进化过程中的“虫洞”。例如长颈鹿的祖先并没有经过马尔萨斯逻辑、生存与选择的考验,这些个体可能只是把伸长脖子的记忆永远铭刻在其基因组中。依此类推,切断尾巴的小鼠在把信息反馈给基因后应该生出短尾的后代。此外,在启发性环境下成长的孩子的子孙也应具有积极向上的心态。其实上述想法不过是达尔文泛生论的复述,无非是想说明生物体特殊的经历或者历史可以直接影响基因组。这种系统就像是生物体适应性与进化之间的快速公交,它可以让盲眼钟表匠重见光明。
然而沃丁顿本人在该问题的答案上有着自己独到的见解。沃丁顿从年轻时就信仰马克思主义,他认为发现基因组中的“记忆定格”元素不仅可以完善人类胚胎学研究,还将帮助其实现宏伟的政治抱负。如果可以通纵操纵基因记忆来左右细胞的功能,那么也许人类也可以被思想改造(回想一下李森科曾对小麦植株的尝试,还有斯大林试图消灭不同政见者的举动)。这种过程可能会抹去细胞的固有身份,并且允许其沿着“沃丁顿景观”反向运动,于是成体细胞开始向胚胎细胞转化,原有的生物钟也发生了逆转。它甚至有可能解开关于人类记忆、身份与选择的固定不变之谜。

直到20世纪50年代末期,表观遗传学还处于远离现实的想象阶段:当时没有人能够从基因组水平诠释细胞的历史或身份。1961年,在相距不足20英里的地方,研究人员在6个月之内分别进行了两项不同的实验,其结果将改变人们对于基因的理解,并且为沃丁顿的理论提供强有力的支持。
1958年夏季,约翰·格登(John Gurdon)在牛津大学读研期间开始专注于青蛙的生长发育。20世纪50年代早期,两位在费城工作的科学家通过吸出细胞核的方法将未受精青蛙卵细胞中的全部基因去除,然后再将其他青蛙的基因组注入剩下的无核卵细胞内。这就像是把假鸟偷偷放入鸟巢,然后期待它可以在那里正常发育。那么“鸟巢”(也就是去除全部自身基因的无核卵细胞)是否含有其他青蛙基因组发育成胚胎所需的所有因子呢?实验结果证明了上述结论,来自费城的研究人员将某只青蛙的基因组注入无核卵细胞后孵出了蝌蚪。我们可以把它视为某种极端的寄生方式:卵细胞不过是个宿主或容器,它为来自正常细胞的基因组提供了场所,并使其发育成完全正常的成年动物。研究人员将这种方法称为核移植,由于在实际应用中成功率极低,因此他们最终基本上放弃了该技术。
格登对上述研究非常着迷,于是他也开始在实验中尝试这种方法。值得注意的是,前面那两位费城同行注入去核卵细胞的是幼胚细胞核。1961年,格登将成年青蛙小肠细胞的基因组注入去核卵细胞,希望能够借此来验证该方法是否可以培养出蝌蚪。这种将成年青蛙细胞核(即全部基因)移植到去核卵细胞的实验大获成功。
格登的实验结果激发了许多生物学家的想象力,但是产生这种轰动与其科幻小说般的情节毫无关系。格登曾经在实验中使用青蛙的小肠细胞培育出18个克隆体,然后将它们分别置于18个完全相同的培养皿内,而这些克隆体就像是隐身于18个平行宇宙中的分身幽灵(Doppelgänger)。与此同时,格登实验所蕴含的科学原理也令人们浮想联翩:当完全成熟的成体细胞基因组与卵细胞的细胞质短暂接触后,它又可以恢复成为一个具有完全活力的胚胎。简而言之,卵细胞能够为基因组提供发育成为合格胚胎所需的全部因子。随后,人们在格登实验的基础上把研究对象扩展至其他动物。其中最著名的研究成果当属克隆羊多利,而这也是世界上首次通过无性生殖培育出高等生物(生物学家约翰·梅纳德·史密斯后来评论:除此之外,只有耶稣基督诞生可以勉强与哺乳动物的无性生殖相提并论)。2012年,格登凭借在核移植领域中的贡献荣获了诺贝尔奖。
成年青蛙基因组中的DNA序列与接受核移植的胚胎或培养出的蝌蚪完全一致。根据遗传学基本原则,上述细胞应该含有相同的基因组。可是如果这些基因分布于不同的细胞中,那么它们可能会在某些条件下被启动或关闭,从而控制胚胎发育为成熟个体。
但是如果这些基因从结构上没有任何区别,那么为何成体细胞的基因组无法将其诱导为胚胎呢?而且就像其他研究结果证实的那样,为什么年幼动物的细胞核要比年长动物的细胞核更容易让胚胎发育出现逆转呢?实际上,格登实验与冬日饥荒研究均再次验证了某些累积因素的强大力量,它们可以循序渐进地在成体细胞基因组中留下永久的标记,从而使基因组在发育过程中有进无退。虽然这些标记并不存在于基因序列之中,但是基因表达却发生了可遗传的改变。现在格登又回到了沃丁顿提出的问题上:如果每个细胞的基因组中都携带有反映其历史与身份的印记,那么它可以被视为某种形式的细胞记忆吗?
从抽象意义上来讲,这种表观遗传标记似乎已经清晰可见,可是格登却没有在青蛙基因组上观察到此类印记。1961年,沃丁顿曾经的学生玛丽·莱昂(Mary Lyon)在某个动物细胞中发现了表观遗传改变的有力证据。
莱昂在哈维尔主要从事染色体生物学方面的研究,她在实验中通过荧光染料来观察它们的形态变化。令人惊讶的是,莱昂在雌性小鼠细胞中发现,除了两条X染色体之外,每对着色的染色体看上去都大同小异,而且其中有一条X染色体必然会出现皱缩与浓聚。研究证实皱缩后的染色体基因并未发生改变:两条染色体上的DNA序列完全相同。然而它们的活性却大相径庭:皱缩染色体上的基因无法编码RNA,因此整条染色体处于“沉默”状态。仿佛该染色体在被强制退役的同时彻底失去活性。莱昂发现失活的X染色体呈随机分布,它们在不同的细胞中可能分别来自父本或者母本X染色体。这种模式是所有包含两个X染色体的细胞的普遍特征,也就是说雌性动物的每个细胞均符合上述特征。那么X染色体失活有什么意义呢?由于雌性动物具有两条X染色体,而雄性动物只有一条X染色体,因此X染色体失活可以让具有两条染色体的雌性动物细胞产生相同“剂量”的基因。
时至今日,我们仍不清楚X染色体发生选择性沉默的原因或意义。但是X染色体的随机失活却可以产生重大的生物学意义:雌性动物是两种不同细胞组成的嵌合体。在大多数情况下,X染色体随机沉默无法通过表型来检测,除非某条X染色体(例如来自父本X染色体)上碰巧携带明确表征的变异基因。即便是这样,细胞表达变异基因的情况也会不尽相同,于是就产生了嵌合样效应。例如,在猫科动物中,控制毛色的基因位于X染色体。X染色体随机失活将导致细胞产生不同的色素,因此只有通过表观遗传学而不是遗传学才能解释三色猫毛色的难题。(如果人类肤色基因也位于X染色体上,那么不同肤色夫妻所生女孩的皮肤也将表现为深浅不一。)
那么细胞是如何使整条染色体发生“沉默”的呢?该过程涉及的内容非常复杂,已经超出环境信息导致个别基因活化与失活的范围,整条染色体以及上面的全部基因都将永久性失活。20世纪70年代,学术界提出了一项最符合逻辑的猜测,也就是细胞以某种方式为染色体中的DNA打上了永久的化学烙印,或者说是某种分子水平的“休止符”。既然基因本身的结构始终保持完整,那么此类标记应该附在基因之上,而这也符合沃丁顿提出的表观遗传理论。
20世纪70年代末期,正在研究基因沉默现象的科学家发现,附着在DNA上的一种名为甲基的小分子与基因关闭有关。而该过程的主要策动者之一后来被发现是一种名为XIST的RNA分子。研究发现上述RNA分子“覆盖”了染色体的部分区域是产生染色体沉默的关健因素。同时这些甲基标签好似项链上的饰物,它们被认为是某些基因的关闭信号。
然而甲基标签并非DNA链上唯一的修饰物。戴维·阿利斯(David Allis)是来自纽约洛克菲勒大学的一名生物化学家,他于1996年发现了另一种能够对基因产生永久影响的标记系统。该系统可以作用于包装基因的组蛋白(histone),而不是直接在基因上留下标记。
组蛋白与DNA紧密结合在一起,它们盘绕成螺旋状结构并形成染色体骨架。当骨架发生变化时,基因的活性也将会随之发生改变,而这就像是通过改变包装规格来影响材料的属性(缠绕成团与拉伸成束的丝线属性截然不同)。于是附着在蛋白质上的环境信号就可以间接地在基因上留下“分子记忆”。当细胞开始分裂,这些分子印记将被复制到子细胞中,并且记录下几代细胞的足迹。可想而知,当精子或者卵子形成时,分子印记也会被复制到生殖细胞中,从而记录下几代生物体的变迁。虽然关于组蛋白标记的研究尚有待完善(其中就包括组蛋白标记的遗传性与稳定性,以及确保它们出现在合适的时间与地点的机制),但是对于酵母菌与蠕虫等简单生物体来说,它们体内的组蛋白标记似乎能够延续数代。
我们现在已经知道,在各种化学标签与标记的作用下,基因沉默与活化是一种切实可行的基因调控方法。尽管人们在几十年前就发现了基因可以短暂启动与关闭,但是这种沉默与重新激活的系统不会转瞬即逝,并且会在基因上留下永久的化学印记。它们将根据来自细胞或环境的信息做出添加、消除、放大、缩小、打开或关闭等应答。这些标记就像是语句中的注释或者书中留下的旁注(铅笔线、划线单词、划痕、划掉的字母、下标与尾注),它们可以在基因序列不变的前提下对基因组起到修饰作用。假设生物体中每个细胞的遗传信息均源自这部作品,可是它们采取的处理方式却各有千秋,例如划掉与添加特殊句型、“沉默”与“激活”特定单词以及强调某些短语,那么这些细胞将根据相同的脚本撰写出不同的故事。我们可以通过以下例句来反映人类基因组中化学印记的表现形式:
…This…is…the…… , , ,……struc…ture , ……of… Your……Gen…ome…
就像前述章节描写的那样,上述例句中的单词对应的就是基因。省略号与逗号代表了内含子、基因间区域与调控序列。而粗体大写字母与划线单词就相当于附加在基因组上的表观遗传标记。
现在人们终于找到了格登实验难以逆转成年青蛙小肠细胞胚胎发育的症结:由于小肠细胞基因组被附加了许多表观遗传“标签”,因此只有将这些“标签”抹除后才能让它转化为胚胎基因组。虽然我们能够改写基因组上的化学印记,但是这就像改变人类记忆一样困难重重,而上述化学印记保持稳定将确保细胞身份不会轻易发生改变。只有胚胎细胞基因组具备足够的灵活性时,这些细胞才可能获得与众不同的身份,并且进一步发育成为体内各种类型的细胞。一旦胚胎细胞的身份固定下来,例如分化为小肠细胞、血细胞或神经细胞,那么该过程就几乎没有逆转的可能(因此格登在青蛙小肠细胞逆向培育蝌蚪的实验中举步维艰)。胚胎细胞可以根据相同的脚本演绎出各式各样的作品,而其它细胞就像是一本已经定调的青年小说,很难将其改编成为维多利亚式的恋爱故事。
虽然表观遗传学部分诠释了细胞的个体特征之谜,但是也许它还可以破解更为复杂的人类个体差异之谜。我们曾经在之前的章节中问过:“为什么在相同环境与家庭中成长的同卵双胞胎会拥有迥异的生活与特征呢?”现在我们可以将其解释为双胞胎体内具有记录特殊事件的化学标记。然而这些化学标记又是以何种方式进行“记录”的呢?实际上基因序列中并不存在此类标记:如果你在50年内每隔10年对某对同卵双胞胎进行基因组测序,那么全部测序结果均会保持一致。但是如果你在同样的时间段内把测序对象改为表观基因组,那么就会发现他们的结果迥然不同:在实验伊始阶段,双胞胎体内附着于血细胞或神经元上的甲基基团几乎完全相同,但是它们之间的差异在第一个10年到来时就会逐步显现,并且将在50年后成为天壤之别。
研究显示,双胞胎对于随机事件(创伤、感染与冲动)、乐曲旋律以及街头美味(巴黎的玛德琳蛋糕)的反应千差万别。而这些事件可以让他们体内的基因“启动”或者“关闭”,并且逐渐在基因序列中留下表观遗传标记。尽管每个基因组都携带有创伤修复与机体愈合的信息,但是它们只是在被写入基因后才能够发挥作用,甚至可以说环境信号也需要借助基因组来显示其存在。如果说“后天”因素的影子无所不在,那么它也只是“先天”因素的映像。但是这种想法却让人们面临某种惴惴不安的哲学困境:如果抹去双胞胎基因组中的表观遗传印记,那么是否这些偶然事件、环境因素与后天因素从理论上就可以销声匿迹了呢?同卵双胞胎的命运能否真正实现表里如一?
表观遗传系统的存在就是为了让基因组选择性地发挥作用,并且最终让细胞具备自身的个体特征,而生物体的个体特征或许只是机缘巧合的结果。
2006年,日本干细胞生物学家山中伸弥通过实验重置了细胞记忆,这也许是表观遗传学研究中最具说服力的典范。山中伸弥再次与格登产生了交集,他也开始尝试细胞身份逆转的研究,只不过实验对象采用了成年小鼠的皮肤细胞。
该实验的结果不仅令山中伸弥感到意外,而且还让全世界的科学家为之震惊,转入成熟皮肤细胞的四个基因使一小部分细胞获得了类似于胚胎干细胞的功能。这种干细胞既能够产生皮肤细胞,也可以分化成为肌肉、骨骼、血液、小肠与神经细胞。实际上,它们能够分化成为整个生物体中所有类型的细胞。山中伸弥与同事们仔细分析了皮肤细胞逆转(或者称之为“回归”)成胚胎样细胞的原因,他们发现该过程由一系列级联事件所组成。基因电路的激活或抑制将导致细胞代谢发生重置,随后表观遗传标记会被抹除并得到重写,同时细胞也会调整其形状与大小。原有的皱纹不见踪影,僵硬的关节恢复柔韧,我们仿佛看到青春再现,而细胞也将重新登上沃丁顿景观中的斜坡。山中伸弥终于可以抹去细胞的记忆来逆转其生物钟了。
不仅如此,该研究还取得了其他意外的收获。山中伸弥用来扭转细胞命运的四种基因之一被称为c——myc。myc基因并非等闲之辈,它不仅是一种重要的再生因子,同时也是生物学中功能最为强大的细胞生长与代谢调控调节因子。当该基因被异常激活后,它可以诱导成体细胞转化为胚胎样状态,从而使山中伸弥的胚胎逆转实验成为可能(这种功能只有在其他三个基因的协同配合下才可以实现)。但是myc也是生物学中最具危险的致癌基因之一,它在白血病、淋巴瘤、胰腺癌、胃癌以及子宫癌中表现为异常激活。就像某些古代寓言指出的那样,追求青春永驻将付出惨痛的代价。虽然此类基因可以让细胞摆脱死亡与年龄的束缚,但是它们也会将其命运引向永生化与无限增殖的泥潭,而这些都是恶性肿瘤所具有的典型特征。

根据基因与基因组调控蛋白的研究结果,我们终于理解了荷兰冬日饥荒及其后续影响的发生机制。毫无疑问,对于那些在1945年遭受急性饥饿折磨的人来说,他们体内参与能量代谢与储存的基因表达已经发生了变化。起初这种变化的作用时间非常短暂,可能只涉及环境中营养成分变化基因的启动或关闭。但是随着饥荒持续的时间进一步延长,人体内的代谢模式也将逐渐固化下来,当这种瞬间的变化凝聚成永恒之后,它们就会在基因组上留下印记。食物长期匮乏的信号通过激素在器官之间弥散,并且会导致体内重组基因的过度表达。在此过程中,细胞内的蛋白质会想方设法拦截此类信号,而附着于DNA上的印记将协助它们逐个关闭基因。这就像屹立在风暴之中的房屋,如果想要保护建筑物不受破坏,那么只能把基因发挥作用的路径完全封死。无论是基因上附着的甲基化标记,还是经过化学修饰的组蛋白,它们都记载着冬日饥荒的回忆。
为了适应恶劣的生存环境,人体内的细胞与器官均需要经过重新编程。最终,就连精子与卵子这些生殖细胞上也出现了此类标记(我们并不清楚精子与卵子携带饥饿应答记忆的原因与机制;也许对于生殖细胞来说,人类DNA中某些古老的通路记录了饥饿或贫困)。当这些精子与卵子结合孕育出子孙后代时,它们形成的胚胎也可能携带有此类标记,以至于在冬日饥荒过去数十年后,代谢性改变依然铭刻在他们的基因组内。综上所述,历史记忆就是按照这种模式转化成为细胞记忆的。
值得警惕的是,表观遗传学也正处于某种危险观念的边缘。虽然基因经过表观遗传修饰后可能在细胞与基因组上叠加历史与环境信息,但是这种特殊的能力不仅颇具风险且结果难以预测:饥荒幸存者的后代可能会患有肥胖症与营养过剩,然而父亲患有结核病却不会改变孩子对于该病的应答。实际上,大多数表观遗传“记忆”是古老进化通路演绎的结果,我们不能将客观现实与主观愿望混为一谈。
就像20世纪早期的遗传学一样,表观遗传学目前也肩负着辨别垃圾科学与抑制疾病发生的使命。当我们面对这些旨在改变遗传信息的手段(饮食、暴露、记忆与治疗)时,不禁想起了李森科使用休克疗法获得高产小麦的荒谬尝试。在现实生活中,人们也希望女性在怀孕后通过保持心情舒畅来避免其子孙后代发生线粒体损伤。拉马克学说仿佛重振雄风并成为新时代的孟德尔定律。
总而言之,这些关于表观遗传学的肤浅概念理应招致怀疑。虽然环境信息可以铭刻在基因组上,但是其中大多数印记只反映了单个生物体细胞与基因组的“遗传记忆”,它们并不能在日后的繁衍过程中薪火相传。假如某人在意外中失去一条腿,那么该事件将在细胞、伤口以及瘢痕中留下印记,但是此类结果并不会导致其后代的下肢出现短缩,就像我与孩子们也没有受到家族中精神异常亲属的拖累。
虽然墨涅拉俄斯(Menelaus)曾经告诫说,祖先的血脉正在从我们体内消失,但是幸好他们的瑕疵与罪孽也一同逝去。因此我们对于这种安排理应庆贺而不是懊悔。基因组与表观基因组存在的意义在于,它们可以跨越细胞与世代的时空来传承相似性与历史记忆。而基因突变、基因重组与记忆消除则可以拮抗这些力量,并且推进差异、变化、畸形、天赋与再造的产生,同时在继往开来的过程中为更加辉煌的明天开辟崭新的道路。可想而知,基因与表观基因在人类胚胎发生中起着相互配合的作用。现在让我们再回到摩尔根的问题上来:单细胞胚胎是如何发育成为多细胞生物体的呢?当受精作用完成几秒钟后,胚胎就开始迅速发育。与此同时,各种蛋白质也会蜂拥进入细胞核,并且逐步影响基因开关的启动与关闭,仿佛沉寂在太空的飞船突然焕发出勃勃生机。尽管上述基因表达会受到激活与抑制的影响,但是它们编码的蛋白质又会激活或抑制其他基因。现在单个细胞开始按照倍增的方式分裂形成中空的胚泡,接着参与协调细胞代谢、运动、命运以及身份的基因纷纷开始启动,随后细胞内部的各种通信线路也正式投入使用。整个过程就像锅炉缓慢升温与灯光明暗闪烁一样秩序井然。
现在这种第二遗传密码可以让细胞中的基因表达恰到好处,并且使每个细胞都能够获得固定的身份。对于某些特定基因来说,增减化学标记可以单独调节它们在细胞中的表达。例如,DNA甲基化与组蛋白修饰均可起到抑制或激活基因的作用。
随着胚胎继续发育,原始体节会被细胞取代。当新近合成的基因发出肢体与器官分化指令后,单个细胞基因组上会出现更多的化学标记。而这些附有化学标记的细胞日后将形成不同的器官与结构:例如前肢、后肢、肌肉、肾脏、骨骼以及眼睛等。在胚胎发育期间,某些细胞会出现程序性死亡。与此同时,维持细胞功能、代谢与修复的基因开始启动。于是单个细胞就逐渐成长为生物体。
亲爱的读者们,请不要被这些描述蒙蔽或误导,产生“我的天啊!这个过程太复杂了!”之类的想法,并因此认为没有人能够在深思熟虑之后理解、破译或操纵这些机制。
当科学家低估了复杂性的危害时,他们将会遇到事与愿违的结果。而这种失败的案例在科学实践中比比皆是:例如控制虫害的外来物种却成为入侵者;原以为增加烟囱高度可以缓解城市污染,殊不知空气中颗粒物排放的提升反而加剧了污染;本来希望通过促进造血来预防心脏病发作,但是却没想到血液黏稠度上升会增加心脏血栓的风险。
然而当普通人高估了复杂性的难度并且感觉“谜题无人能解”时,他们又会陷入意想不到的泥潭。20世纪50年代早期,某些生物学家曾经坚信遗传密码具有环境依赖性,他们认为这种错综复杂的关系完全取决于特定生物体中的特定细胞,而试图破解遗传密码的想法简直就是天方夜谭。后来人们发现事实恰恰相反:只有一种分子能够携带这种在生物界通用的遗传密码。如果能够掌握这种密码的规律,那么我们就可以对生物体甚至人类进行定向改造。同样在20世纪60年代,许多人都怀疑克隆技术能否实现基因在物种之间的互换。而直到1980年,人们还无法借助细菌细胞来合成哺乳动物蛋白,或者通过哺乳动物细胞来合成细菌蛋白;按照伯格的话来说,这些事情实在“简单得可笑”。其实不同物种往往似是而非,“自然”不过是“虚张声势的伪装”。由于遗传指令在人类起源中的角色非常复杂,因此我们至今对于其详细的调控机制仍然一无所知。如果社会科学家一味强调形态、功能或命运取决于基因与环境的交互作用(基因并非是唯一因素),那么他实际上低估了主控基因决定生理状态与解剖结构的强大自主能力。如果人类遗传学家认为“多基因控制的复杂状态与行为并不遵循遗传学规律”,那么这位遗传学家就低估了基因的力量(例如能够“重置”整个生命状态的主控基因)。假如激活四个基因就可以使皮肤细胞转化为多能干细胞,假如某种药物可以彻底改变大脑的身份,假如单个基因发生突变就可以使性别与性别认同发生转换,那么无论是人类基因组还是我们自身都比想象中的要更容易改变。

我曾经在前述章节中写到,技术只有在促成转换时才能彰显其强大的推动力:例如,直线运动与圆周运动(车轮)之间,或者是现实与虚拟(网络)之间的转换。相比之下,科学的优势在于阐明组织规则与定律,其角色相当于透过放大镜对世界进行观察与分类。而技术专家努力通过这些转换将我们从现实的束缚中解放出来。科学在持续发展中不断推陈出新,并且界定了可行性范围的外部极限。与此同时,这些具有深远影响的技术创新也展现出人类征服世界的决心:例如,发动机(engine)源自拉丁语聪明(ingenium)或智慧(ingenuity)、计算机(computer)则源自拉丁语计算(computare)或推算(reckoning together)。与之形成鲜明对比的是,深奥的科学定律往往带有浓厚的认知局限性:例如,不确定性、相对性、片面性以及不可能性。
但是生物学却在所有学科中独树一帜:它从创建之初就缺乏可供参考的理论,就算到现在也很难找到普遍适用的定律。虽然芸芸众生都遵循物理与化学的基本原则,但是生命起源往往就存在于这些定律之间的边缘与空隙,并且一直在伺机突破它们的极限。宇宙在实现平衡的过程中会消耗能量、破坏组织甚至制造混乱,而生命的意义就是与这些力量进行抗争。为此人体采取的策略包括减缓反应、集中资源以及调整成分,整个过程就像我们每周三收拾即将送洗的衣服。詹姆斯·格雷克(James Gleick)写道:“有时看起来我们想要遏制宇宙混沌的目标根本不切实际。”人们赖以生存的自然法则并非毫无破绽,我们依旧期待抓住机遇锐意进取。毫无疑问,自然法则仍然主宰着世间万物的运行规律,但是神奇的生命却始终在顽强地挑战极限并走向繁荣。即便是大象也不能违背热力学定律,它们巨大的身躯在运动中完成了特殊的能量传递。
生物信息的循环流动或许正是为数不多的生物学规律之一。

图片发自简书App

当然这种信息流动的方向也会出现例外(例如,逆转录病毒可以完成从RNA到DNA的逆向转换)。虽然在生物学世界中还存在某些尚未发现的机制,它们可能会改变生命系统中信息流的顺序或组成(例如,现在已知RNA能够影响基因调控),但是我们已经能够大致描述这些生物信息流的概念。
实际上,这种信息流可能已经非常接近我们需要的生物学定律。当我们从技术上掌控了上述定律时,就会迎来人类历史上最深刻的变革,也就是即将实现对自身基因进行读写。

但是在展望基因组的未来之前,我们还是先回顾一下它神秘的过去。杰克·绍斯塔克(Jack Szostak)是一位态度温和的哈佛大学生物化学家,他用了20多年的时间希望能够在试管中构建自我复制的遗传体系。
绍斯塔克的实验延续了斯坦利·米勒(Stanley Miller)的工作。米勒是一位颇有远见卓识的化学家,他曾经将某些存在于原始大气中的基本化学物质混合后合成“原始汤”。20世纪50年代,米勒正在芝加哥大学从事研究工作,他将甲烷、二氧化碳、氨气、氧气以及氢气经通风孔引入到密闭的玻璃烧瓶中,并且在注入高温蒸汽的同时用电火花模拟闪电,然后通过循环加热与冷却烧瓶模拟原始世界变幻莫测的环境。而这个不起眼的烧瓶中凝聚了烈火与硫黄、天堂与地狱以及空气与水相互交融的精华。
当实验进行3周以后,人们并未从烧瓶中发现任何生命迹象,但是米勒却在这些历经高温放电的原料混合物(二氧化碳、甲烷、水、氨气、氧气以及氢气等)中发现了氨基酸(构成蛋白质的基本单位)与单糖的痕迹。研究人员在米勒实验的基础上又在原料中加入了黏土、玄武岩与火山岩,他们随后在产物中发现了脂质与脂肪结构的雏形,而其中甚至还包括RNA与DNA的化学成分。
绍斯塔克认为,两种成分的机缘巧遇促成了基因从“原始汤”中横空出世。首先,原始汤中产生的脂类彼此结合形成胶束,而这种中空的球状膜有点类似于肥皂泡,它可以将液体包裹起来并且参与构成细胞膜(某些脂肪与水溶液混合时就会自然凝聚成这种膜泡)。绍斯塔克的实验已经证明,此类胶束的作用类似原始细胞:如果研究人员能为它们提供更多的脂质,那么这些中空“细胞”的尺寸就会继续增大。它们将在运动中不断延展,同时纤细的凸起形成了胞膜边缘波动。
其次,在自组装胶束形成的同时,核苷(碱基A、C、G、U或其化学前体物质)也通过一系列化学反应组成了RNA链。虽然这些RNA链绝大多数并不具备自我复制的能力,但是在数以亿计不具备复制能力的RNA分子中,碰巧就有一个RNA分子奇迹般地完成了自我复制,或者说它根据自身镜像生成了一个拷贝(RNA与DNA分子固有的化学结构为镜像分子的产生创造了条件)。令人难以置信的是,这种RNA分子具有从化学混合物中富集核苷的能力,并且可以将其串联起来形成新的RNA拷贝,它实际上就是一种具备自我复制能力的化学物质。
接下来就到了彼此融合的阶段。绍斯塔克认为这个过程可能发生在某个池塘或者沼泽的边缘,而拥有自我复制能力的RNA分子与胶束就在这里发生碰撞。从理论上来讲,该事件具有决定性的意义:两种陌生的分子在偶然相遇后坠入情网,并从此开启了一段悠远漫长的姻缘。当具有自我复制能力的RNA进入正在分裂的胶束内部后,胶束就可以将RNA分子在隔离的同时保护起来,只允许RNA在安全的膜泡内进行特殊的化学反应。反过来,RNA分子又会启动编码有利于RNA—胶束单元自体繁殖的信息。随着时间推移,RNA—胶束复合物中编码的信息将会为生成更多的复合物创造条件。
绍斯塔克写道:“这种由原初生命体(protocell)演变出RNA的过程相对容易理解。在此阶段,原初生命体内将会逐步出现新陈代谢,它们可以利用结构简单且数量充裕的原材料合成营养物质。接下来,这些生物体也许会在化学百宝箱中增加蛋白质合成的功能。”对于此类由RNA构成的原基因来说,它们可能已经掌握了诱导氨基酸成链与合成蛋白质的本领,也就是说,这种具有多种用途的分子机器可以使新陈代谢、自体繁殖与信息传递的效率得到极大提升。
那么离散的“基因”(信息模块)是何时以及为何出现在RNA链上的呢?难道基因从一开始就是以模块化形式存在的吗?还是说信息储存具有某种中间或者替代形式吗?尽管我们依然无法回答上述问题,但是也许信息论可以为破解迷局提供关键的证据。对于连续出现的非模块化信息来说,其麻烦之处在于管理起来十分困难。这种信息具有弥散、易损、无序、局限以及衰减的特点,并且它们之间的界线往往无法梳理清楚。如果来自四面八方的信息彼此交错在一起,那么系统将面临更加严重的失真风险,而这就相当于黑胶唱片上出现的严重凹痕。相比之下,“数字化”信息更容易得到修复与弥补。我们无须翻遍整个图书馆就能找到或修改书中的某句话。综上所述,基因的问世可能也是基于相同的道理:某条RNA链上呈离散分布的信息模块可以通过编码指令来满足离散与个体的功能。
然而信息的不连续性也会带来额外的优势:这可以让突变的影响只局限于某个基因,并且同时保证其他基因不被累及。现在突变将有针对性地作用于这些离散的信息模块,因此可以在不破坏生物体功能的情况下加速进化。但是上述优势也可能转化为弊端:如果突变数量过多,那么信息将会出现损坏或丢失。也许信息也需要某种备份拷贝,而这种镜像可以使信息在遭到损坏的时候得以保全或者恢复原型。当然这也可能是构建双链核苷酸的原动力。由于核苷酸链上的数据将在互补链中得到完美的映射,因此任何数据破坏都可以被重新修复,其作用就像是记载生命轨迹的硬盘存储器。
经过岁月漫长的磨砺后,DNA这种物质终于肩负起遗传信息原版拷贝的重任。虽然DNA由RNA演化而来,但是它很快就替代RNA成为基因的载体,并且在生命系统中发挥着至关重要的作用。古希腊神话记述了父亲克洛诺斯(Cronus)被儿子宙斯(Zeus)推翻的经过,而这个故事仿佛也被铭刻在人类基因组发展的历史中。

第六部分 后基因组时代——遗传学的命运与未来(2015─ )

第一章 未来的未来

1974年,就在DNA重组技术问世仅仅3年之后,研究人员就进行了一次大胆的尝试,他们使用经过基因修饰的SV40病毒来感染早期小鼠胚胎细胞。被病毒感染的胚胎细胞与正常胚胎的细胞混合后可以形成胚胎“嵌合体”(chimera),随后这些混合胚胎被植入到小鼠体内。此类胚胎的全部器官与细胞均由混合细胞构成,其中就包括血液、大脑、内脏、心脏、肌肉以及最重要的精子与卵子。如果病毒感染的胚胎细胞能够形成新生小鼠的部分精子与卵子,那么病毒基因就可以像其他基因一样在小鼠代际垂直传递。病毒就像是经过伪装的特洛伊木马,可以将基因偷运至动物基因组中并且延续多代,从而创建出首批转基因高等生物。
该实验在启动初期进展顺利,但是后来却遇到了两个意想不到的难题。首先,尽管携带病毒基因的细胞确实出现在小鼠的血液、肌肉、大脑及神经组织中,但是病毒基因导入精子与卵子的效率却极其低下。无论怎样尝试,科学家们都不能让基因实现高效代际“垂直”传递。其次,虽然病毒基因存在于小鼠细胞中,但是这些基因的表达却被彻底封闭,从而导致无法产生RNA或蛋白质的惰性基因形成。科学家们在多年以后才发现,病毒基因上附加的表观遗传标记使它们集体发生沉默。现在我们知道,细胞在很久以前就具有识别病毒基因的探测器,其作用相当于给病毒打上了化学休止符,从而防止它们出现激活现象。基因组似乎早已预料到这种危机并随时准备进行博弈。在魔术界流行着一则古老的谚语:在学会让物体消失前,要先学会让物体重现。从事基因治疗的专家也可以从中汲取经验教训。根据目前的技术水平,将基因悄无声息地导入细胞与胚胎并不困难,但是真正的挑战在于能否恢复这些基因的功能。

在这些早期研究遭遇挫折之后,基因治疗的发展停滞了大约10年之久,而该领域重获新生要归功于胚胎干细胞(embryonic stem cells , ES)的发现。为了理解人类基因治疗的未来,我们先要熟悉胚胎干细胞的概念。现在让我们以某种器官(大脑或者皮肤)为例进行说明。随着动物的年龄不断增长,皮肤表面的细胞也会经历生长、死亡与脱落的过程。但是如果发生了烧伤或重大创伤,这种大规模的细胞死亡就可能演变为一场灾难。由于需要替代这些死细胞,因此大多数器官具有再生细胞的能力。我们提到的干细胞就具备这种再生功能,尤其是在面临灾难性细胞损伤的情况下,它的重要性就愈发凸显。干细胞是一种特殊的细胞,它可以分为两种类型。在某些条件下,它能够分化成为其他功能细胞,例如神经细胞或皮肤细胞。同时,它还能进行自我更新,也就是说,干细胞能够产生更多的干细胞,进而再分化形成器官所需的功能细胞。干细胞就像是一位拥有子代、孙代、曾孙代的祖辈,它能够产生一代又一代的细胞,并且从不会失去自身的繁殖能力。而它就是组织或器官得以再生的最终源泉。
大多数干细胞都存在于特定的器官与组织中,而且它们只能生成某些种类有限的细胞。例如,骨髓中的干细胞只能生成血细胞,存在于肠道隐窝处的干细胞则专门用于生成肠道细胞。但是源自动物胚胎内鞘的胚胎干细胞却拥有巨大的潜能,它们能够生成生物体中各种类型的细胞(造血细胞、神经细胞、肠道细胞、肌细胞、骨细胞以及皮肤细胞)。因此生物学家用“多能”一词来描述胚胎干细胞的特性。
此外,胚胎干细胞还具有第三种与众不同的特性。胚胎干细胞可以从生物体的胚胎里提取出来并在实验室的培养皿中生长。如果营养条件充足,那么它们将会在培养基中持续生长。通过显微镜的放大作用,我们可以看到半透明的微小球体聚集成巢状的回旋,与其说它们是正在形成的生物体,还不如说是正在消融的器官。实际上,早在20世纪80年代早期,英国剑桥大学的某个实验室就在世界上首次从小鼠胚胎中获得了胚胎干细胞,不过这项重要的成果却未引起遗传学家的兴趣。胚胎学家马丁·埃文斯(Martin Evans)曾经抱怨道:“似乎没有人对我发现的细胞感兴趣。”
其实胚胎干细胞真正的强大之处在于其分化能力:胚胎干细胞与DNA、基因以及病毒都具有二元性,而正是这种内在的属性使得胚胎干细胞成为潜在的生物学工具。胚胎干细胞在组织培养基中的表现与其他类型的细胞没什么两样。它们不仅可以在培养皿中生长,也能够在冻融之后恢复活力。这些细胞可以在液体培养基中繁殖数代,并且在其基因组中进行插入基因或切除基因的操作也相对容易。
但是如果把胚胎干细胞置于合适的环境与背景下,它们就会成长为新的生命。当它们与早期胚胎细胞相混合并被植入小鼠子宫后,这些胚胎干细胞将会分裂形成胚层。接下来,它们可以分化成为各种类型的细胞,例如,造血细胞、神经细胞、肌细胞、肝细胞,甚至是精子与卵子。这些完成分化的细胞将依次构建出不同的器官,然后再奇迹般地整合成具有多胚层的多细胞生物体,于是一只真正的小鼠就这样诞生了。我们在培养皿中进行的每一步操作都可以影响这只小鼠的生长发育。而通过对培养皿中的细胞进行基因修饰“实现”了子宫中生物体的基因改造,并且为科学研究与生命转化奠定了坚实的基础。
由于在胚胎干细胞中进行实验操作相对容易,因此这也就克服了较为棘手的第二个问题。当我们利用病毒将基因导入细胞时,实际上几乎没有办法控制它们在基因组中插入的位点。人类基因组具有30亿个DNA碱基对,该数字差不多是大部分病毒基因组大小的5万倍或者10万倍。对于插入基因组的病毒基因来说,它就像是从飞机上飘入大西洋的一张糖纸,人们根本没有办法来预测准确的着陆地点。实际上,几乎所有病毒(例如HIV或者SV40)都具备基因整合的能力,它们通常会将自身的基因随机附着在人类基因组的某些区域上。但是这种随机整合却成为阻碍基因治疗的死敌。病毒基因可能会落入基因组的沉默区间永远无法实现表达。它们也可能整合在染色体上的某个区域,而细胞很容易就可以让它们沉默。或者更糟糕的是,这种整合可能会在破坏必需基因的同时激活致癌基因,从而导致潜在的灾难发生。
但是科学家却掌握了通过胚胎干细胞实现基因改变的方法,并且这些靶点的位置就位于基因组之中或者基因内部。你可以选择某些巧妙的实验手段来改变胰岛素基因,同时确保细胞中只有胰岛素基因发生了改变。理论上来讲,由于基因修饰的胚胎干细胞能够生成各种类型的小鼠细胞,因此我们可以通过上述手段获得只有胰岛素基因发生改变的小鼠。实际上,如果基因修饰的胚胎干细胞最终在成年小鼠体内生成了精子与卵子,那么基因就可以在小鼠代际传递,这样也就实现了遗传物质的垂直传递。
这种技术具有十分深远的意义。在自然界中,唯一能够让基因发生定向或意向改变的途径就是随机突变与自然选择。如果将某只动物暴露在X射线下的话,那么基因组可能会永久地发生遗传改变,但是这种方法却不能让X射线只针对某个基因。自然选择一定会挑选能为生物体带来最佳适应性的突变,从而让这种突变在基因库中变得越来越普遍。但是在这种方案中,突变或进化都没有任何定向性或意向性。在自然界中,驱动遗传改变的引擎按照自身规律运转。就像理查德·道金斯提醒我们的那样,进化先天就是个“盲眼钟表匠”。
然而,某位科学家却可以借助胚胎干细胞来定向操纵几乎任何被选中的基因,并将这种遗传改变永久地融入动物的基因组中。其实我们也可以采用此类方法完成突变与选择,并且让进化在培养皿中迅速实现。这种具有强大变革能力的技术为生物界带来了一个全新的概念:它们就是转基因(也就是跨越基因的意思)动物。到了20世纪90年代早期,为了揭开基因功能的奥秘,世界各地的实验室已经创建出数以百计的转基因小鼠模型。其中某只小鼠的基因组被插入了水母基因,于是它就可以在黑暗的环境下发出蓝光。对于那些携带有生长激素基因变异体的小鼠来说,它们的体型大小将会达到对照组小鼠的两倍。此外,我们还可以通过基因改变让某些小鼠罹患阿尔茨海默症、癫痫或者早老症。如果小鼠体内的癌基因被激活,那么它们将罹患各种肿瘤,而这些小鼠也成为生物学家研究人类恶性肿瘤的理想模型。2014年,研究人员创建出一种携带单基因(控制大脑中神经元之间的通讯)突变的小鼠模型。人们发现,此类小鼠的记忆与认知功能都得到了极大的改善。它们可以称得上是啮齿类动物中的神童:不仅获取记忆更快而且保留记忆更久,同时学习新任务的速度接近于正常小鼠的两倍。
但是上述实验也充斥着复杂的伦理道德问题。这种技术能用于灵长类动物吗?可以用于人类吗?谁来管理转基因动物的创建?哪些基因会被导入或者说允许被导入?转基因技术存在哪些限制条件?
幸运的是,在伦理危害泛滥成灾之前,转基因技术自身遇到了发展的瓶颈。胚胎干细胞研究中大部分基础工作(包括转基因生物体的创建)都是通过小鼠细胞完成。20世纪90年代早期,随着人类胚胎干细胞从人类早期胚胎中提取成功,从事该领域研究的科学家也旋即遇到了意想不到的难题。与那些实验操作相对容易的小鼠胚胎干细胞不同的是,人类胚胎干细胞不能在培养基中生长。“这也许是该领域一个不为人知的小秘密:人类胚胎干细胞并不具备小鼠胚胎干细胞的能力。”生物学家鲁道夫·耶尼施(Rudolf Jaenisch)说:“你无法克隆它们,也无法使用它们进行基因打靶……它们与无所不能的小鼠胚胎干细胞区别很大。”
综上所述,转基因的精灵至少在短时间内还无法摆脱束缚。

虽然对于人类胚胎进行转基因修饰的想法在短期内无法实现,但是如果基因治疗专家降低他们的预期呢?病毒能否将基因导入人类的非生殖细胞(神经细胞、造血细胞以及肌细胞等)中呢?但是该过程也面临着基因随机整合的问题,而且最为重要的是,非生殖细胞的基因导入不会发生基因在生物体中的垂直传递。但是如果基因能够导入到合适的细胞中,那么它们仍可以起到治疗作用。其实这个目标就足以令人类医学飞越巅峰,而我们可以把它视为简化版的基因治疗。
1986年,在位于贝塞斯达的美国国立卫生研究院,威廉·弗仑奇·安德森(William French Anderson)与迈克尔·布里兹(Michael Blaese)领导的一个基因治疗团队正在紧锣密鼓地工作着,他们决定通过马利根载体的异构体将ADA基因导入患有ADA缺陷症患儿的体内。安德森先是从其他实验室获取了ADA基因,然后将其插入逆转录病毒的基因传递载体中。在20世纪80年代早期,安德森与布里兹就已经开展了某些初期试验,他们希望利用逆转录病毒载体将人类ADA基因导入至小鼠与猴子的造血干细胞中。安德森认为,只要这些干细胞能被携带ADA基因的病毒感染,那么它们就会生成各种血细胞成分,而其中就包括导入了活性ADA基因的T细胞。
尽管安德森在此项研究中投入了满腔热忱,同时病患家庭也提供了某些轶事证据,但是包括马利根在内的许多基因治疗支持者都认为,安德森进行的临床试验不过是哗众取宠的噱头。从安德森的试验立项伊始,马利根就是对此发表负面意见最多的批评者,他非常反感在没有充分数据支持的情况下就宣称试验已经取得成功。如果将流鼻涕的频率与纸巾的数量作为疗效评判的标准,那么壮志凌云的基因治疗人体试验简直是个天大的笑话。当某位记者问及马利根对于该方案的看法时,他毫不客气地答道:“这就是个骗局。”为了验证基因定向改变能否被导入人体细胞,以及这些基因能否安全有效地发挥正常功能,他提出了一项安全严谨的临床试验方案,并将其称为“完美的基因治疗”。
但是在那个时期,基因治疗专家的野心已经膨胀到极点,因此根本不可能实现这种“完美”的试验。在美国国立卫生研究院报道了T细胞临床试验后,基因治疗专家开始将目光投向其他遗传病,例如囊性纤维化与亨廷顿病。由于基因几乎可以导入任何细胞,因此任何细胞病(心脏病、精神病以及癌症)都可以成为基因治疗的理想对象。就在这个领域的研究准备加速冲刺的时候,马利根等学者却督促人们要保持谨慎与克制,但是他们的忠告随即被抛到脑后。然而失去理智的狂热必将会付出高昂的代价:它将把基因治疗与人类遗传学引向灾难的边缘,并且其自身也将从科学发展的巅峰坠入阴冷的深渊。
1999年9月9日,几乎就在阿善蒂·德席尔瓦接受基因修饰T细胞治疗9年之后,一位叫作杰西·基辛格(Jesse Gelsinger)的男孩来到费城接受另一项基因治疗试验。基辛格体内的突变基因叫作OTC(ornithine transcarbamylase),它本应该在肝脏内合成鸟胺酸氨甲酰基转移酶,而这种酶在蛋白分解的过程中起到关键的作用。
由于项目组严重忽视OTC临床试验中出现的各种问题,以至于他们根本没有意识到危机已经来临。即便当事人承认他们因为急于求成导致疏忽大意,但是基辛格的不幸去世依然是个谜:没人能够解释为何杰西·基辛格会对病毒产生如此严重的免疫应答,而其他17位接受基因治疗的患者却安然无恙。
在科学界有这样一句名言:最完美的理论也会被残酷的现实抹杀。而同样的名言在医学界有另外一番寓意:低劣的试验可以毁掉完美的方案。回顾过去,OTC试验可以说是漏洞百出,该项目设计仓促、规划不当、监管松懈且执行错误。此外,OTC试验涉及的经济利益冲突更是骇人听闻,项目负责人竟然成了商业公司牟利的傀儡。尽管基因治疗的发展遇到了困难,但是其基本概念在几十年中却始终没有改变:这就是将基因导入人体或细胞来矫正遗传缺陷。从理论上讲,无论是通过病毒或是其他基因载体,这种将基因导入细胞的能力可以创造出具有强大作用的全新医疗技术,我们绝不能像某些基因治疗的早期倡导者一样为名利所迷惑。
展望未来,基因治疗终将成为临床上可以信赖的治疗手段。它将摆脱初期试验质量低劣的阴霾,并且会从“过度科研的前车之鉴”中汲取失败的教训。但是基因治疗想要获得突破尚需经过艰苦努力,而我们为此至少要等待10年的光景。

第二章 基因诊断:“预生存者”

人类遗传学的未来将由两大基本要素组成。其中第一个要素就是“基因诊断”,根据这种观点,基因可用于预测或明确疾病、身份、选择以及命运。第二个要素则是“基因改造”,也就是通过改造基因来影响疾病、选择与命运。
在第二个要素中,定向基因改造(“写入基因组”)显然已经在基因治疗的禁令下停滞不前。但是对于第一个要素来说,根据基因预测未来命运(“读取基因组”)却得到了学术界的广泛支持。“基因检测”,就像医学遗传学家埃里克·托普尔(Eric Topol)所说的那样,“也是某种道德检测。当你决定检验一下‘未来的风险’时,你就难免会扪心自问,我愿意冒险面对什么样的未来呢?”

接下来,我将用三个案例来诠释利用基因预测“未来风险”的利弊。第一个案例就是乳腺癌基因BRCA1。20世纪70年代早期,遗传学家玛丽—克莱尔·金(Mary-Claire King)开始研究家族乳腺癌与卵巢癌的遗传特征。
医学界经过几十年的认真总结发现,乳腺癌可以分为散发性与家族性两大类。散发性乳腺癌见于没有任何家族史的女性,但是家族性乳腺癌可以在几代人中发生。
1978年,美国国家癌症研究所发起了一项关于乳腺癌患者的调查,结果显示人们对于乳腺癌的病因众说纷纭。金在征得同意后为这项调查追加了两个问题:“患者是否具有乳腺癌家族史?是否具有卵巢癌家族史?”等到此项调查结束时,这两种疾病的内在联系也就跃然纸上:她已经鉴别出某些深受乳腺癌与卵巢癌困扰的家族。
金对于全部谱系进行了仔细分析,随后她发现许多家族性病例都指向一个基因,然而鉴定这个基因的工作非常艰难。尽管这个罪犯基因令携带者的患病风险增加了10倍以上,但是并非所有遗传该基因的人都会发病。金发现乳腺癌基因具有“外显不全”的特点:即便基因发生了突变,其效应也不会在个体中完全显现出来(例如乳腺癌或卵巢癌)。
在排除了外显不全造成的混淆效应后,金所收集的病例数目已经足以在多个家族与多代之间进行连锁分析,并且最终将致病基因的位置缩小到第17号染色体上。1988年,她明确指出了该基因的位置,也就是第17号染色体上的17q21区域。虽然金还没有分离出这个基因,但是她已经把它命名为BRCA1。随着BRCA1基因在染色体上的位点逐步明确,人们也在鉴定该基因的过程中展开了一场激烈的竞赛。对于麦利亚德公司来说,BRCA1基因在临床医学上的实际用途就是基因检测。
我们认为BRCA1突变具有预测患病风险的作用,然而这并不能说明其他基因突变(例如囊性纤维化或亨廷顿病)也具有相同的作用。虽然携带BRCA1突变的女性多少都会受到影响,但是这其中仍有很大的不确定性。对于某些女性来说,基因诊断只会浪费她们的时间与精力;似乎她们的生活目的就是为了等待癌症到来或是想象逃离苦海,但是她们很有可能根本不会患上这种让人心生恐惧的疾病。基因检测营造出某种具有极权(orwellian ring)色彩的阴影,而人们也创造出一个全新的术语来描述这些女性:预生存者(previvor),也就是说她们是暂时的幸存者。

基因诊断的第二个案例关系到精神分裂症与躁郁症,而这又把我们带回到本书故事的起点。。1908年,瑞士精神病学家尤金·布鲁勒(Eugen Bleuler)首先使用“精神分裂症”一词来描述具有独特心理疾病的患者,他们经常会表现出严重的认知功能障碍(思维崩溃)。布鲁勒认为,此类疾病的主要特征就是认知脑功能的分裂甚至瓦解。于是他根据这种“脑功能分裂”的现象创造出“精神分裂”(schizo-phrenia)一词。
就像许多其他遗传病一样,精神分裂症也分为家族性与散发性两大类。在某些具有精神分裂症患者的家族中,这种疾病能够在几代人之间传递。当然偶尔也会有某些家族成员表现出躁郁症(例如莫尼、贾古与拉杰什)。与之相反,散发或者新发精神分裂症的出现纯属意外:某位没有精神分裂症家族史的年轻男性可能会突然出现认知崩溃,而这种情况在发生之前通常缺乏或者没有任何预兆。遗传学家曾试图去理解这种疾病产生的模式,但是却无法勾勒出描述精神分裂症的模型。相同的疾病怎么会表现为散发性与家族性呢?躁郁症与精神分裂症这两种看似毫不相干的疾病之间的关系是什么呢?
其实关于精神分裂症的第一条病因学线索来自双胞胎实验。20世纪70年代,研究结果表明该病在双胞胎之间具有惊人程度的一致性。在同卵双胞胎中,两位双胞胎均患有精神分裂症的概率为30%~50%,而在异卵双胞胎中,这个数字仅为10%~20%。如果精神分裂症的定义能够拓宽到将轻度社会与行为障碍也包含在内,那么同卵双胞胎患病的一致性将提升到80%。
除了这些指向遗传因素的线索以外,精神病学家还在20世纪70年代将精神分裂症当作某种性焦虑的表现形式。
然而就在理智与疯狂并存的年代中,人类遗传学起到了中流砥柱的作用。20世纪80年代,许多双胞胎实验都进一步证实精神分裂症具有遗传因素。在综合各方数据的基础上,人们发现同卵双胞胎之间的一致性要远远超出异卵双胞胎,从而充分说明了遗传因素在精神分裂症中的作用。此外,完整的精神分裂症与躁郁症家族史(例如我的家族)也是反映该病存在遗传因素的重要证据。
但是这种疾病到底涉及哪些基因呢?20世纪90年代末期,随着大规模平行DNA测序或新一代测序技术等新兴DNA测序技术的出现,遗传学家可以对任何人类基因组中数以亿计的碱基对进行测序。与标准测序法相比,大规模平行测序技术具有极大的优势:它能够把人类基因组粉碎为成千上万个片段,并且可以同时对这些DNA片段进行测序(也就是所谓的平行测序),然后借助计算机找到序列间的重叠片段并对基因组进行“重新装配”。该方法适用于完整基因组的测序(全基因组测序)或者基因组上指定部位的测序,例如编码蛋白质的外显子测序(外显子组测序)。
由于大规模平行测序技术在进行基因狩猎时显得尤其高效,因此它将帮助人们在两个密切相关的基因组之间寻找差异。如果某个家族中只有一位成员患病,那么找到这个致病基因的过程将易如反掌。原本复杂的基因狩猎也就变成了一场简单的游戏:只要将所有密切相关的家族成员的遗传序列进行比较,那么就可以找到受累个体携带的基因突变。
对于精神分裂症中的散发性变异来说,它们为验证该技术的权威性提供了完美的测试案例。2013年,在某项涉及散发性精神分裂症的大型研究中,人们对623位青年患者(他们的父母与同胞均未患病)的家族成员进行了基因测序。由于每个家族内部成员之间的基因组非常相似,因此假定的罪犯基因就会很容易露出马脚。
研究人员在617位患者体内发现了一个父母双方都没有的突变。平均而言,每位患者体内只会出现一个突变,当然偶尔某位患者体内也会存在多个突变。根据之前介绍的定义,这些突变全部为散发性或者原发性,也就是说它们在胚胎时期就已经形成。散发性精神分裂症可能是神经发育改变的结果,其根本原因在于控制神经系统的基因发生了突变。令人感到吃惊的是,该研究中发现的许多基因还与散发性自闭症和躁郁症有关。
尽管在鉴定这些基因的道路上困难重重,遗传家还是借助各种遗传技术展开了系统性搜索,例如通过连锁分析来定位罪犯基因在染色体上的物理位置,依托大规模关联研究来鉴定与疾病有关的基因,以及运用新一代测序技术来鉴定基因与突变。根据基因组分析的结果,我们发现了至少108个与精神分裂症有关的基因(更确切地说是某些基因区段),但是我们对于这些致病基因的真实身份知之甚少。虽然家族性精神分裂症(就像智力与气质等正常的人类特征一样)具有高度遗传性,但是该病在发病过程中只得到了适度遗传。换句话说,基因这种遗传决定因子对于疾病的未来发展至关重要。如果你携带有某种特殊的基因组合,那么患病的概率就会明显增加,因此同卵双胞胎之间才会表现出惊人的一致性。另一方面,疾病代际传递的机制错综复杂。因为每代人的基因都要经过混合与匹配,所以从父亲或母亲那里精准地遗传突变排列的概率将会大为降低。或许是基因变异较少的缘故,致病基因在某些家族中具有更加强大的效应,从而解释了疾病跨代复发的现象。在另外一些基因效应较弱的家族里,它们需要得到专门的修饰基因与触发器的协助才能发挥作用,而这也反映了罕见遗传病的发病机制。此外,在某些发生散发性精神分裂症的家族成员中,他们的精子或卵子在受孕之前就出现了某个高外显率的基因突变。
那么能对精神分裂症进行基因检测吗?首先,我们需要创建涉及该病的全部基因目录,而这项人类基因组研究的规模将十分庞大,但是即便掌握了此类目录还是不足以实现上述目标。其次,我们要面对外显率不全与表现度变异的问题。
“做我们这行的都是疯子。”拜伦勋爵(疯狂天才中的极品)曾这样写道,“某些人受到快乐情绪的影响,另一些人则受到忧郁情绪的左右,但是所有人或多或少都有些精神异常。”此类故事总是在以各种不同的版本演绎,尽管他们的病因可能是躁郁症、某些精神分裂症亚型或者是罕见的自闭症,但是故事的主角“或多或少都有些精神异常”。由于人们很容易为精神病披上浪漫的外衣,因此我要告诫大家不要被上述假象蒙蔽,精神病患者将逐渐丧失正常的认知功能,并且会出现严重的社会与心理障碍,从而令他们在生活中饱受痛苦的折磨。但不能否认的是,某些患者的确具有与众不同的能力。人们早已注意到躁郁症患者在思维奔逸时可以迸发出非凡的创造力,在某些时候,这种强烈的创造冲动只会在躁狂症发作期间才会出现。
解决此类问题的关键在于:如果你无法区分精神病与创作冲动的表型,那么你也无法区分精神病与创作冲动的基因型。其实那些能够“导致”躁郁症的基因也会“产生”创造力。在面对这种窘境的时候,我们不禁想起了维克多·马克库斯克的提法,疾病不一定会造成患者完全丧失行为能力,它只是基因型与环境之间相对失衡导致的结果。虽然高功能自闭症患儿或许与当前的世界格格不入,但是他们可能会在其他环境里展现出异乎寻常的力量,例如,复杂的数学计算能力或者区分细微颜色层次的能力,而这些都是人类生存或成功的必备条件。
那么我们能通过基因诊断来发现精神分裂症吗?未来我们能根据胎儿基因检测的结果来决定终止妊娠,并且从人类基因库中根除精神分裂症吗?但是直到现在,我们依然无法预知何时才能摆脱这种痛苦。
首先,即使大多数精神分裂症亚型都与单基因突变有关,但是其中依然涉及数以百计已知与未知的基因。然而我们并不知道哪些基因组合更具致病性。
其次,即使我们能够创建出所有相关基因的综合目录,但是浩瀚宇宙中的各种未知因素仍有可能改变患病风险的本质。我们并不知道某个基因的外显率是多少,也不清楚是何种因素在修饰特定基因型时发挥了作用。
最后,从某些精神分裂症或躁郁症亚型中鉴别出的基因实际上会增加某种能力。如果某种方法能把精神病中的高致病与高功能亚型筛选或区分开来,那么这一定是我们翘首以盼的检测手段。但是这种方法必然会有自身的局限性:大部分致病基因在情境改变后反而会成为激发创造力的正能量。
对于精神分裂症与躁郁症来说,基因诊断在此类疾病中的应用前景面临着质疑、风险与抉择的问题。尽管我们想要根除精神病,但是还要想方设法“保留创造力”,因此也就不难理解为什么苏珊·桑塔格会将疾病比喻为“生命的暗夜”了。虽然这种修辞非常恰当,但是它并不适用于所有疾病,其难点就在于如何界定暮光的结束或黎明的开始。而疾病的定义可能随着情境改变成为能力的体现。当我们脚下的大地被黑夜笼罩时,地球的另一边却正沐浴在明媚的阳光里。

2013年春季,我飞到圣地亚哥参加了一场颇具争议的学术活动。第二天上午,我在会场见到了埃里卡(暂且叫这个名字),当时她的母亲正用轮椅把这位15岁的女孩推到台上。埃里卡患有一种症状严重且进展缓慢的退行性遗传病。
我向她询问了病情,埃里卡则非常坦率地说起这种疾病给她的家庭所带来的苦难。“她最害怕的就是我们找不到任何解决办法。对于疾病一无所知是最可怕的事情。”她的父亲曾经这样说道。但是“知道”就能改变一切吗?尽管埃里卡的恐惧有所减轻,但是医学界对她体内的突变基因或者它们对肌肉产生的效应还是束手无策。
如果我们能设计出针对该病的产前诊断方法呢?史蒂芬·奎克刚刚结束了他关于胎儿基因组测序的报告。对于胎儿基因组中携带的所有潜在突变来说,很快就可以通过测序方法将它们按照严重性与外显率进行排序。我们并不了解埃里卡发病的全部细节,或许就像某些具有遗传倾向的癌症一样,她的基因组中可能隐藏着其他具有“协同”作用的突变。但是目前大多数遗传学家都认为她只有两个基因发生突变,由于它们均具有高外显率,因此症状非常严重。
那么我们是否应该考虑允许父母对孩子的基因组进行全面测序,并且建议他们在发现这些具有灾难性的基因突变之后终止妊娠呢?虽然我们希望能够把埃里卡携带的突变从人类基因库中清除出去,但是这也就意味着埃里卡将不复存在。我无法减轻埃里卡与家人遭受的巨大苦难,而这种不安让我的内心深处感到怅然若失。如果说漠视埃里卡的痛苦反映了缺乏同情,那么拒绝伸出援手就折射出人性冷漠。
埃里卡的故事在发人深省的同时也让与会者感到希望渺茫:我们也许可以通过基因组测序找到缓解特定变异效应的治疗手段,但是实现这种美好愿望的可行性却微乎其微。目前产前诊断与终止妊娠仍是针对这些罕见病最有效的方法,然而这些技术的应用也面临着最严峻的伦理窘境。会议的组织者埃里克·托普对我说:“随着科学技术不断发展,我们也会接触更多的未知领域。毫无疑问,我们将被迫面对极其艰难的选择。在新时代的基因组学里,不太可能有免费的午餐。”

我选取简·斯特林(乳腺癌)、拉杰什(躁郁症)以及埃里卡(神经肌肉病变)这三个病例进行描述的原因在于,他们所患的遗传病不仅具有广泛的代表性,而且还诠释了基因诊断领域某些颇具争议的热点问题。斯特林体内的单个罪犯基因BRCA1突变是导致乳腺癌这种常见病的元凶。尽管大约70%~80%(这种可识别的突变外显率很高)的携带者最终会罹患乳腺癌,但是并非所有携带该突变基因(外显率并非100%)的女性都会发展为乳腺癌,而我们现在根本不了解,或者说以后也无从知晓此类疾病在未来的发展与风险。对于乳房切除术与激素治疗等预防性措施来说,它们不仅会给患者带来身心上的痛苦,并且在应用之后也可能产生各种风险。
相比之下,精神分裂症与躁郁症是外显率较低的多基因病。针对此类疾病尚无预防性治疗措施,同时也没有可以治愈它们的方法。这两种反复发作的慢性病将会让患者精神崩溃、家庭破碎。尽管在极罕见的情况下,这些致病基因也可以产生某种与疾病密切相关的神秘创造力。
埃里卡罹患的罕见遗传病(表现为神经肌肉运动障碍)源自她基因组中出现的那一两个突变,而这种疾病具有外显率高、危害性大以及无法治愈的特点。现有的药物治疗根本行不通,更何况也不可能找到这种理想中的灵丹妙药。如果把胎儿基因组测序与终止妊娠(或者在对这些突变进行筛选后进行胚胎移植)的手段相互结合,那么这类遗传病或许能够得到有效鉴别并被清除出人类基因库。
斯特林、拉杰什与埃里卡都属于“预生存者”。由于他们无法改变预生存者身份(决定了转归与选择),因此其未来的命运已经铭刻在自身基因组中。我们能够利用些信息做些什么呢?科幻电影《千钧一发》(GATTACA)中年轻的主人公杰尔姆(Jerome)说道:“我的真实简历就在细胞里。”但是我们到底能够读懂多少个体基因简历的内容呢?我们能否通过某种实用的方法来破解这些编码在基因组中的命运呢?然而在何种情况下我们才能或者说应该去干预呢?

现在我们先来讨论第一个问题:如果从实用或者前瞻的角度出发,那么我们能够解读多少人类基因组的内容呢?时至今日,通过人类基因组来预测命运的能力仍旧受到两项重要限制的束缚。
首先,就像理查德·道金斯描述的那样,大多数基因更像是“配方”而不是“蓝图”。虽然它们不能指定具体成分,但是却可以把控全局,其作用更像是某种类型的公式。如果你修改了原有的蓝图,那么最后的产品也必定会发生变化:例如,机器设备中不会出现设计方案中没有的零件。但是调整配方或公式却未必能让产品按照我们的意愿改变:如果你在做蛋糕的时候将黄油的用量翻了两番,那么其效果将与原来的蛋糕大相径庭(试试看,整块蛋糕都将塌陷为一堆油腻的糊糊)。依此类推,你不能根据孤立基因突变的检验结果来诠释它们对于形态与命运的影响。MECP2基因的正常功能是为DNA添加化学修饰,而该基因发生突变后会导致某种症状隐匿的自闭症(除非你能理解基因是如何控制大脑神经的发育过程的)。
其次,某些基因的本质无法预测,而这种限制带来的意义可能更加深远。大多数基因将通过与触发器(环境、概率、行为,甚至还包括父母环境危险因素暴露与产前暴露)之间的交互作用来决定生物体的形态、功能以及对未来的影响。但是我们发现大部分此类交互作用都无章可循:由于它们可能只是某种偶然的结果,因此无法准确进行预测或者建模。这些交互作用给遗传决定论造成了很大的限制:仅凭遗传学根本无法预示此类基因—环境交互作用的最终效应。实际上,通过某位患病双胞胎来预测另一位发病风险的研究基本上都未获成功。虽然面临以上诸多不确定性,但是我们很快就会从人类基因组中发现某些预测因子。随着人们在基因与基因组研究中不断锐意进取,我们将凭借强大的计算能力来更为详尽地“读取”基因组,而这种设想从概率意义上来讲完全有可能实现。目前,只有高外显率的单基因病(例如泰伊—萨克斯二氏病、囊性纤维化或镰刀形红细胞贫血症)或是整条染色体都发生改变的疾病(例如唐氏综合征)才适合在临床上开展基因诊断。但是我们没有理由将基因诊断仅局限于那些由突变导致的单基因病或染色体病。就这点而言,“诊断”本来就不应受限于疾病的种类。功能强大的计算机可以轻易破解“配方”的组成:如果你输入一条修改指令,那么就可以计算出它对产品的影响。
预计到2020年末,基因突变的排列组合将被用于预测人类表型、疾病与命运的变化。尽管某些疾病可能永远也不适合进行基因检测,但是也许在某些重症精神分裂症或心脏病、高外显率的家族性癌症中,只需要通过少数基因突变的排列组合就可以进行预测。一旦将这种对“过程”的理解写入预测性算法,那么我们就能够计算出不同基因突变间交互作用对于宿主生理与心理特征的影响,而其重要意义要远远超出检测疾病本身的价值。我们通过计算算法就可以决定心脏病、哮喘或性取向发展的概率,并且还将针对每个基因组的命运指定相对危险度的水平。因此不能绝对依赖读取基因组的结果,而应当把这些排列组合作为某种可能性来看待。这就像用进步空间来反映学习成绩,或者说用发展趋势来替代既往经历。最终,我们会整理出一本适用于预生存者疾病防治的手册。

1990年4月,《自然》杂志发表的某篇文章宣告了一项新技术的诞生,它可以在胚胎移植到母体之前对其进行基因诊断,而这就像是要在人类基因诊断的竞赛中提高赌注。
由于人类胚胎在这个早期阶段就能够进行活组织检查,因此我们可以通过提取某些细胞来进行基因检测。只要相关检测结果正常,那么就可以把这些精挑细选且携带正常基因的胚胎移植到母体。该技术在经过某些改进后,也可以对受精前的卵母细胞(减数分裂后形成卵细胞)进行基因检测。而这项技术被正式命名为胚胎植入前遗传学诊断(PGD,Preimplantation Genetic Diagnosis)。从道德角度来考量,PGD要实现的目标似乎高不可攀。如果在选择性移植“矫正”胚胎的同时将其他胚胎冷冻保存,那么就无须使用流产来解决胎儿选择的问题。PGD既发挥了积极优生学的长处,又回避了消极优生学的短板,这样就可以避免胎儿死亡。
PGD的应用引起了一场严重的伦理风暴,以至于几个国家都立即对这项技术加以限制。
目前,PGD可用于筛查携带单基因病的胚胎,例如囊性纤维化、亨廷顿病以及泰伊—萨克斯二氏病等等。但是从理论上讲,基因诊断并非只局限于单基因病检测。我们不应该依靠《千钧一发》这样的科幻电影来提醒自己故步自封有多么幼稚。人们完全没有必要通过模型或隐喻来理解世界,以为孩子的未来会被解析为概率,或者胎儿在出生前就得到诊断,甚至在受孕之前就成为“预生存者”。诊断这个词在希腊语中的意思是“辨别”,但是“辨别”也可以超越医学与科学产生道德与哲学结果。纵观历史,诊断技术使我们能够鉴定、治疗并治愈疾病。当它们表现为仁慈的形式时,这些技术能够让我们通过诊断测试与预防措施来预先制止疾病发生并对其进行适当治疗(例如根据BRCA1基因结果对乳腺癌开展预先治疗)。但是它们也可以根据畸形的定义划分出强弱,或者通过某种可怕的化身来隐藏优生学的邪恶。人类优生学的历史曾经反复提醒我们,“辨别”在起始阶段主要强调“辨认”,而在结束时期主要突出“分别”。纳粹科学家痴迷于开展大规模人体测量项目(下颌大小、头部形状、鼻子长度以及身高)绝非偶然,这种曾经得到官方认可的尝试就是为了“辨别种族之间的差异”。
政治理论家德斯蒙德·金(Desmond King)曾经说过:“无论如何,我们都将被纳入‘基因管理’的范畴,并且将遵循优生学的行为准则。一切都将以个体健康为出发点,而与整个人口的适应度无关,管理者可以是你我,也可以是我们的医生,甚至是这个国家。虽然个性化选择这只看不见的手在影响着基因变化,但是整体结果没有任何区别——它只是某种‘改善’后代基因的协调机制。”

时至今日,我们还在使用三项约定俗成的原则来指导基因诊断与干预领域的发展。第一项,大部分诊断试验都被限制于对疾病有单独决定因素的基因突变,例如某些高外显率的突变导致发病的可能性接近百分之百(例如唐氏综合征、囊性纤维化与泰伊—萨克斯二氏病)。第二项,这些突变所引起的疾病通常会给“正常”生活带来极度痛苦或无法相容。第三项,只有在达成社会与医学共识后才能进行合理干预(决定终止唐氏综合征胎儿妊娠或是通过手术来干预携带BRCA1基因突变的女性),而且所有干预措施都必须建立在完全自由选择的基础上。
上述三项原则(它们就像组成三角形的三条边)可以被视为大部分文化不愿违背的道德底线。例如,如果我们准备对某个携带有致病基因的胚胎进行流产,而它在未来只有12%的概率会致癌,那么这种针对低外显率突变做出的干预就违背了原则。同样,如果在没有征得当事人同意的前提下,对于遗传病患者进行强制治疗也跨越了自由与非胁迫的界限。
但是我们清醒地注意到,这三项原则的范围从本质上很容易受到自我强化逻辑的影响。我们明确了“极度痛苦”的定义,我们划定了“正常”与“异常”之间的界限,我们采取医疗手段进行干预,最终还是我们在决定“合理干预”的本质。而某些具有特定基因组的人类正在落实界定、干预甚至是清除其他同类的标准。简而言之,“选择”似乎是基因为了让同类得到传播而制造的幻象。

尽管如此,上述三项限制原则(高外显率基因、极度痛苦与非胁迫下的合理干预)对于可接受的基因干预形式仍具有指导意义。但是实际上,这些界限随时随地都面临着崩塌的危险。
在上述两组案例中,5HTTLPR/short会编码某种反映心理易感性的“压力传感器”,同时这种极其灵敏的传感器也最容易对靶向干预易感性做出应答。虽然脆弱的心灵很容易被创伤诱导的环境摧毁,但是这种情况也最容易通过靶向干预来恢复。恢复力似乎本身就起到了某种遗传核心的作用:某些人生来就具有这种恢复力(但是对于干预的应答能力较差),另外一些人则先天非常敏感(但是更容易对他们所属环境的变化做出应答)。
目前“恢复力基因”的概念已经渗透到社会工程领域。2014年,行为心理学家杰伊·贝尔斯基(Jay Belsky)曾在《纽约时报》上撰文指出:“我们是否应该把那些易感性最强的儿童都鉴别出来,并且把稀缺的干预措施与项目资金都不遗余力地向他们倾斜?我相信大家一定会做出肯定的回答。”贝尔斯基写道:“打个很常见的比方来说,有些孩子就像娇嫩的兰花,如果遇到精神压力与物质匮乏,那么他们就会迅速枯萎。但如果给予更多的关心与支持,那么他们又将恢复自信。其他孩子则更像是蒲公英,虽然他们对于逆境的负面效应有着很强的恢复力,但是与此同时却不能从正向经验中额外受益。”贝尔斯基提出,如果可以通过基因分析的方法鉴别出“娇嫩的兰花”与“蒲公英”,那么社会在利用稀缺资源进行靶向干预时的效率就能够得到极大提升。“有朝一日,也许我们可以对小学生进行基因分型,然后再根据他们的获益情况来匹配最佳师资。”
难道要对全部小学生进行基因分型吗?遗传图谱可以决定寄养选择吗?到底是“蒲公英”还是“兰花”呢?显然,关于基因与偏好的对话已经超越了原始的界线,从高外显率基因、极度痛苦与合理干预发展到了由基因型驱动的社会工程。如果基因分型鉴定出某个孩子未来具有发生单相抑郁症或躁郁症的风险,那么我们该如何面对呢?能否通过基因分析来鉴别暴力、犯罪以及冲动的特征呢?“极度痛苦”由什么构成,而“合理”的干预手段又是哪些?
什么才算是正常呢?父母可以为他们的孩子选择“常态”吗?如果按照海森堡心理学中的某些原理,那么这种干预的行为会巩固异常身份的地位吗?

虽然本书以基因的历史作为切入点,但是真正令我感到担忧的却是未来。
家族性精神分裂症的遗传学研究具有极其重要的意义,我开始思索是否要对自己还有几位选定的家庭成员进行基因测序。其实我自己的实验室就可以对基因组进行提取、测序与解读(我平时就是利用这项技术对于癌症患者进行基因测序的)。但是现有的技术还不能对大部分基因的突变体或者突变体的组合(增加患病风险)进行鉴定。毫无疑问的是,在2020年到来之前,许多这样的基因变异体都将得到鉴定,而它们带来的患病风险也会被量化。对于像我这样的家庭来说,基因诊断的前景将不再是抽象的概念,它将转化为实际的临床与个人应用。而那三项限制原则(高外显率基因、极度痛苦与合理干预)也将融入我们每个人的未来。如果20世纪的历史告诫了我们集权政府决定遗传“适应度”的危险所在(也就是说,决定哪些人符合限制条件,或者哪些人不符合限制条件),那么我们在当今时代所面临的问题就是这项选择权交由个人处置时又会发生什么。为了处理好这个问题,我们不仅需要通过个人努力来实现幸福与美满的人生,还要主动承担社会责任来减少民众的痛苦,从短期来看,就是降低患者的疾病负担与康复费用。然而在这背后还有第三种力量在悄然作祟:基因本身会罔顾我们的需求与冲动,它们将会在复制过程中创造出新的突变,尽管其作用方式与效应具有直接或间接以及强烈或温和的区别,但是最终都会影响到我们的需求与冲动。1975年,文化史学家米歇尔·福科(Michel Foucault)曾经指出:“当知识与权力建立起规则网络后,适合异常个体的新技术就会应运而生。”福柯当时考虑的是人类的“规则网络”,但这无疑也适用于基因网络。

第三章 基因治疗:后人类时代

20世纪90年代末期,基因治疗的出现改变了该讨论的主题:现在人们可以对于基因进行定向改造。而这也标志着“积极优生学”东山再起。科学家终于摒弃了消灭有害基因携带者的想法,他们开始憧憬矫正人类基因缺陷的未来,目的就是为了让基因组“日趋完善”。
从概念上讲,基因治疗可以分为两种截然不同的类型。第一种类型是对非生殖细胞(血液、脑或肌细胞)的基因组进行修饰。虽然这些遗传修饰会影响细胞的功能,但是并不会改变人类下一代的基因组。如果将某种基因变化导入肌细胞或血细胞,那么这种变化并不会传递给人类胚胎。当宿主细胞死亡时,上述基因也将随之消失。阿善蒂·德席尔瓦、杰西·基辛格与辛西娅·卡特歇尔均是接受非生殖细胞基因治疗的病例:在这三个病例中,血细胞(并非精子与卵子这样的生殖细胞)在外源性基因导入后发生了改变。
相比之下,第二种类型的基因治疗则显得更为激进,它可以通过修饰基因组来影响生殖细胞。只要基因组变化被导入至精子或卵子这种人类生殖细胞后就可以自我复制。它将被永久地整合到人类基因组中并且代代相传下去,而插入的基因会成为人类基因组密不可分的一部分。

在20世纪90年代末期,人们简直不敢想象还能够利用生殖细胞开展基因治疗:当时尚缺乏将基因改变导入人类精子或卵子的可靠技术。而且即便是非生殖细胞治疗也曾经被叫停过。但是现在基因治疗又小心翼翼地卷土重来。
在基辛格去世后的20年里,早期基因治疗试验中使用的方法已经基本上被第二代与第三代技术取代。目前新型病毒已经成为将基因导入人体细胞的载体,同时监控基因传递过程的技术也完成了开发。科学家对其中许多病毒进行了有目的的筛选,因此我们在实验室中的操作步骤更加简便,并且不会引发人体的免疫反应,从而避免基辛格的悲剧再度发生。
2014年,《新英格兰医学杂志》(New England Journal of Medicine)发表了一项具有里程碑意义的研究成果,目前基因疗法已经成功用于治疗血友病。

但是如何才能通过改变生殖细胞来永久性地修正人类基因组,并且借助“生殖细胞基因治疗”实现人类遗传学的终极梦想呢?如果创造出“后人类”或“转基因人类”(例如基因组被永久修饰的人类胚胎)又会怎么样呢?到了20世纪90年代早期,永久性人类基因组工程所面临的挑战只剩下最后三项。虽然每项挑战都曾经被认为无法逾越,但是现在我们即将迎来胜利的曙光。然而目前对于人类基因组工程来说,最严峻的事实并非遥不可及,它们已经成为迫在眉睫的危机。

第一项挑战就是要建立可靠的人类胚胎干细胞系。胚胎干细胞是从早期胚胎的囊胚内细胞团中提取出的干细胞。它处于一种过渡状态:在实验室条件下,胚胎干细胞可以像普通细胞一样生长与操作,但是它们也能分化为活体胚胎中各种组织的功能细胞。因此改变胚胎干细胞基因组就可以轻而易举地实现永久性改变生物体基因组的目标:如果胚胎干细胞基因组能够被定向改变,那么这种基因改变就有可能被导入至胚胎中,随后又将进入由胚胎形成的各种器官并遍布整个生物体。因此对胚胎干细胞进行遗传修饰是实现生殖细胞基因组工程的必经之路。
詹姆斯·汤姆森(James Thomson)是一位来自威斯康星大学的胚胎学家。20世纪90年代末期,他开始从人类胚胎中尝试提取干细胞。1996年,汤姆森确认自己已经具备在人体上尝试这项技术的能力后,他向威斯康星大学监管委员会申请进行人类胚胎干细胞试验。虽然小鼠胚胎与猴胚胎取材非常简单,但是科学家们怎样才能找到刚刚受精的人类胚胎呢?汤姆森在无意中发现了体外受精诊所这一特殊来源。
利用曾经在猕猴身上得到完美验证的这项技术,汤姆森在去掉了胚胎的外层细胞后,将其放入“饲养细胞”与滋养细胞中继续生长,最终提取出少量的人体胚胎干细胞。当这些细胞被植入到小鼠体内后,它们能够分化成为人类胚胎的三个胚层,并且为构建皮肤、肌肉、神经、肠道、血液等各种组织奠定了基础。
尽管这些干细胞能够反映出许多人类胚胎发生的特征,但是汤姆森还是发现它们存在明显的局限性:这些胚胎干细胞几乎能够形成全部人体组织,但是它们在转化为精子与卵子等组织时的效率却非常低。理论上来讲,导入这些胚胎干细胞的基因改变可以传递给胚胎中的所有细胞,但是偏偏那些最重要的生殖细胞却被排除在外,然而只有它们才能把基因传到下一代。1998年,在汤姆森的研究成果发表在《科学》杂志后不久,来自美国、中国、日本、印度、以色列等世界各地的科学家也开始进行人类胚胎干细胞系的提取工作,他们希望发现具有生殖传递能力的人类胚胎干细胞。
但是几乎是在毫无征兆的情况下,该领域的研究突然被全面叫停。在2006年与2007年,布什总统再次否决了扩大联邦政府对胚胎干细胞研究资金支持的法案。此时,干细胞研究的支持者(其中就包括退行性与神经损伤疾病的患者)涌上了华盛顿街头,他们威胁要对做出禁令的联邦机构提起诉讼。为了平息日渐高涨的民愤,布什总统安排了一场特殊的新闻发布会,而站在他身边的孩子都源自“废弃”的体外受精胚胎,他们借助代孕母亲才来到这个世界。

尽管当时联邦政府的禁令让基因组工程学家的热情一落千丈,但是它却并不能阻止在人类基因组中创建永久性改变所需的第二步:人们已经可以通过可靠与高效的手段将定向改变导入现存胚胎干细胞的基因组。
起初,人们觉得这项技术挑战的难度根本无法逾越。但实际上,几乎所有改变人类基因组的技术都存在粗糙与低效的共性。科学家可以将干细胞暴露在辐射中使基因发生突变,但是由于这些突变在整个基因组中呈随机分布,因此任何试图对突变产生定向影响的努力均付诸东流。虽然携带已知基因变化的病毒能够将外源基因插入基因组中,但是其插入位点通常也是随机选择,更不用说插入的基因还会被基因组沉默化。20世纪80年代,人们发明了另一种将定向突变导入基因组的技术,也就是将细胞浸泡在携带突变基因的外源DNA碎片溶液中。外源DNA可以定向插入细胞的遗传物质中,或者说外源DNA的信息可以被复制到基因组中。尽管这种方法的确可以奏效,但是其导入效率非常低下并且容易出错。因此以某种特殊的方式让特定基因发生可靠高效的定向突变根本不现实。
2011年春季,生物学家珍妮弗·杜德娜(Jennifer Doudna)与细菌学家伊曼纽尔·卡彭蒂耶(Emmanuelle Charpentier)在工作中偶然相识,其实她们当初共同探讨的问题似乎与人类基因工程或基因组工程并没有什么关系。
细菌与病毒之间的战争由来已久,这对纠缠不清的宿敌都十分了解对方的底细,同时彼此的敌意也已经深深铭刻在基因里。病毒在进化中形成了入侵并杀死细菌的遗传机制,与此同时细菌也会调兵遣将予以回击。杜德娜非常清楚:“病毒感染就像一颗定时炸弹,细菌必须在自身被摧毁之前那短暂的几分钟里拆除爆炸装置。”
2005年,法国科学家菲利普·霍瓦特(Philippe Horvath)与鲁道夫·巴兰古(Rodolphe Barrangou)在无意中发现了此类细菌自我防御的机制。霍瓦特与巴兰古都是丹麦食品公司丹尼斯克(Danisco)的员工,他们的工作与奶酪生产和酸奶加工的细菌有关。他们发现某些细菌菌种已经进化出一种防御系统,它们可以对病毒基因组进行剪切并使其丧失入侵能力。这套系统就像是某种分子剪刀,它们将通过病毒的DNA序列来识别入侵之敌。此类剪切不会随机出现在基因组中,而只会发生在病毒DNA的特定位点。
研究发现,细菌防御系统至少涉及两项关键要素。其中第一项要素是“搜索者”,这种由细菌基因组编码的RNA分子能够匹配并识别病毒的DNA。因为“搜索者”RNA本身就是DNA的镜像分子(阴阳互补),所以它能够寻找并识别入侵病毒的DNA。站在细菌的角度来看,它们已经把病毒的特征深深印刻在自身的基因组中。
细菌防御系统的第二项要素是“杀手”。一旦病毒DNA被镜像分子识别与匹配为外来入侵者(通过其镜像),那么细菌中的Cas9蛋白就会受到招募并给病毒基因造成致命创伤。在这个过程中,“搜索者”与“杀手”齐心协力:只有病毒DNA序列与识别元件相匹配后,Cas9蛋白才会对病毒基因组进行剪切。其实这些防御要素之间的配合非常经典,就像观测者与执行者、无人机与火箭炮以及雌雄大盗邦妮与克莱德一样默契。
2012年,杜德娜与卡彭蒂耶意识到,细菌防御系统具有“可编程”的特点。但是只有携带病毒基因镜像序列的细菌才可以搜索并摧毁目标;它们不会毫无理由地对其他基因组进行识别或剪切。在充分了解此类防御系统的基础上,杜德娜与卡彭蒂耶认为可以采取某种手段来迷惑细菌:只要将系统中的识别元件替换成诱饵元件,那么就能强行通过这套系统对其他基因与基因组进行定向剪切。杜德娜与卡彭蒂耶发现,只要将“搜索者”进行转换,她们就能够找到并剪切不同的基因。
对于遗传学家来说,这种可能性激发了她们心中的躁动。如果能够在基因中进行“定向剪切”,那么就有可能产生突变。基因组中的大部分突变均是随机发生的,你无法操纵X射线或宇宙射线来选择性地改变囊性纤维化基因或泰伊—萨克斯二氏病基因。但是在杜德娜与卡彭蒂耶的研究中,突变并不会随机出现:这种剪切在经过编程后可以发生在可供自我防御系统识别的特定位点。通过改变识别元件,杜德娜与卡彭蒂耶就可以对选中的基因展开攻击,从而随心所欲地让基因发生突变。
其实这套系统还有潜力可挖。当基因被切开时,两端呈暴露状态的DNA就像断了的琴弦一样容易修剪。剪切与修剪都是为了修复破损基因,同时基因也可以再次通过寻找完整拷贝来恢复缺失信息。正如物质可以储存能量,基因组也会保护信息。通常来说,被切开的基因可以通过细胞中其他基因的拷贝来恢复缺失信息。但是如果细胞内充斥着外源DNA,那么基因就会执着地去复制诱饵DNA中的信息,而不是以备用拷贝作为模板。于是诱饵DNA碎片所编码的信息就能永久性地写入基因组,这种过程就像是从句子中删掉某个单词,然后在原来的位置强行使用新词将其替换。根据上述原理,预先确定好的基因改变就能够被写入基因组:基因中的ATGGGCCCG序列就能被改变为ACCGCCGGG(或是任何需要的序列)。因此从理论上来讲,突变的囊性纤维化基因就能够被矫正为野生型基因;抗病毒基因能够被导入任何生物体;突变的BRCA1基因能够被逆转为野生型;具有许多重复序列的亨廷顿突变基因可能会被破坏并删除。而该技术被命名为基因组编辑(genome editing)或基因组手术(genomic surgery)。
2012年,杜德娜与卡彭蒂耶在《科学》杂志上发表了关于微生物防御系统CRISPR/Cas9的研究数据,这篇文章一经问世迅即成为点燃生物学家想象力的火种。虽然在这项里程碑式研究发表后的3年里,基因编辑技术(CRISPR)已经获得了突飞猛进的发展,但是该方法还是受到某些基本条件的制约:例如,有时候被剪切的基因可能发生错误。此外由于这种技术修复基因的效率很低,因此想要把信息“重新写入”基因组的某些特殊位点极其困难。尽管基因编辑技术尚存在某些不足,但是与其他任何基因改造方法相比,这种方法仍然是最便捷、强大与高效的基因编辑工具。在生物学历史上,能够与之比肩的科学成果实在是凤毛麟角。这项革命性技术源于微生物自身某种神秘的防御机制,它最早由从事酸奶加工的科研人员发现,然后由RNA生物学家通过再编程实现了遗传学家期盼已久的梦想:它可以对人类基因组进行定向、高效与序列特异性修饰。基因治疗的领军人物理查德·马利根曾经幻想过“完美的基因治疗”,而这套系统就可以让他的理想变为现实。

目前距离完成人类基因组永久性定向修饰就差最后一步。我们需要把在人类胚胎干细胞中创建的基因改变整合到人类胚胎中。然而无论是从技术层面还是伦理角度来看,将人类胚胎干细胞直接转化为正常人类胚胎都不可思议。即使人类胚胎干细胞可以在实验室条件下分化为所有类型的人体组织,但是当人类胚胎干细胞直接移植到女性子宫后,我们依然无法指望这个细胞可以自动形成正常人类胚胎。当人类胚胎干细胞被移植到动物体内后,其中大部分细胞也只能分化为某些松散的胚层结构,而这与受精卵在人类胚胎发育过程中所形成的解剖学与生理学构造相去甚远。
为此,研究人员设计出一种潜在的替代方案,他们先等胚胎解剖结构基本形成后(例如受孕数天或数周后)再对其进行整体遗传修饰。但是这种办法也面临尴尬的境地:人体胚胎一旦形成各种胚层,那么就很难再对其进行基因修饰。即便先抛开技术问题,进行此类实验的伦理争议也大大超过了其他方面的考虑:在人类活体胚胎中尝试基因组修饰必然会引发生物学与遗传学范畴以外的各种担忧。而进行此类实验无疑超出了大多数国家能够接受的底线。
好在目前还有第三种方案可供选择。假设我们能够采用标准基因修饰技术将基因改变导入人类胚胎干细胞,那么这个经过基因修饰的胚胎干细胞或许能够被转化为生殖细胞(精子与卵子)。如果胚胎干细胞是真正意义上的多能干细胞,那么它们就应当能够分化成人类的精子与卵子(毕竟正常人类胚胎可以形成自己的生殖细胞)。
现在让我们来进行一项思维实验:如果体外受精采用基因修饰的精子或卵子来产生人类胚胎,那么由此产生的胚胎中全部细胞都将携带这些基因改变,而上述细胞中当然也包括精子与卵子。在实验开始的准备阶段,由于所有步骤并不涉及改变或操纵真正的人类胚胎,因此也能安全地避开人体胚胎研究的道德底线。最为关键的是,该实验的流程完全模拟了成熟的体外受精技术流程:精子与卵子先是在体外完成受精过程,然后早期胚胎再被移植到女性体内,而这些步骤几乎不会引发争议。上述方法不仅是实现生殖细胞基因治疗的捷径,同时也成为发展超人类主义的后门:胚胎干细胞向生殖细胞转化为外源基因导入人类生殖细胞提供了便利。
随着杜德娜不断完善用于改造基因组的CRISPR系统,这项终极挑战在很大程度上已经渡过难关。2014年冬季,在不依赖人类胚胎干细胞的基础上,英国剑桥大学以及以色列魏兹曼研究所的胚胎学家开发出一套可以产生原始生殖细胞(即精子与卵子的前体细胞)的系统。而在之前的实验中,研究人员采用的早期版本人类胚胎干细胞根本无法创建出此类生殖细胞。2013年,来自以色列的研究人员对于早期研究进行了改进,他们分离出一批更容易形成生殖细胞的新型胚胎干细胞。就在一年以后,该团队在剑桥大学同行的协助下发现,如果将这些人类胚胎干细胞置于特定条件下培养,同时采用特殊的诱导剂引导其分化,那么胚胎干细胞最终会形成精子与卵子的前体细胞簇。
但是此项技术还是存在烦琐与低效的问题。很显然,由于创建人工胚胎受到严格限制,因此对于这些精子样与卵子样细胞来说,尚不清楚它们形成的人类胚胎能否正常发育。但是研究人员已经基本上分离出可以进行遗传传递的细胞。从理论上讲,如果能够采用任何遗传学技术对亲本胚胎干细胞进行修饰,例如基因编辑、遗传手术或通过病毒插入基因等手段,那么这种基因改变就会被永久性写入人类基因组,并且将按照遗传学的规律世代相传。

值得注意的是,操纵基因与操纵基因组是两种完全不同的概念。20世纪80年代到90年代,DNA测序与基因克隆技术不仅增强了科学家对于基因的理解与操纵,同时还使他们掌握了左右细胞生物学变化的本领。但是在自然条件下(尤其是在胚胎细胞或生殖细胞中)对于基因组进行操纵将面临来自技术领域的巨大挑战。但是如今这种风险已经不再局限于某个细胞,而是直接指向我们人类自身。
1939年春季,阿尔伯特·爱因斯坦在普林斯顿大学仔细思考了自己所从事的核物理研究进展后,他意识到制造具有强大威力武器所必需的每个步骤都已经独立实现,而铀分离、核裂变、链式反应、反应缓冲以及控制释放等关键技术也已完成,现在就差把它们按照顺序组合起来:如果你将这些反应按顺序串联起来,那么就能够制造出原子弹。1972年,当保罗·伯格在斯坦福大学盯着琼脂糖凝胶中的DNA条带时,他发现自己也正处于同样的关键时刻。科学家可以通过基因剪切与粘贴、嵌合体创建以及将基因嵌合体导入细菌与哺乳动物细胞等手段在人类与病毒之间建立遗传杂交。而现在我们要做的就是把这些反应按照顺序串联起来。
其实对于人类基因组工程来说,我们也正处于同样关键的时刻。假设人类基因组工程按照以下步骤进行:(a)分离出真正的人类胚胎干细胞(能够形成精子或卵子);(b)运用某种技术在这个细胞系中创建可靠的定向遗传修饰;(c)将基因修饰的干细胞直接转化为人类精子与卵子;(d)通过体外授精技术使这些经过修饰的精子与卵子孕育出人类胚胎……那么你就可以毫不费力地得到转基因人。
由于每个步骤均受制于当前的技术发展水平,因此根本没有任何捷径可供利用。与此同时,这其中还有许多问题悬而未决:每个基因都可以被高效地改造吗?这些改造可以产生哪些间接影响呢?胚胎干细胞分化出的精子与卵子能够发育成为正常的人类胚胎吗?尽管还有许多无关紧要的技术问题有待解决,但是这幅拼图的关键部分已经尘埃落定。
可以预见的是,上述每个步骤在目前都受到严格的规定与禁令的制约。2009年,在经历了联邦政府对于胚胎干细胞研究的长期限制后,奥巴马政府宣布解除对分离新型胚胎干细胞的禁令。但即使有了这些新的规定,美国国立卫生研究院依然明令禁止进行以下两种人类胚胎干细胞研究:第一,科学家们不得将这类细胞导入人体或动物体内并使其发育成为活体胚胎;第二,禁止在“可能传递到生殖细胞(例如精子或卵子)”的情况下对于胚胎干细胞基因组进行修饰。

2015年春季,就在本书的撰写工作接近尾声时,包括珍妮弗·杜德娜以及戴维·巴尔的摩在内的众多科学家在人类基因编辑国际峰会上签署了一项联合声明,他们呼吁暂停基因编辑与基因改造技术在临床领域,尤其是在人类胚胎干细胞中的应用。许多科学家不仅认为这种暂停可以理解,而且他们甚至觉得还很有必要。
这次会议上提出的限制条款在许多地方都令人想起了当年的阿西洛马会议。这份声明旨在人们能够从伦理、政治、社会与法律角度做出研判之前对于此项技术进行限制。此外,它还要求对于科学及其未来进行公开评估,同时也坦承我们正在逐步接近永久性改造人类胚胎基因组的目标。鲁道夫·耶尼施是麻省理工学院的一位生物学家,他在世界上首次利用胚胎干细胞获得了小鼠胚胎。耶尼施说道:“毫无疑问,研究人员将会在人类中尝试基因编辑技术。而我们需要制订某些原则性协议来明确是否通过这种方式来增强人类。”
值得注意的是,最后一句中“增强”所释放的信号已经背离了基因组工程的传统底线。在基因组编辑技术问世之前,胚胎选择等技术可以让我们从人类基因组中剔除信息:只要通过PGD来选择胚胎,那么亨廷顿基因突变或囊性纤维化突变就会从某个家系中消失。
相比之下,我们可以通过CRISPR/Cas9系统在基因组中添加信息:基因可以通过定向方式进行改造,同时新的遗传密码也可以被写入人类基因组。“这种现实说明,生殖细胞操纵很可能会以‘完善自身’为理由招摇过市。”弗朗西斯·柯林斯在给我的信中写道,“这意味着某人将被赋予决定‘完善’标准的权力。而我们应该对于任何图谋不轨的行为保持警惕。”
那么现在问题的症结就不是基因解放(摆脱遗传病的困扰)而是基因增强(摆脱人类基因组编码的形式与命运)了。它们二者之间的区别就是未来进行基因组编辑潜在争议的焦点。这段历史教会我们,如果在个体中疾病对应的是常态,那么某人理解的增强可能是他人概念中的解放(“那为什么不让我们更好地适应生存环境呢?”沃森也曾这样问道)。
但是人类能够实现“增强”自身基因组的愿景吗?增加基因编码的自然信息又会产生什么结果呢?我们能否在保证自身安全的前提下让基因组变得“更好”呢?
2015年春季,某个来自中国的研究团队宣布他们在无意中跨越了基因编辑技术的红线。就在西方科学家对于黄军就的实验保持审慎态度的同时,来自中国的科学家却对此类研究的前景表示乐观。“我认为中国同行不会暂停这些实验。”2015年6月底,某位科学家在《纽约时报》的文章中这样写道。而一位中国生物伦理学家对此进行了澄清:“儒家思想认为生而为人。这与美国以及其他受基督教影响的国家不同,他们由于宗教原因不能接受胚胎实验。我们的‘红线’是只能对14天以内的胚胎进行实验研究。”尽管另一位科学家用“先做后想”来形容中国模式,但是一些公众评论员似乎对于这种策略均表示认可。即便是在《纽约时报》的评论栏中,许多读者也支持解除政府对于人类基因组工程的禁令,同时力劝西方国家增加对此类实验的支持,他们认为这样做在某种程度上可以保持与亚洲同行的竞争。毫无疑问,中国的积极参与已经提高了世界范围内的赌注。
综上所述,我们在后基因组时代中需要一份宣言,或者至少要制订一份行动指南。尽管读懂人类基因组并不需要理解寓言或隐喻,但是它同样也是弱点、欲望与野心的试验场。我们在基因组中读写的信息反映了自身的弱点、渴望与野心,其实这些内容就是人性的写照。
尽管编纂完整行动纲领的任务需要另一代人来实现,但是我们可以把重温这段历史中的科学、哲学以及道德教训作为其序幕供各位参考。

  1. 基因是遗传信息的基本单位。它携带着构建、维护以及修复生物体的必备信息。基因不仅彼此之间能够相互协作,它们还会受到环境输入、触发器以及随机因素的影响,从而确立生物体的最终形态与功能。
  2. 遗传密码具有通用性。即便是蓝鲸的基因也可以被插入到微小的细菌中,而且还能够实现精准解码与近乎完美的保真。我们据此推论:人类基因完全没有特殊性可言。
  3. 虽然基因会影响形态、功能与命运,但是这些影响通常并非以一对一的形式发挥作用。大多数人类特征都不是单基因作用的结果,许多特征都是基因、环境与概率共同作用的产物。大多数交互作用都具有非系统性的特点,也就是说,它们发生在基因组与无法预测事件的交叉点。由于某些基因可能只会影响倾向与趋势,因此我们可以通过较小的基因子集来准确预测突变或者变异对于生物体的最终效应。
  4. 基因变异会导致特征、形态与行为发生变化。当我们使用口语来描述“蓝眼基因”或“身高基因”时,实际上我们指的是决定眼色或身高的变异(或等位)基因,而这些变异仅占基因组中极少的一部分。由于受到文化倾向或者生物倾向的影响,因此我们在想象中经常会放大这些差异。尽管两位分别来自丹麦与刚果登巴的男性身高不同(分别为6英尺与4英尺),但是他们在解剖学、生理学与生物化学方面并无本质区别。即便是男女这两种差异最大的人类变异体也有99.688%的基因完全一致。
  5. 当我们宣布找到某种决定人类特征或功能的基因时,其实只是出自对这种特征的狭义定义。由于血型或身高已经有了本质上的狭义解释,因此通过基因反映它们的生物学属性无可厚非。但是生物学中经常容易犯的错误就是把特征定义与特征本身相混淆。如果我们把蓝眼睛(其他颜色除外)定义为“美丽”,那么我们就认为找到了“美丽基因”。如果我们仅根据某项测试中某个问题的表现来定义“智慧”,那么我们就认为发现了“智慧基因”。根据以上理解,基因组只是反映人类想象力宽泛或狭隘程度的一面镜子,它就像是眷恋水中倒影的那喀索斯(Narcissus)。
  6. 通过绝对与抽象的概念来讨论“先天”或“后天”完全没有意义。先天(基因)或后天(环境)能否在某种特征或功能的发育过程中占主导地位取决于个体的特征与背景。SRY基因以一种神奇的自主形式决定了不同性别的解剖与生理,而这一切均源自先天。性别认同、性取向以及性别角色的选择则是基因与环境交互作用的结果,也就是说它们是先天与后天彼此协作的产物。相比之下,社会对于“阳刚”与“阴柔”认可或理解的方式则大部分由环境、社会记忆、历史与文化决定,因此这些都是后天因素在发挥作用。
  7. 每一代人都会发生变异与突变,这是人类生物学中无法摆脱的现实。突变只是统计学意义上的“异常”,也可以说它是某种不太常见的变异。而渴望均质化与“标准化”人类的想法一定会与维持多样性与异常的生物必要性保持平衡。综上所述,常态就是进化的对立面。
  8. 许多人类疾病都是由基因引起或受到了基因的强烈影响,其中就包括某些之前认为与饮食、暴露、环境以及概率有关的严重疾病。大多数此类疾病是多基因病,也就是说它们受到多个基因的影响。虽然这些疾病可以遗传(某种特殊的基因排列组合引起),但是却并不容易遗传至后代(由于每代人中的基因排列组合都将发生重排,因此很难将其完整地传到下一代)。单基因致病的情况比较罕见,但是它们在数量上却非常普遍,目前发现的单基因病已经超过10000种。其中新生儿罹患单基因病的比例大约为二百分之一至百分之一。
  9. 每种遗传“疾病”都是生物体基因组与环境之间错配的结果。在某些病例中,为了在缓解病痛时做出适当的医学干预,我们或许可以采用改变环境并使其适应生物体形态的措施(例如为侏儒症患者搭建特殊的房间,为自闭症儿童制订特殊的教育模式)。与之相反,其他病例则可能需要改变基因来适合环境。然而并非所有病例都存在这种错配,例如,必须基因功能丧失导致的严重遗传病就无法与任何环境兼容。在环境往往更具可塑性的前提下,通过改变基因来获得疾病最终解决方案的想法就是一种离奇的现代谬论。
  10. 在某些特殊情况下,由于遗传不亲和性问题极其严重,因此我们才能够合理使用遗传选择或定向遗传干预等非常手段。对于基因选择与基因组修饰来说,只有我们充分理解了它们可能产生的各种意外后果时,将这类情况视为例外而不是常规才会更安全。
  11. 目前尚未见到基因或基因组对于化学与生物学操作产生遗传抗性的报道。众所周知,“大多数人类特征都是复杂的基因—环境交互作用以及多基因效应的结果”这一标准概念是绝对真理。然而,尽管这些复杂性限制了人类操纵基因的能力,但是它们还是为基因修饰留下了诸多机会。人体内遍布各种各样可以影响多种基因的主控调节因子,同时基因组中还存在许多这样的干预节点。我们可以设计出某种表观遗传修饰剂,然后通过单键开关来改变成百上千基因的状态。
  12. 目前为止,高外显率基因、极度痛苦与合理干预这三项限制条件依然制约着我们在人类中进行干预的尝试。随着三项限制(通过改变对“极度痛苦”或“合理干预”的标准)逐步放宽,我们不仅需要创新生物学、文化以及社会准则来决定遗传干预的利弊,同时还要了解干预手段安全规范应用的各种环境。
  13. 历史通过基因组重演,基因组借助历史再现。推动人类历史发展的冲动、野心、幻想与欲望至少部分就源于基因组编码。与此同时,人类历史也选择了这些携带有冲动、野心、幻想与欲望的基因组。虽然这种自我实现的逻辑成就了人类无与伦比的品质,但是它同时也是滋生卑鄙龌龊的温床。现在谈论摆脱这种逻辑的影响还为时尚早,然而我们应该在认清其运动轨迹的同时保持警惕,防止它在过度扩张中恃强凌弱或者以“正常”为借口消灭“突变”。

或许那种质疑就源自人类21000个基因之中。或许由此产生的怜悯已经永久编码于基因组。
或许这就是我们生而为人的部分原因。

后记 辨别身份

现在人类遗传学还面临着三项艰巨的挑战,而它们均与辨别、分割和最终重建有关。其中第一项挑战就是辨别人类基因组中信息编码的确切本质。尽管人类基因组计划已经为后续工作奠定了基础,但是目前我们还面临着许多悬而未决的问题,例如,人类基因组中30亿个碱基对究竟“编码”了什么信息?基因组中的功能元件是什么?尽管基因组包含有21000至24000个蛋白质编码基因,但是其中分布的基因调节序列与DNA片段(内含子)将把基因分割成不同的区块。基因组中的信息可以构建成千上万的RNA分子,虽然它们无法被翻译成蛋白质,但是依然会在细胞生理过程中发挥多种作用。而我们曾经认为的那些“垃圾”DNA有可能编码了几百种未知的功能。此外,在细胞核的三维结构中,染色体在经过缠绕与折叠后可以通过相互接触发挥作用。
2013年,为了理解基因组中每个元件的作用,美国国立人类基因组研究所启动了一项庞大的国际合作计划,旨在创建一个涵盖全部人类基因组功能元件(染色体上任意具有编码或者指导功能的DNA序列)的目录。该项目被巧妙地命名为“DNA元件百科全书计划”(Encyclopedia of DNA Elements,ENC-O-DE),而它将对人类基因组序列中包含的全部信息进行交叉注释。
只要生物学家鉴定出这些功能“元件”,那么他们就将面对第二项挑战:理解这些元件在不同的时间与空间中交互作用的机制,以及它们对于人类胚胎发育、生理功能、解剖结构与生物体独有的属性与特征的影响。然而令人感到尴尬的是,我们对于基因组知之甚少:人类对于自身基因及其功能的大部分认知均来自酵母菌、蠕虫、果蝇与小鼠中的相似基因。就像戴维·博特斯坦写的那样:“能够直接用于研究的人类基因屈指可数。”新型基因组学的部分任务就是缩短小鼠与人类之间的差距,以便于在近似人体环境的背景下确定人类基因如何发挥功能。
如果该项目能够顺利实施,那么将为医学遗传学提供某些重要的帮助。人类基因组功能注释将有助于生物学家阐明疾病发生的新机制。虽然根据新型基因组元件与复杂疾病的内在联系就可以确定其最终原因,但是我们目前在该领域的研究仍旧一无所获,例如,遗传信息、行为暴露与随机因素的交互作用如何对高血压、精神分裂症、抑郁症、肥胖、癌症或心脏病产生影响。为了明确这些疾病的发病机制,我们需要首先在基因组中找到与它们关联的正确功能元件。
与此同时,了解这些关联亦可用于发现人类基因组的预测能力。2011年,心理学家埃里克·特克海默在一篇颇具影响力的综述中写道:“家族研究(双胞胎、兄弟姐妹、父母与子女以及被收养者)在经历了一个世纪的发展后终于建立起完整的谱系,而人们也逐渐打消了对于基因在解释全部人类差异(从病态到常态以及从生物到行为)时重要作用的质疑。”然而尽管上述关联具有很强的说服力,但是特克海默笔下的“基因世界”要比预期的更加错综复杂。到目前为止,基因变化仅对那些导致表型发生显著改变的高外显率疾病具有强大的预测作用。由于我们很难对于多个基因变异形成的组合进行解读,因此根本无法确定某种特定基因的排列组合(基因型)在未来会产生何种特定结果(表型),而此类情况在结果受到多个基因支配的时候显得尤为突出。
但是随着新技术的应用,这种僵局将很快得到改观。现在让我们在脑海中虚拟一项思维实验。假设我们可以前瞻性(在不了解任何儿童未来的前提下)地对10万名儿童的基因组进行全面测序,然后针对每位儿童创建出包含全部变异与功能元件组合在内的数据库(这里所说的10万只是一种数量上的泛指,实验对象可以被扩展至任何数量的儿童)。现在假设我们已经获得了该队列儿童的“命运图谱”,并且将鉴定出的每种疾病与生理异常记录于平行的数据库中,那么我们或许可以将这种记录着个体全套表型(属性、特征、行为)的图谱称为人类“表型组”。接下来,假设某种计算引擎能够对来自遗传图谱或命运图谱的数据进行挖掘配对,那么我们就可以根据这些结果对于双方做出预测。尽管上述方法仍存在各种不确定性(甚至非常严重),但是10万份基因组与表型组图谱构成的数据集依然具有强大的说服力,它可以描绘出编码于基因组内部的人类命运本质。
这种命运图谱的特别之处就在于它不会受到疾病检测领域的局限,该方法还可以根据我们的需求在广度、深度以及详细程度上进行调整。目前命运图谱可能的应用范围包括低出生体重儿、学龄前学习障碍、青春期短暂躁动、青少年迷恋、婚姻、出柜、不孕症、中年危机、成瘾倾向、左眼白内障、早秃、抑郁、心脏病以及晚期卵巢癌或乳腺癌。虽然这种实验在过去简直无法想象,但是计算技术、数据存储与基因测序的协同作用将使其在未来成为可能。我们可以把它看作某种规模庞大的双胞胎实验(研究对象并不是双胞胎):该方法可以跨越时空对基因组与表型组进行匹配,然后通过计算创建出数以百万计的虚拟遗传“双胞胎”,而这些排列组合就能够被用于生命事件的注释。
由于通过基因组来预测疾病与命运的方法具有自身局限性,因此我们需要对于此类项目保持清醒的认识。“也许,”就像某位评论员所批评的那样,“遗传学解释的命运最终将脱离传统的病因学理论,它不仅无法完全呈现环境因素的作用,还会产生某些可怕的医学干预手段,而这种方法对于诠释人类命运根本没有任何作用。”但是此类研究的意义在于它可以“摆脱”疾病的束缚,人们可以通过基因来理解个体发育与命运转归的变迁。如果能够将背景依赖或环境依赖的情况稀释或滤除,那么保留下来的就是深受基因影响的事件。总体而言,只要人群数量与计算能力达到一定程度,我们就可以确定并算出基因组拥有的全部预测能力。
相比之下,最后一项挑战的意义可能最为深远。就像根据人类基因组预测人类表型组的能力主要受限于计算技术的缺乏一样,定向改变基因组的能力也受制于生物学技术的短板。由于基因导入系统(病毒)存在效率低下、可靠性差甚至意外致死,所以我们几乎无法将外源基因定向导入至人类胚胎。
然而随着新技术的应用,这些障碍也将开始土崩瓦解。目前,“基因编辑”技术能够使遗传学家在精准改造基因组的同时保持高度的特异性。原则上来讲,我们可以通过定向方式在其他30亿对碱基不变的情况下让DNA中的某个碱基产生突变(这种技术就相当于某种编辑设备,当完成了扫描66卷《大英百科全书》的任务后,它可以在不影响其他内容的同时发现、擦除或改变某个单词)。在2010年至2014年间,我实验室的一位博士后研究员曾尝试采用标准基因传递病毒将某个明确的基因改变导入某个细胞系,但是最终收效甚微。2015年,当实验方法改为以CRISPR为基础的新型技术后,她只用了6个月的时间就在14个人类基因组中实现了14处基因改变,其中还包括了人类胚胎干细胞基因组,而这在过去完全是难以置信的丰功伟绩。全世界的遗传学家与基因治疗学家都在急不可耐地探索改变人类基因组的可能性,其实造成这种氛围的原因在某种程度上与生物技术的迅速发展密切相关。干细胞技术、细胞核移植、表观遗传修饰以及基因编辑方法的联合应用使得操纵人类基因组与转基因人类成为可能。
其实我们并不了解这些技术在实际应用中的保真性或效率到底如何。定向改变某个基因是否会引起基因组其他部分出现意外改变?某些基因是否比其他基因更容易“被编辑”呢?又是什么在调控基因的可塑性呢?我们不知道对于某个基因的定向改变是否会导致整个基因组发生失调。如果有些基因的作用就相当于道金斯所描述的“配方”,那么改变某个基因就可能对基因调控产生深远的影响,并且会产生类似蝴蝶效应的一系列下游结果。如果此类蝴蝶效应基因在基因组中屡见不鲜,那么它们将成为基因编辑技术的主要限制因素。基因的不连续性(遗传单位的离散性与自主性)也许只是某种幻觉:基因之间的内在联系可能比我们想象中的更为紧密。

现在假设这些技术已经可以在某种环境下得到常规应用。女性在怀孕以后,每位父母都可以选择是否对子宫内的胎儿进行全基因组检测。如果发现胎儿携带有严重的致病突变,那么父母可以决定是否在孕早期终止妊娠,或是在经过全面遗传筛查后选择性地植入“正常”胎儿(我们将称其为全面胚胎植入前遗传学诊断,或c—PGD)。
此外,基因组测序也可以鉴定出导致疾病倾向的复杂基因组合。假如携带此类可预测疾病倾向基因的孩子出生后,那么他们将在整个童年时代接受选择性干预措施。例如,对于某个具有遗传性肥胖倾向的孩子来说,他可能会在儿童时期接受体重变化监测、替代饮食治疗或使用激素、药物以及基因治疗进行代谢“重编程”。而具有注意力缺陷或多动症倾向的儿童可能会接受行为治疗或为其安排丰富多彩的教学活动。
如果疾病已经发生或出现进展,那么就应该使用基因疗法来治疗或者治愈患者。我们可以直接将矫正基因导入病变组织:例如,将功能性囊性纤维化基因雾化后注入患者的肺部即可使其恢复部分正常功能。而某位先天患有ADA缺乏症的女孩可以接受携带矫正基因的骨髓干细胞移植。对于较为复杂的遗传病来说,我们将采用基因诊断与基因治疗、药物治疗以及“环境疗法”相结合的手段。只要能够记录下导致某种癌症出现恶性增殖的突变,那么就可以对该肿瘤进行全面分析。这些突变将被用于鉴定引发细胞异常增殖的致病通路,而据此设计出的靶向治疗能够在保护正常细胞的同时精准地杀伤恶性细胞。
2015年,精神病学家理查德·弗里德曼(Richard Friedman)在《纽约时报》发表的文章中写道:“假设你是一名从战场上归来且患有创伤后应激障碍(post-traumatic stress disorder, PTSD)的士兵,那么只要通过简单的抽血化验来检测基因变异就可以了解你是否具有恐惧消退的能力……如果你携带降低恐惧消退能力的突变,那么治疗师就会明白可能需要增加暴露疗法的强度与疗程才能奏效。或者说,你可能需要接受暴露疗法以外的其他治疗方案,例如人际关系治疗或药物治疗。”或许应该将消除表观遗传标记的药物与谈话治疗联合使用,细胞记忆的消除或许可以缓解历史记忆的负担。
除此之外,基因诊断与基因干预也将用于人类胚胎的筛查与矫正。如果能够在生殖细胞中鉴定出某些基因的“可干预”突变,那么父母就可以在受孕前选择基因手术来改变精子与卵子,或者从怀孕伊始就借助产前筛查来避免植入携带突变的胚胎。通过阳性选择、阴性选择或基因组修饰等方法,我们就能预先把导致严重疾病的基因变异从人类基因组中清除出去。

假如你已经仔细阅读了上述方案,那么就会发现科学奇迹背后隐藏的道德风险。对于癌症、精神分裂症以及囊性纤维化进行靶向治疗是医学发展的重要标志(尽管这些内容令人感到既遥远又陌生),但是个体干预并不能成为超越法律与道德底线的借口。如果这个世界由“预生存者”与“后人类”组成,那么他们不是接受了基因易损性的筛查就是改变了遗传倾向。随着人类疾病、痛苦、创伤、突变、虚弱与机会逐渐远去,我们的身份、怜悯、历史、变异、易感与选择也将渺无踪迹。
1990年,当蠕虫遗传学家约翰·萨尔斯顿起草人类基因组计划的时候,他对智能生物“学会解读自身指令”导致的哲学困惑感到十分惊诧。不仅如此,这种困惑随着智能生物开始学习编写自身指令而变得愈发不可收拾。倘若基因与生物体可以相互决定对方的本质与命运,那么这种逻辑循环就可以形成闭环。一旦我们开始考虑把基因与命运画等号,就会不可避免地会将人类基因组当作昭昭天命。
到底是什么力量或机制才能解释人类个体截然不同的命运与选择呢?人们在18世纪之前曾经把个体命运归结于神的旨意。其中印度教徒长期以来认为个体命运与其前世的因果报应密不可分(在印度教中,主神就像一位至高无上的道德税务会计师,他将根据既往投资的盈亏来清点与分配命运的优劣)。而基督教中的上帝也是恩威并施的化身,他既是桀骜不驯的运动员又是最终命运的裁判员。
19世纪与20世纪的医学发展为命运与选择提供了更为世俗化的概念。疾病或许是命运中最为常见的典型代表,我们可以通过规范的术语对其进行描述,它们不再是天谴神罚的愚昧无知,而是风险、暴露、体质、环境与行为共同作用的结果。与此同时,我们把选择理解为个体心理、经历、记忆、创伤与身世表达的一种方式。到了20世纪中期,身份、亲缘、气质与偏好(异性恋与同性恋或冲动与谨慎)越来越多地被描述为是心理冲动、个人历史与随机因素交互作用产生的现象,因此就诞生了涵盖命运与选择的流行病学。
在21世纪开始的前10年,我们开始学习使用另外一种语言来讲述因果,然后以此来构建某种全新的自我流行病学:我们开始从基因与基因组的角度来描述疾病、身份、亲缘、气质以及偏好,并且最终运用上述理论来诠释命运与选择。尽管基因作为反映人类本质与命运的唯一途径并非是遥不可及的天方夜谭,但是这种颇具争议的观点也让我们在面对历史与未来的时候谨言慎行:基因对于人类生存的影响要远比我们想象中的更为错综复杂与惊心动魄。当我们尝试去定向解读、改变与操纵基因组,并且获得改变未来命运与选择的能力时,上述观点也就变得愈发具有煽动性与破坏性。1919年,摩尔根曾经写道:“人类最终会了解自然的本质,而所谓的神秘莫测不过是场错觉罢了。”随着科学技术的突飞猛进,我们当前正在把摩尔根的结论从了解自然扩展至领悟人性。
我的脑海中经常会出现贾古与拉杰什的身影,假设兄弟二人出生在距今50年到100年的未来,那么他们的生活轨迹又会是什么样子呢?我们能否根据遗传学易感性来治愈摧残他们生命的疾病呢?这种知识能否帮助他们恢复“正常”呢?如果答案是肯定的话,那么又会涉及何种道德、社会与生物危害呢?人们对于这种类型的知识是否会产生全新的理解与同情呢?还是说它们会成为新型歧视的核心内容?这种知识能被用来重新定义什么是“自然”吗?
但是“自然”到底是什么呢?我扪心自问。从一方面来说,它具有变异、突变、转换、无常、离散与流动的属性;而另一方面,它还表现出恒常、持久、完整与保真的特征。那么我们该如何辨别自然的身份呢?由于DNA本身就是一种自相矛盾的分子,因此它编码的生物体也是千奇百怪。我们原本想从遗传特征中总结出恒常的规律,但是却在不经意之间发现了变异(对立面)的奥秘,同时还认识到突变是保持人类本质的必要条件。我们体内的基因组正在努力维系着各种力量之间脆弱的平衡,其中就包括彼此互补的双螺旋结构、错综复杂的过去和未来以及挥之不去的欲望和记忆,而这也构成了世间万物最为人性的核心。因此如何科学管理就成为人类认知世界与明辨是非的终极挑战。

致谢

词汇表

译者注记

推荐阅读更多精彩内容

  • 很久以前就想写爬虫了,最近考完试今天刚刚好有机会练练手。 这是我的第二只爬虫,准备扒取豆瓣Top250中的电影,并...
  • 亲爱的姑娘,你还好吗? 在很多很多次梦里,我都在寻觅着你的身影,她飘忽不定,令我惊醒。 亲爱的姑娘,我一直都很想很...
  • 文|水湄 一 听我妈说,罗杰又换工作了。 换工作不稀奇,关键是罗杰“又”换工作了,他今年三十二岁. 当年高考落榜后...
  • 最近在学markdown 语法,听说gitbook比较好用,于是整理了一下安装流程以便后来的查阅 About th...
  • 上天开了一个惊人的玩笑它给刚出生的幼童的礼物是每一寸土壤里静谧的微笑 待到孩子长大他们与生俱来的本领开始展现 听吧...