这个酶中的蛋白质完全除去,只剩下那段RNA,它也照样可以在试管 内完全正常地加工转运RNA。可见,在RNA酶P里面,蛋白质只起到辅 助作用[10],那段RNA才真正地负责催化,是又一种酶RNA。而且说 起来拗口又有趣的是,这还是一种“RNA酶RNA”,也就是“能够催 化RNA的水解反应的RNA”。 图4—12 1989年的诺贝尔化学奖由西德尼·奥尔特曼和托马斯·切赫共享,因为他们 发现了RNA的催化能力。(Jane Gitschier摄) 切赫与奥尔特曼的发现证明了并非只有蛋白质才有催化能力, RNA也同样可以有,这项石破天惊的新发现让他们分享了1989年的诺 贝尔化学奖。 当然,酶RNA也具有很高的多样性,并不只有自剪接内含子与 RNA酶P这两种。比如早在第六章,我们就特意提醒过,核糖体是一
种非常庞大的酶,其中催化氨基酸合成蛋白质的,就是其中的RNA。 不过,核糖体实在太复杂了,20世纪80年代还无人研究出它的催化 机制,直到2000年,我们才在计算机的帮助下确认了“核糖体RNA也 是酶RNA”的事实[11]II。 不管怎样吧,RNA具有催化能力是一个事实,那三人在20世纪60 年代的预言的确成功了,但这个预言又只是他们宏大理论图景的一 小半,RNA世界假说才是他们当时不谋而合的一大创想III。 ·RNA复制酶RNA· 在第十一章的结尾处,我们概括过RNA世界假说的主要内容,这 里不妨将它说得更简单一些。最初,世界上出现的是“自己复制自 己的RNA”,这样的RNA兼具遗传和催化的双重职责。后来,RNA把遗 传的职责交给了DNA,把催化的职责交给了蛋白质,最终发展出了现 在的中心法则。 在20世纪60年代到70年代,我们已经知道某些病毒的遗传物质 就是RNA,逆转录病毒还能把RNA里的遗传信息传递给DNA,所以, RNA能够承担遗传的职责已经没什么可怀疑的了。再到80年代,酶 RNA的发现又肯定了RNA的催化能力。看起来,这一系列的事实让RNA 世界假说的每一步都成了可能,越来越受期待。还记得第七章里那 位因为率先实现了DNA测序法而荣获诺贝尔奖的沃尔特·吉尔伯特 吗?RNA世界假说就是他在1986年总结并命名的IV。 但继续推敲下去,我们又会发现,事情远不像看起来的那样简 单。迄今为止,除了核糖体RNA,我们接触过的酶RNA,剪切也好, 剪接也罢,都是在水解RNA [12]。这样的酶RNA再多也达不到“自己
复制自己”[13]的效果,反而会像衔尾蛇一样自啖其尾,自己把自 己吃干净。所以,要让RNA世界假说达到理论上的贯通,我们至少还 要继续证明两件事。首先,我们要证明某些酶RNA能够以RNA为模板 聚合出新的RNA,这样的酶RNA就被叫作“RNA复制酶RNA” ;进一步 地,我们还要证明某些RNA复制酶RNA能够复制自己,或者叫“自催 化RNA复制酶RNA”,如果沿用上一章的比喻,那就是要找到“RNA做 的镜子”,并且在其中找到“能照见本身的镜子”。 啊,这可太难办了! 因为迄今为止,我们在一切细胞和病毒当中找到的一切RNA复制 酶都是蛋白质[14],这实在不是什么好消息。不过,我们倒也不是 非得从细胞或者病毒里面找到它。因为在RNA世界假说中,RNA的遗 传和催化能力都早已让渡给了DNA和蛋白质,所以今天的有机体不保 留这样的酶RNA也是情理之中的事情。当然,这绝不是说RNA复制酶 RNA如今已经没有了就可以死无对证,我们即便不能在细胞和病毒里 面找到它,也至少要在实验室中造出它,证明RNA确实有自己复制自 己的能力,这样才能理直气壮地“找不到”。 要单纯找到一种RNA复制酶RNA并非难事。早在1993年,哈佛大 学的生物实验室就修改了四膜虫的内含子,获得了一种能够复制任 意模板的酶RNA V。但这种酶RNA的复制原料并非任意的核苷酸,而是 有三四个碱基的RNA片段,它必须先等这些片段一个接一个地匹配上 了模板链,才能赶上去把它们连起来,这让它的速度和精度都没什 么保证。 最先解决这个问题的是美国麻省理工学院。2001年,该院校的 科研人员在实验室里获取了一种新的酶RNA,能够利用给定的RNA模
板,把已经开了头的RNA聚合工作继续推进14个碱基,其中,前11次 聚合的准确率可以达到1 088/1 100。 14个碱基算不上可观的长度,却是个好的开始。在此后几年 中,越来越能干的RNA复制酶RNA在不同的实验室里诞生VI。到2014 年,科学家们找到的RNA复制酶RNA已经能够聚合出长达200个碱基的 RNA链了。但这些RNA复制酶RNA又都有些共同的缺陷,比如它们的模 板只能是二三级结构比较简单的RNA,而且总倾向于聚合特定的碱基 序列。 目前为止最优秀的RNA聚合酶RNA来自美国的斯克里普斯研究所 (Scripps Research Institute)[15]。生物化学家杰拉德·乔伊 斯在2016年制取了一种名叫“24—3聚合酶”的酶RNA,它的长度只 有大约150个碱基,却能在很短的时间内把目标RNA复制成原长度的1 万倍,而且模板可以是非常复杂的RNA,包括多种酶RNA,甚至成熟 的转运RNA。VII 乔伊斯制取24—3聚合酶的方法也可圈可点,那是一场很大规模 的“模拟进化”。他的团队首先找来了一种比较普通的RNA复制酶 RNA,把它当作“种子”。然后,他们给这个种子引入了大量的随机 突变,产生了数以亿计的“变种”。接着,他们又用这些变种去复 制各种模板RNA,从中选择速度和精度俱佳的变种,当作新的种子, 投入下一轮的突变和筛选。所谓“24—3聚合酶”,就是第24轮的3 号聚合酶。 目前看来,24—3聚合酶已经充分证明了RNA复制酶RNA的存在, 但它的模板不能是另一个24—3酶,所以,它不能实现自我复制,还 不是我们要找的“自催化RNA复制酶RNA”,而且直到本书写成的时 候,还没有任何一间实验室能够找到这样一种RNA。
于是,杰拉德·乔伊斯就把这个下落不明的酶RNA,也就是那面 能照见本身的镜子,唤作“圣杯”[16],世界各地的酶RNA研究者也 很快接受了这个寓意深刻的称呼。 但是,他们一边在继续寻找这个失落的圣杯,另一边也在思考 圣杯究竟会是怎样一副模样,比如说,圣杯究竟有几个? 你或许会想,一个圣杯就已经如此难以寻找,如果圣杯有许多 个,那岂不是从《夺宝奇兵》变成了《龙珠》,达成目标难上加难 了? 这倒未必。实际上,早在24—3聚合酶发现之前,2009年,杰拉 德·乔伊斯就曾用那种“模拟进化”的方法找到过一个“酶RNA自复 制组合”VIII。首先,第一种酶RNA能够把两种特定序列的短RNA连接 起来,变成第二种酶RNA。接着,第二种酶RNA又能把另外两种特定 序列的短RNA连接起来,变成第一种酶RNA。于是,只要不断地往试 管内投入那4种特定序列的短RNA,这两种酶RNA就会无限地增殖彼 此。平均下来,它们每小时能各自增殖一倍,这是非常不可思议的 速度了。 只可惜,这两种酶RNA都显然不是我们要找的圣杯,因为它们需 要人为添加那4种特定序列的短RNA,并不能在试管之外进化出来。 类似的,2012年,美国波特兰州立大学也发现了一个“酶RNA三元催 化组合”IX,这个组合也不能自由地增殖自己,但在催化效率上同 样表现得非常出色,在竞争中明显超过了单一酶RNA的自我催化。 圣杯虽然仍未露面,但我们视野却更加开阔了。在实验室里即 便找到了那么一座圣杯,在分子层面上,它也只是催化复制与自己 相同,或者至少几乎相同的另一个RNA分子,而不是一个分子自己催
化复制自己。然而,正如上一章的讨论,最早的RNA是随机生成的产 物,要在小范围内出现两个基本相同的RNA序列,将是难以企及的低 概率。但如果圣杯不是自我复制的RNA个体,而是自我复制的RNA集 团,事情就容易了许多,因为能够承担催化复制任务的RNA序列数不 胜数,一个环境里只要出现其中几种,它们就能互相催化复制,这 个集团就能以惊人的速度呈指数级扩增,整个问题也就迎刃而解 了。 也就是说,RNA世界假说如果是成立的,那么在它的起源之初, 就更有可能是多个酶RNA相互协作、互相催化的热闹局面,这不但能 大大加快反应,也能让整个系统更加稳定。在某种程度上,我们不 妨将每一种RNA看作一个物种,将那个互相催化的RNA世界看作一个 各物种相互依存的生态系统,这样一来,一些原本难以回答的问 题,就变得豁然开朗了。 比如说,我们要思考第三幕里的各种地质化学反应要如何转化 成生命的物质能量代谢。如果把目光单纯地聚焦在某一种酶上,追 究那一种酶要如何从无生命的世界里出现,势必是痛苦而无解的。 但是,在一个互利共生的RNA世界里,自我复制的RNA团体一旦开始 运转,就可以兼顾复制一大批其他的RNA。在这些RNA中,如果存在 某种可以促进固碳作用、促进能量代谢的酶RNA,那么,整个团体都 将从中受益,复制得更多更快,容纳更多的RNA。 那么,在这样一个生生不息的正反馈当中,任何复杂结构的出 现,就都不再有观念上的困难了。 [1] 霍尔丹写过一本名叫“生命起源”的书,其中讨论了原始有机汤假说,我们曾 在第一章遇到过他的设想。
[2] 英 国 皇 家 学 会 会 员 西 里 尔 · 达 林 顿 ( Cyril Dean Darlington , 1903— 1981),英国遗传学家,发现染色体互换机制的就是他。 [3] 但值得一提的是,DNA双螺旋的发现,又恰恰是在薛定谔这本小册子的启发之 下完成的,因为薛定谔虽然不清楚遗传物质是什么,却高屋建瓴地指出那应该是一种 “非周期性的晶体”,应该是一种非常巨大的分子,这个巨大的分子又由许多相似但不 同的小单位组成,这些小单位按不同次序排列,就形成了遗传的编码。 [4] 你会注意到黑色字母并不是寻常的碱基符号,那是因为成熟的转运RNA还会给 某些碱基增加修饰,以调整三级结构的细节。比如“D”表示“二氢尿嘧啶”,给尿嘧 啶增加了两个氢原子;“Ψ”表示“假尿嘧啶”,一种酷似尿嘧啶的嘧啶;“m⁷G”表 示“在碱基G的第7个碳原子上增加一个甲基”;等等。另外,“Y”表示“C或T都可 以”。 [5] 在这里使用括号,是因为内含子的确是一些带有“括号”的碱基序列,也就是 说,凡是内含子,都从某种特定的序列开始,由某种特定的序列结束,识别了这个括号 序列,就找到了内含子。 [6] 倒不是说所有的内含子都毫无意义,有些内含子就像“注释”一样,能够调控 基因的表达方式,但无论如何,它们不能出现在成熟的RNA里。 [7] 四膜虫(Tetrahymena)是一种与草履虫关系很近的单细胞真核生物,很容易 养活,是遗传学和分子生物学常用的模式生物。另外,与第十一章提过的变形虫一样, 它们长期以来被认为是动物,但实际上并不属于动物界,而属于SAR超类群的囊泡虫 界。 [8] 切赫选择的RNA是四膜虫的核糖体26S RNA,这个RNA带有长约400个碱基的内 含子。 [9] 需要与“酶RNA”区分的概念是“RNA酶”,“RNA酶”是指能够分解RNA的 酶,通常是蛋白质,但也可能是RNA。所以,如果一个酶RNA能够催化分解RNA,就会被 叫作“RNA酶RNA”。我们马上就会在下文遇到这样的东西,你可以惦记着找找看。 [10] 蛋白质成分在酶RNA中发挥的辅助作用主要是固定底物,也就是把待催化的分 子固定在容易催化的位置上,这有些类似它们在许多铁硫蛋白里扮演的角色。 [11] 2000年,波尔·尼森(Poul Nissen)等人测得核糖体大亚基中正在形成的 肽键周围的1.8nm范围内,除了23S rRNA状态域V的部分原子外,不存在任何核糖体蛋 白质侧链原子,从而证明了核糖体是一种核酶。
[12] 严格地说,自剪接内含子是先催化两次水解,再催化一次聚合,但总的来 说,仍是把长的变短,把大的变小。 [13] 经过上一章的讨论,你应该会意识到,这里所谓的“复制”包含了两次聚合 过程。第一次以目标RNA为模板,聚合出它的镜像序列,第二次以镜像序列为模板,聚 合出新的目标序列。但为了表述方便,下文不再区分这两次聚合,都统一称作“复 制”。 [14] RNA复制酶主要出现在被RNA病毒感染后的细胞内,它们更正式的名称是 “RNA依赖性RNA聚合酶”,但这本书为了不那么拗口,统一叫它们“RNA复制酶”。 [15] 该研究所涌现出了4位诺贝尔奖得主。 [16] “圣杯”原本是指耶稣在最后的晚餐上喝酒用的那个杯子,耶稣遣走加略人 犹大之后,吩咐剩余的11个门徒喝下里面的红葡萄酒,说那象征着他的血,由此创立了 受难纪念仪式。后来的基督徒相信这个杯子具有某种神奇的能力,喝下它盛过的水就能 长生不老甚至死而复生。因此,“寻找真正的圣杯”在过去1 000多年中都是西方文学 的经典话题。
第十四章 施皮格尔曼怪 竞争的RNA世界 对于“进化的起点在哪里”这个问题,“与生命的起源一同开 始”似乎已经是个极致的回答。但是,我们却在实验室里证明了, 既然有了资源、复制、变异和竞争,进化完全可以出现在生命诞生 之前的RNA世界。 在那里,有的RNA在进化中日趋复杂,却有另一些RNA发展成了 寄生者,而这些寄生者,很可能就是第一批病毒,或者更准确地 说,是一类亚病毒因子。 经过前两章的讨论,对于RNA世界的早期面貌,我们大致有了这 样的构想:白烟囱里海绵似的毛细管道具有热泳浓缩的效果,这可 以促使核苷酸随机聚合成RNA。后来,这些RNA中涌现出了具有催化 能力的酶RNA,尤其是一些RNA复制酶RNA,它们构成了自我复制的团 体,呈指数级扩增。 而在这个宇宙中,任何指数级的自我复制都意味着同一件事 ——进化。 本来,自我复制意味着信息的世代传递,也就是遗传的建立。 但在这个宇宙里,任何信息传递都不能保证永远准确[1],RNA的复 制也不例外。考虑到早期的酶RNA未必能有多精密,那些数量惊人的 自我复制的产物想必充满了随机突变。那么可以想见,有些突变会
提高酶RNA的催化效率,因此加快团体的扩增,而有些突变就会反过 来妨碍扩增。而且,白烟囱的环境再好,也没有无限的资源供给, RNA的指数级扩增迟早会超过核苷酸的产出速度,到那时,不同的团 体就会相互竞争,只有扩增最快的团体才能延续下去,这是一种简 单却又不可避免的自然选择。 于是,加快扩增的突变会累积增多,妨碍扩增的突变会不断被 淘汰。在那些自复制RNA团体中,进化的车轮悄悄启动了,其中的重 大意义,无论怎么强调都不过分。 现如今,在小小的试管里,杰拉德·乔伊斯只用24轮模拟进化 就获得了已知最好的RNA复制酶RNA,在40亿年前那永不停歇的白烟 囱里,进化又会给我们带来怎样的惊喜呢?我们似乎已经可以想 象,一个个自我复制的RNA团体会争先恐后地攫取白烟囱里的核苷 酸,在激烈的竞争中进化出越来越复杂的代谢机制,然后顺利地发 展成了的生命…… 但是,回头仔细推敲一些细节,进化又好像不那么顺利了。 ·极端自私的RNA· RNA世界里刚刚启动的进化与今天的进化并没有根本的不同,一 段碱基序列能否逐渐成为群体的主流,只看它能否在世代更替中复 制得更快。 那么,怎样的碱基序列才能最快地复制呢? 像我们刚才设想的那样,那些催化效率更高的酶RNA能在同样的 时间内复制更多其他的酶RNA,而更多的其他的酶RNA又反过来能更
快地复制这种催化效率更高的酶RNA。这固然是个办法,但太迂回 了,显然不是最好的办法。 至于最好的办法,想必一些机智的读者已经看透了:正所谓先 下手为强,只要能以最快的速度结合到RNA复制酶上,就能优先抢占 复制资源,最快地复制自己,除此之外越短越好,什么都不需要, 什么都不该管,什么物质代谢能量代谢,让别的RNA去催化吧,我只 需坐享其成,套用理查德·道金斯经典之作的名字,这就叫“自私 的碱基序列”。[2] 而且这可不只是“推敲”而已,在已知的实验中,我们早就见 过吻合的事实了。 1965年,DNA重组技术的奠基人索尔·施皮格尔曼[3]正在尝试 人工扩增RNA。他在试管里加入了目标RNA、各种核苷酸以及从细胞 里提取的RNA复制酶,放置在恰当的温度下一段时间之后,再把复制 产物提取出来,投入新的试管,重新加入各种核苷酸和RNA复制酶, 开始新一轮的复制。[4] 就这样循环往复了许多轮,施皮格尔曼惊讶地发现,无论最初 加入试管的目标RNA是什么,经过许多轮的循环复制,最终的产物都 是同一条218个碱基的RNA I——换句话说,在施皮格尔曼的人工扩增 体系中,这条RNA就是“进化的终点”,依据发现者的名字,它被命 名为“施皮格尔曼怪”(Spiegelman’s Monster)。 至于施皮格尔曼怪何以成为进化的终点,正如我们刚才推敲 的,它是结合RNA复制酶最快的短序列。
后来,作为对这个实验的验证,在1997年,普朗克研究所的生 物化学家们也做了一个类似的实验,他们采用了更加高效的RNA复制 技术,先在装有目标RNA的试管中加入逆转录酶[5],把目标RNA逆转 录成大量的DNA,再把这些DNA提取出来与RNA聚合酶在新试管中混 合,获得更大量的新一代目标RNA。如此循环往复,他们得到了两种 更加短小的施皮格尔曼怪,一种有54个碱基,一种有48个碱基,分 别是RNA聚合酶和逆转录酶的结合序列。II 这样的事实似乎意味着,在生命出现之前,纯粹由酶RNA构成的 复制团体会将进化中的“自私”放大到极端的程度,从根源上阻止 进化。但这样的怀疑是站不住脚的,因为极端自私作为一种策略, 固然可以获得短期的优势,却也酿成了长远的孤立和破坏,迟早成 为致命的劣势。 再说得具体些,施皮格尔曼实验为RNA的复制提供了极尽理想的 环境,在这样的环境下,一条RNA能以多快的速度扩增下去,唯一的 决定因素就是它能以多快的速度结合到RNA复制酶上。但是,白烟 囱,或者任何可能的生命起源环境,都不是“极尽理想的环境”, 没有人来提取复制产物,更没有人源源不断地添加RNA复制酶和各种 核苷酸。之前的故事固然常用“持续”“充沛”“源源不断”之类 的措辞形容白烟囱里的有机化学反应,但那都只是相对而言,地质 化学反应的物质产出要比生物化学反应低下太多了,任何资源都没 有可靠的保证。 所以,如果某个RNA团体充斥着施皮格尔曼怪,那么所有的核苷 酸都会被施皮格尔曼怪迅速垄断,这将使其他所有的RNA,包括RNA 复制酶RNA,都失去复制的材料,于是,整个自我复制的团体就因此 消亡了。
这就像是深入无人之境的拓荒团,如果队伍里充满了流氓和小 偷,那么很快就会资源耗尽而集体饿死。反过来,如果某个RNA团体 发展出了施皮格尔曼怪的抑制机制,那就像拓荒团做到了纪律严 明,每个成员都有希望幸存下来了。在此基础上,如果这个团体像 第十二章末尾畅想的那样,继续发展出了能够催化固碳作用和能量 代谢的酶RNA、催化有机酸变成氨基酸的RNA、催化氨基酸连接成蛋 白质的RNA……拓荒团就终于开始卓有成效的生产经营,可以成长壮 大起来了。 那么,RNA的团体真的有办法抑制施皮格尔曼怪吗?对于40亿年 前的事情,我们当然没法说得多么笃定,但如果是问RNA有没有这个 能力,答案就是明确而肯定的了。因为早在20世纪90年代,我们就 发现细胞内存在着复杂的RNA干扰机制。凭借这些机制,细胞如果要 抑制某种RNA的活动,就可以制造许多与它互补的RNA片段,散发出 去,与那种RNA牢固地结合住,使其失去功能,甚至,某些片段还能 与RNA酶配合工作,直接把那种RNA剪断。 仔细想想看,这的确是意义深远的事情。一方面,RNA干扰证明 了RNA之间的相互作用已经足以实现复杂的调控机制,让施皮格尔曼 怪无法兴风作浪,这让RNA世界的持续复杂化成为可能。但是另一方 面,施皮格尔曼怪处在同样的进化中,它们如果突变出了反抑制的 手段,不就可以继续过上不劳而获的日子了吗?这势必形成一种RNA 层面的军备竞赛,每当RNA团体进化出更加强大的抑制机制,施皮格 尔曼怪就见招拆招,跟着进化出更加奸诈的反抑制机制,永远没有 尽头。 说起“永远”,我们现在认为,RNA团体进化得越来越复杂,最 终变成了细胞,那么,40亿年前的施皮格尔曼怪,如今进化成了什 么呢?
病毒,施皮格尔曼怪很可能进化成了病毒!对于分子生物学, 这是一个非常大胆的推测,但对我们来说,这个推测却分外眼熟, 因为早在第十一章中,我们就用另外一种措辞表达了这种推测:在 生命起源的每个阶段,都有一些“半成品”不再复杂化,而专门盗 窃其他半成品的代谢成果复制自己,这样的半成品最终进化成了各 种各样的病毒。也就是说,这个推测里的“施皮格尔曼怪”并不特 指1965年的218个碱基,抑或1997年的两种短小的RNA,而泛指那些 极端自私、劫持其他RNA以复制自己的RNA,甚至也包括RNA世界发展 末期的某些DNA。 对于这个推测,一些已知的事实正让它变得可信起来。比如, 在今天的细胞里,RNA干扰的一大任务正是对抗病毒的感染。动物有 专门的免疫系统,或许不那么看重RNA干扰机制,但对于植物和单细 胞生物,尤其是细菌和古菌而言,RNA层面的干扰机制就格外活跃, 不但能有效瓦解入侵细胞的病毒,还能封印基因组中的逆转录转座 子。而根据对保守碱基序列的比较,RNA干扰机制也极有可能就是末 祖传递下来的,那正是RNA世界末期的事情。III 但是正所谓道高一丈,魔高一尺,又有许多病毒专门进化出了 特殊的手段,反过来规避这些RNA干扰IV。那场军备竞赛如果真的延 续至今,可不就该是这副模样? ·比病毒还小的RNA· 不仅如此,我们越来越怀疑,某些最成功的施皮格尔曼怪即便 经历了40亿年的进化也没有变得面目全非,还保留了许多当初的特 征。1971年,美国植物病理学家西奥多·迪纳调查了“马铃薯纺锤
块茎病”,发现这种传染病的病原体是一种前所未见的有机体,像 病毒,但是比病毒更简单,于是把它称为“类病毒”。 简单地说,类病毒是一种环状的RNA,而且这个RNA真就只是RNA 而已,完全裸露着,不像病毒那样裹着衣壳和包膜。而且类病毒的 RNA极端微小,不到400个碱基,甚至只有200多个,哪怕最小的病毒 也有它们的几十倍大。当然,这样短小的RNA也不可能编码任何蛋白 质,它们所做的一切就是通过伤口钻进细胞,然后劫持细胞里负责 中心法则的酶,复制自己。 如果类病毒的尺寸与行径让你疑心它与RNA世界有什么联系,那 你的确想到前面去了。迪纳在发现类病毒之后投入了十余年做深入 研究,到1989年,他做出了一个大胆的推测:类病毒很可能是RNA世 界最古老的孑遗。V 或许由于当时的人们还不够了解类病毒,迪纳的推测在当时并 没有收到太多反响。但是到了近些年,关于类病毒的推测被人们重 新拾起,开始得到郑重对待。比如,西班牙巴伦西亚理工大学的分 子生物学家里卡多·弗洛雷斯就是类病毒研究的重要人物,他在 2014年的论文VI中提出了非常引人瞩目的推测:类病毒那微小的尺 寸和极致简单的结构,非常吻合早期RNA应有的模样,迪纳关于类病 毒是RNA世界孑遗的想法,很可能是对的。 比较直观的是,类病毒的一级结构是个首尾相接的环,这样就 更加稳定,也不容易在复制时丢失两端的序列;同时,它们的碱基 也含有更高比例的C和G,它们配对之后比A和U更加结实[6],那些生 活在火山温泉和热液喷口的嗜热微生物也同样拥有这个特征。
说起配对,类病毒虽然短小,却也同样形成了精巧的二三级结 构。由于大范围的自我配对,类病毒在整体上拉长成了双链,这不 但让它更加稳定,还让它能冒充双链DNA,结合到RNA聚合酶上,然 后利用这个酶复制自己。 对于那些熟悉中心法则的读者来说,上面这段话稍一推敲就会 冒出三个疑点。第一,RNA聚合酶通常以DNA为模板,转录出互补的 RNA链(如图4—7),那么,它以类病毒为模板,也应该是聚合出来 一条类病毒的互补RNA。第二,RNA聚合酶的工作总有个开端,所以 互补RNA将不是一个环,而是一条线。第三,类病毒的一级结构是个 环,RNA聚合酶沿着它周而复始,聚合出来的RNA就会是一条无穷无 尽的循环序列,又该怎么分割呢? 这就涉及一些精巧的“技术细节”,那些对此深感兴趣的读 者,可以现在就跳到这一章的“延伸阅读”中去了解一番。而对于 那些着急“听”下文的读者,那大概可以概括地说:类病毒的三维 形态还能劫持RNA聚合酶之外的酶,而且,有些类病毒就像自剪接内 含子一样,是个自己催化自己的酶RNA。 所以,小而稳定,不能编码蛋白质,却能够利用中心法则的酶 系统,还具有催化能力,这简直就是RNA世界早期的缩影,然而它们 究竟是否真的仅凭这些伎俩就幸存了40亿年,这又是一个难以捉摸 的问题。 图4—13 人类发现的第一种类病毒“马铃薯纺锤块茎类病毒”。它的一级结构就如那 根淡淡的粗灰线所示,是个首尾相接的环,周围的数字标注了那些碱基的序号,但它的二
级结构因为大量的自我配对而聚成双股,非常近似双链。 迄今为止,我们知道的一切类病毒都只感染农作物,包括土 豆、柑橘、啤酒花、椰子、苹果、薄荷,还有鳄梨、桃子、茄子, 而且会令它们患上减产的疾病。当然,这非常可能是一种“幸存者 偏差”,毕竟像类病毒这样微小的环状RNA,如果不酿成什么经济损 失,恐怕根本就没有机会被人类注意到。 不过,即便是已知的这些类病毒,也似乎透露了一些关于进化 的古老信息:已知的类病毒分为两个科,一个是马铃薯纺锤块茎类 病毒科,或者叫棒状类病毒,另一个是鳄梨日斑类病毒科,或者叫 锤头类病毒VII。前者专门感染植物细胞的细胞核,利用那里面的酶 复制自己;而后者专门感染植物的色素体,比如叶片中的叶绿体和 块茎中的造粉体[7],利用那里面的酶复制自己。 这两科类病毒除了三维结构有很大的差异,整个复制机制也有 很多差异。在第七章里,我们介绍过目前普遍被认可的内共生理 论,也就是说,植物的色素体曾经是一些独立生存的蓝细菌,大约 在15亿年前它们才侵入了植物祖先的细胞,在那里面定居下来,在 进化中舍弃了大部分不必要的结构,最终简化成了一种细胞器,但 是仍然在很大程度上保持着遗传上的独立,它们有自己的DNA,有自 己的核糖体,有自己的整套遗传系统。 弗洛雷斯因此推测,这两科类病毒曾经分别感染过早期真核细 胞和细菌,后来随着内共生全都荟萃在了植物身上,在今天尚未被
人类细致观察的单细胞真核生物以及细菌体内,很可能同样存在着 未知的类病毒。 至于我们动物同样是古菌的后代,却为何不被类病毒感染,我 们或许可以归因为更加有效的防御机制。首先,植物细胞很容易被 啃咬,导致破损,比如蚜虫那注射器似的刺吸式口器就是类病毒传 播的主要媒介,各种植物病毒也往往通过这样的伤口进入植物的细 胞。其次,植物的细胞普遍存在着“胞间连丝”,也就是相邻的细 胞都以很细的管道互相沟通,像曹操的战船都被铁索连环绑在了一 起一样。类病毒或者病毒只要侵入了其中一个细胞,就能顺着这些 胞间连丝火烧赤壁,迅速蔓延开来。但动物细胞一旦破损就会死 亡,活细胞的表面又分布着层层叠叠的受体蛋白,绝不允许来路不 明的物质随便进出,所以感染动物的病毒总要编码一些特殊的衣壳 蛋白,骗取细胞的信任,才能悄悄溜进去,而类病毒不编码衣壳蛋 白,也就无法进入动物细胞了。 但果真如此吗?事情恐怕还有玄机。 在类病毒和病毒之间,还有另一种被称为“卫星核酸”的亚病 毒因子。这种小东西一方面像类病毒一样,只是一段极简单的核酸 序列,并不编码任何衣壳蛋白,另一方面又不像类病毒那样裸露 着,而是会盗窃某种病毒的衣壳蛋白,装配出完整的病毒结构,由 此获得感染动物细胞的能力。比如丁型肝炎的病原体就是一种卫星 核酸,它们可以偷取乙肝病毒的衣壳蛋白,打扮得像个正经病毒似 的,出来感染人类的细胞。 显然,卫星核酸一定要与某种病毒一起感染宿主细胞,才能获 得传播能力。凡是丁型肝炎的患者,必然先是乙型肝炎的患者。如
果说病毒是小偷,那么卫星核酸就是专偷小偷的小偷,在施皮格尔 曼怪的世界里,也有“强盗遇上打劫的”这种咄咄怪事。 这些卫星核酸各式各样,有单链的,也有双链的,有环形的, 也有线形的,有RNA的,也有DNA的。其中最值得我们注意的,是某 些卫星核酸是一个环状的RNA,像类病毒一样只有几百个碱基,不仅 三维形态与锤头类病毒长得像极了,在宿主细胞里的复制机制也与 锤头类病毒的复制机制如出一辙。它们与类病毒唯一不同的,就是 需要与某种病毒一起传播感染。 于是,弗洛雷斯警觉地提出,这样的卫星核酸就是另一群类病 毒,只不过在进化中无比奸诈地利用了真正的RNA病毒,大大增强了 传播与感染的能力。丁型肝炎可以被看作其中的典范,它只有1 700 个碱基,在已知的能够感染动物的核酸里,这是最小的。如果你注 意到它比说好的几百个碱基大了很多,那是因为它还额外编码了一 个蛋白质,可以帮助它调控复制的速度,而这个蛋白质的基因,很 可能也是它在进化中偷盗来的,这在核酸的世界里是再寻常不过的 事情了。 现在是时候问一下,遗传信息从DNA到RNA到蛋白质的流动是 如何开始的。在这方面,弗朗西斯·克里克再次远远领先于他的 时代。1968年,他已认为RNA一定是第一个遗传分子,他还进一 步指出,RNA除了作为模板外,还可能作为酶,从而催化自身的 自我复制。 ——詹姆斯·沃森[8],《RNA世界》VIII,1993年 在2014年的论文结尾,弗洛雷斯引用上面这段话称赞了RNA世界 假说的远见,并最终总结了类病毒作为RNA世界孑遗的若干理由。但
我们除了思考同样的问题,还遇到了一件新的值得思考的事:在上 一章的结尾,我们曾把那个互相催化的RNA世界看作一个“各物种相 互依存的生态系统”,而在这一章里,无论实验室的发现还是自然 界的痕迹,又都暗示着一个尔虞我诈、激烈竞争的RNA世界。 当然,这两者并不冲突。毕竟,今天这个由细胞组成的生命世 界也是这副样子,一边是互利共生,一边是生存斗争,进化用这两 种方式塑造了我们每一个物种。然而,这是直到今天才刚刚出现的 局面吗?现在看来,事情恐怕远远早于我们的预期:在中心法则启 动了第一个箭头,遗传和复制刚刚开始,细胞都尚未出现的那个时 代,这样的格局就已经建立起来了。 毫无疑问,这是意义深远的事情。因为协作和竞争使RNA面临的 选择压力不再只有“最大限度地利用核苷酸”,还有投资与回报、 利用与被利用的无限复杂的生存博弈。在细胞诞生后的世界里,就 是这样的生存博弈让地球上的生命进化出了惊人的多样性,每一个 物种都与其他物种交织成了错综复杂的关系网络。同样,在细胞诞 生之前的RNA世界里,这样的生存博弈也把所有RNA乃至所有有机分 子的进化之路纠缠绑定起来,导向了不可避免的复杂未来。 当然,我们也不要忘了,在我们的故事里,支撑起这复杂未来 的仍然是海底深处的白烟囱,那地质化学反应提供的绵绵不绝的物 质与能量。 延伸阅读 类病毒的复制机制
类病毒,一个环状RNA分子而已,怎样才能劫持一个细胞来复制 自己呢? 正文里已经有过概述:类病毒虽然是个环状分子,但由于大范 围的自我配对,类病毒在整体上被拉长成了双链,这不但让它更加 稳定,还让它能冒充双链DNA结合到RNA聚合酶上,然后利用这个酶 复制自己。 但是,RNA聚合酶的本职工作是转录,是根据DNA的模板链聚合 互补的RNA链,就像图4—7那样。所以,即便被类病毒劫持,它也只 能以类病毒的母链为模板,聚合出来一条类病毒的“负链”。同 时,类病毒是个环,RNA聚合酶沿着它转圈,聚合出来的负链就会是 一条无穷无尽的重复线性序列,又该怎么恢复成一个个的“类病毒 正链”呢? 我们已知的类病毒有两个科,它们用不同的方式解决这些问 题,追究起来,也都很有趣IX。 首先是较早发现的马铃薯纺锤块茎类病毒科,这个科的类病毒 都像图4—13那样,二级结构近似一对双链,就像苏东坡那句“柳庭 风静人眠昼。昼眠人静风庭柳”[9],出句对句就是互相转个身, RNA聚合酶绕着它走一圈,转录出来的负链就会与正链几乎一样,也 能形成大段大段的自我配对(图4—14)。又因为这些序列头尾相 连,于是就折叠成了一大串“……几几几几几几几……”这样的 “连体负链”。更要紧的是,既然负链与正链非常类似,那么这每 个“几”也将酷似DNA的双螺旋,也都能劫持DNA聚合酶,于是在每 个“几”上面,又一轮新的聚合反应开始了。
这一次的聚合产物当然就是正链了,但是,既然负链是连体 的,这些新合成的正链也还是“……几几几几几几几……”这样的 连体正链。但是如此多的RNA双链实在太刺眼了,细胞自己的RNA很 少形成这样的结构,这显然是病毒入侵的标志。所以,细胞的RNA干 扰机制会派出一种“III型RNA内切酶”(RNase III),上去把它们 全都剪断。哈哈,这下反而中了计,把正愁分不开的连体正链齐齐 整整地分开了! 最后,每一个成功分离的正链都会折叠成一个图4—13那样的双 链,只是某处还有一个断口,而这样的结构又能欺骗细胞里面用来 修复DNA缺口的“I型DNA连接酶”,把断口连接上。 事儿就这样成了,类病毒复制成功。 图4—14 马铃薯纺锤块茎类病毒科的扩增机制。(作者绘) 图4—15 苏轼这两句诗,后一句刚好就是前一句旋转180°。这样的序列被称为“回 文序列”。同样,每条胶囊形的线圈住的RNA都是一个“回文序列”,如果一个环状RNA能
够自我配对成双链,比如左上的那个序列,它的互补序列就刚好是把自己旋转180°。 (作者绘) 稍晚被发现的鳄梨日斑类病毒科在结构上则有所不同。如图4— 16所示,它们虽然也是个环,但二级结构要复杂得多,一端照例是 双链,用来劫持RNA聚合酶,而另一端就是个“锤头”似的结构。 那些熟悉核酸生物学的读者可能会眼前一亮,因为锤头结构正 是自剪接酶RNA的常见结构。由于正链和负链互为镜像,所以这些类 病毒的负链也有这个锤头。如图4—17,负链的锤头就会发挥酶RNA 的功能,把自己所在的负链与下一个负链剪切开,成为一个独立而 完整的类病毒负链。这个过程很像自剪接内含子,所以人们一度怀 疑它们有什么进化上的渊源,但比较了碱基序列之后,它们又实在 不像。 话说回来,类病毒的负链也会因为自我配对而形成普遍的双 链,类似图4—16的样子,只是头尾之间有个断口,而这个断口附近 的结构刚好可以骗来细胞里的“转运RNA连接酶”。这种酶本来负责 把剪除了内含子的转运RNA重新接好,这下却帮着把类病毒的负链修 复成了一个环X。 接下来的事情就好办了,这个类病毒的负链像极了类病毒本 身,它将从劫持RNA聚合酶开始,把上面的工作重复一遍,也就能够 复制出新的类病毒了。
图4—16 鳄梨日斑类病毒科的茄潜隐类病毒的二级结构,右端的锤头结构比较简单, 同科的类病毒还有更复杂的。 图4—17 鳄梨日斑类病毒科的扩增机制。(作者绘) 延伸阅读 亚病毒因子 人类已经知道,这个世界上还有许许多多比病毒更小、更简单 的感染性有机体,它们被统称为“亚病毒因子”。目前为止,我们 已知的亚病毒因子可以分为三类:类病毒、“卫星”和朊毒体。 类病毒已经在前文中很详细地介绍过了。
“卫星”是一个庞大而复杂的类群,凡是那些本身没有感染能 力,必须与某种病毒搭配起来才能感染传播的亚病毒因子,就被统 称为“卫星”。对于每一种具体的卫星,那些帮助它们感染传播的 病毒,就被称为它们的辅助病毒。比如丁型肝炎卫星核酸的辅助病 毒就是乙肝病毒。而根据与辅助病毒的关系,卫星又分为两类。 第一类是卫星病毒,这种卫星不能劫持细胞的酶,但是能够劫 持辅助病毒的酶(当然,辅助病毒的酶也是辅助病毒劫持了细胞的 酶才制造出来的),所以,卫星病毒是依赖辅助病毒复制自己,但 它们自己能够编码衣壳蛋白,可以封装自己。其中,那些能够抑制 辅助病毒的卫星病毒,就叫“噬病毒体”,它们的辅助病毒往往是 一些巨型病毒。 第二类是卫星核酸,这种卫星能够亲自劫持细胞中的酶复制自 己,但是不能合成衣壳蛋白,必须盗取辅助病毒的衣壳蛋白才能完 成封装,脱离原始细胞,感染新的细胞。其中,某些核酸是环状RNA 的卫星核酸,并不编码任何蛋白质,从结构到复制机制像极了类病 毒,它们就被叫作“拟病毒”(virusoid)。那种造成丁型肝炎的 卫星核酸常被视为拟病毒的代表,但事实上,丁型肝炎的卫星核酸 编码了一种蛋白质用来调节复制的速度,这个蛋白质很可能是在进 化中劫持来的。 最后,朊毒体,俗称朊病毒,非常特殊,是已知的唯一不含核 酸的感染性有机体。顾名思义,“朊”是“蛋白质”的旧称,朊毒 体就是一种“有害的蛋白质”。 但这种蛋白质的来源却很正经,就是动物细胞自己合成的朊蛋 白,主要分布在神经系统、免疫系统、消化系统的细胞膜上,维持 着多种生化功能,是一种常见的结构蛋白。但是,某些朊蛋白的三
维结构没有正常折叠,出现了一些关键的错误,就会从结构蛋白变 成具有催化能力的酶,也就是朊毒体。 至于朊毒体的催化能力,说出来很简单,后果却很可怕:朊毒 体能重新折叠那些正常的朊蛋白,把它们都变成朊毒体,使细胞里 的朊毒体越来越多。 不仅如此,朊毒体的三维结构与乐高积木颇有些异曲同工之 处,能互相拼接起来,动不动就聚集成一长串,团成一大团。而这 样的朊毒体团块极其稳定,不但细胞内的各种蛋白酶无法分解它, 高压锅慢炖4小时、短波紫外线持续照射、福尔马林浸泡,统统不能 使它失活,动物的消化系统当然也不能破坏它们了。 图4—18 左边是正常的朊蛋白,右边是变异的朊毒体,最关键的变化是一对α螺旋变 成了β片层。(作者绘) 这些朊毒体的纤维和团块越长越大,越聚越多,最后就会杀死 整个细胞。而中枢神经系统,尤其是大脑中的朊蛋白特别多,所以
朊毒体对大脑的损伤就格外严重——疯牛病、库鲁病、变异型克 ——雅脑病,都是大脑被朊毒体严重损害的结果,死亡率高达 100%。 但是朊病毒毕竟不是病毒,那种接触诱变的扩张方式在感染初 期非常慢,要经过5年甚至几十年的发展才达到致病的程度,这已经 超过了几乎所有动物的预期寿命。而且,朊病毒在不同的物种身上 也多多少少有些不同,所以它们通常也不会通过猎物感染掠食者。 所以,朊毒体总是通过同类相食的行为传播开的。朊毒体更容 易侵入同物种体内,也更容易把同物种的朊蛋白诱变成朊毒体,使 感染者体内积累更多的朊毒体。如果同类相食接连不断,朊毒体积 累的速度也会越来越快,潜伏期也就越来越短,朊毒体相关疾病也 就暴露出来了。 比如库鲁病暴发是因为新几内亚的某些部落会在葬礼上吃掉族 人的尸体,疯牛病暴发是因为英国用牛下水作为蛋白饲料添加剂再 来喂牛,而变异型克——雅脑病则是大量食用患疯牛病的病牛肉的 结果,这类病例全球只发现了228例,其中有176例来自英国。 图4—19 朊病毒可以并排连接成串:β片层结构如果刚好处于平行的位置,就能够以 氢键结合起来,拼成更大的片层,仔细对照图2—72的右半部,你能更好地理解这种拼 接。不过,这仍然只是个方便起见的示意图,朊病毒实际的拼接方式还要复杂一些,那些
片层往往不是拼接成这样一个单调的平面,而是盘旋起来,形成一种“β螺旋”的结构, 样子有些像天井楼梯的扶手。(作者绘) [1] 这件事情与热力学第二定律有很大的关系,但囿于这本书的篇幅和题材,这里 只打算勾起那些好奇的读者探索的欲望。 [2] 对于那些没有读过《自私的基因》的读者,我们必须郑重地提醒一件事:基因 是自私的,绝不意味着基因产生的行为都是自私的,绝不意味着进化不能解释生物的利 他行为。原因很简单,团结就是力量,如果舍弃一点个体利益就能维持群体的力量,甚 至从群体中获得广泛的帮助,那么这点舍弃就是一本万利的增值投资,人类就是这样的 典型。不仅如此,经过一段时间的复制,基因会普遍存在于大量个体身上,在必要的时 候,如果少数个体能够放弃生命,保得其他个体周全,那么这个基因就能在大多数个体 上继续延续,蚁群和蜂群就是最突出的例子。对于RNA,我们也将在下面的讨论中看到 相同的事情。 [3] 索尔·施皮格尔曼(Sol Spiegelman,1914—1983),美国哥伦比亚大学的 分子生物学家,因对DNA状态和癌细胞的研究闻名于世,经他改良之后,核酸杂交技术 可以侦测细胞内的任何DNA或RNA序列,这为后世的基因工程奠定了重要的基础。 [4] 这种技术被称为“聚合酶链式反应”(PCR),我们会在下一章遇到它。另 外,他使用的RNA复制酶是一种蛋白质,提取自被Qβ噬菌体感染后的细菌。 [5] 这种技术被称为“逆转录聚合酶链式反应”(RT-PCR反应)。这个实验中加入 的RNA聚合酶是T7噬菌体的RNA聚合酶,加入的逆转录酶是HIV的逆转录酶。 [6] 因为C和G在配对时形成三个氢键,A和U在配对时形成两个氢键,参见图2— 45。 [7] 在单细胞的植物中,通常只有叶绿体一种色素体,但在复杂的陆生植物身上, 叶绿体会在不同的组织里分化成不同的形态,比如积累大量的色素,让花朵和果实成为 色彩斑斓的有色体;专门制造糖分和淀粉,在果实和根茎中储存营养的造粉体;专门制 造蛋白质和脂肪,在种子、花粉、果实、分生组织里满足特殊营养需要的造油体和造蛋 白体;专门制造鞣制,防御昆虫和紫外线的丹宁体;等等,都统称色素体。 [8] 弗朗西斯·克里克和詹姆斯·沃森就是1953年DNA双螺旋结构的发现者。这本 书是1993年沃森对RNA世界假说发展状况的总结。 [9] 苏轼《菩萨蛮·回文夏闺怨》:柳庭风静人眠昼。昼眠人静风庭柳。香汗薄衫 凉。凉衫薄汗香。手红冰碗藕。藕碗冰红手。郎笑藕丝长。长丝藕笑郎。
第十五章 三个世界的变换 RNA、蛋白质与DNA的过渡 从RNA世界到细胞,最关键的变化是一层封闭的脂质膜,它们把 一些大分子的RNA包裹起来,就形成了第一批原始细胞。在原始细胞 内,日渐复杂的RNA将会开始合成蛋白质,由此,RNA世界就将过渡 到一个RNA与蛋白质的“联合世界”。 蛋白质的多样性远远强于RNA,可以催化各种复杂的化学反应, 由它接替RNA的代谢功能可以极大地加快进化的速度。此后随着逆转 录酶的出现,RNA又会把遗传功能让渡给性质更加稳定的DNA,由此 进入一个“逆转录世界”。但是,要从逆转录世界发展到延续至今 的DNA世界,却在进化上有一些难度了。 经过前两章,我们构建了一个存在于白烟囱里的繁荣的RNA生态 系统。在那里,各种各样的酶RNA拥有各种各样的催化能力,它们互 相协作,利用白烟囱里的有机物壮大自己的团体,并且在竞争中变 得越来越复杂。从此以后,“进化”这个措辞将会越来越频繁地出 现在我们的故事里。 但在继续后面的故事之前,我们先要回过头,重新思考一些已 经讨论过的事情。在最初的序幕以及第四章关于生命定义的讨论 中,我们说过,生命不是进化的起点,而是进化在复杂性上的拐 点。
这些RNA的自我复制团体,正是位于起点与拐点之间的东西。依 照第四章的定义,它们当然是一组化学上的耗散结构。因为它们正 在混沌的原始地球上制造高度有序的核酸和蛋白质,施展着竞争与 协作的生存策略,进化得越来越复杂,越来越繁荣,明显远离了平 衡态。但是,这个耗散结构还没有发展出任何的控制功能,我们还 不能将它们称作生命。 我们曾在遥远的第四章里概括过,最初的生命只需三种基本的 控制功能,也就是物质和能量代谢、中心法则以及边界控制。物质 和能量代谢的起源已经在上一幕里露面,中心法则的起源是这一幕 的重点,但生命是一个整体,如果没有恰当的边界控制,没有细胞 膜,其余两种也无法走得太远。 ·边界控制与联合世界· 早在本书的第一章,介绍原始有机汤假说的时候,我们就说 过,细胞膜在原理上非常简单:足够浓度的双极两亲分子溶解在水 里,自然而然地就会聚集成团簇和小泡。而所谓双极两亲分子,就 是一端亲水一端疏水的细长分子。比如,脂肪酸就是个典范,它结 构简单,性质稳定,而且是现代细胞膜的主要成分,从20世纪70年 代开始,人们就推测,最初的细胞膜是由脂肪酸构成的。 至于脂肪酸是从哪里来的,这也并不是难回答的问题。在第三 幕里,我们已经看到,铁硫矿催化合成了许许多多的有机物,十几 个碳原子构成的脂肪酸也能以这样的方式在其中产生。而且在白烟 囱的毛细管道里,脂肪酸,抑或任何双极两亲分子,都能像RNA一样 通过热泳作用浓缩起来,聚集成团簇和小泡。
从概率上讲,要让某些小泡包住一个完整的RNA团体,同样并不 是太难的事情。因为RNA团体的成员大多只有几十、上百个碱基,盘 绕起来只有几纳米,在毛细管道里浓缩了不计其数的复本,而小泡 却可以彼此合并,长到微米尺度,差不多一个细菌那么大,很随意 就能容下前者。 那么,这样的事情一旦发生了,第一批细胞也就诞生了。当 然,这是一些极端原始、极端简单的细胞,它们还没有完整的中心 法则,没有化学渗透,一切物质能量代谢都仰赖矿物管道里的地质 化学作用。这些有机体如果出现在今天,恐怕没有任何生物学家会 把它们当作真正的细胞,所以,让我们姑且把它们称作“原始细 胞”(protocell)。 原始细胞的诞生标志着生命的出现,进化进入了全新的阶段。 在第四章的“纲领”一节里,我们区分过元祖、共祖和末祖的概 念,在这里,请让我们更明确地表述,原始细胞构成的集合就是 “元祖”,是生命之树最深的根尖。 但是,进化为什么会进入这个全新的阶段呢? 今天的细胞固然是一刻也离不开细胞膜了,但是在RNA世界里, 那些自我复制的团体自己活得好好的,为什么会钻进这样一层细胞 膜里去呢?当然,自我复制的团体没手没脚没脑子,它们完全是被 脂肪酸的薄膜包裹住,才困在了细胞膜里面。我们才刚刚结束了 “竞争激烈”的一章,这些被细胞膜包裹住的RNA团体,究竟获得了 什么样的好处,比那些裸露的RNA团体强在哪里,才在进化中脱颖而 出,成为生命的主流? 这就让我们不得不再倒回去一些,看看细胞膜出现之前的RNA团 体有着怎样的处境。
在这些RNA团体当中,每一个RNA都是一个基因,所有RNA汇总起 来就是团体的基因组。于是你会发现,在细胞膜出现之前,这些RNA 团体的基因组实在是“不成体统”。 在今天,别说细胞,哪怕是最简单的病毒,都有一个确定的基 因组,其中包含了所有的可遗传信息[1]。但没有细胞膜的RNA世界 不是这样的,所有的RNA都在矿物管道里自由扩散,稀里糊涂地混在 一起,一条RNA属于哪个团体,一个团体包含了哪几条RNA,一条毛 细管道里有几个团体,统统说不清楚。 像这样“不成体统”的散装样式在RNA世界的初始阶段很有好 处。因为热泳先生随机凑成的诗句绝大多数都是一堆胡说八道的乱 码,只有零星的句子才能发挥一点催化作用。它们全都这样打散了 混在一起,恰好促进了意义与意义的组合,带来一些妙趣横生的东 西,成为进化的原始素材。这就好比从不计其数的汉字当中,选出 最常用的那些字凑一本《千字文》给孩子启蒙,有心人又能从《千 字文》里继续择出115句,编一篇《道觋》给林黛玉启蒙。 但是随着RNA团体进化得日渐复杂,有意义的RNA比例越来越 高,RNA之间的配合越来越密切,这种混乱就成了祸害。不同RNA团 体的RNA在矿物管道里到处乱漂,热液与海水的流动速度又不稳定, 基因之间好不容易形成的协作关系随时都可能被打乱,严重限制了 RNA团体的复杂化。 不仅如此,在一个所有RNA都到处乱漂的世界里,不同的RNA团 体也实在谈不上你的还是我的,绝大多数酶RNA都是逮到什么就催化 什么,不做选择。所以那些胡说八道的垃圾RNA,那些妨碍扩增的有 害RNA,还有那些施皮格尔曼怪,都有机会加倍复制,然后自由自在 地徜徉到周围的RNA团体中去。这不但浪费了宝贵的核苷酸资源,更
抹平了RNA团体之间的差异,削弱了自然选择的力量,降低了进化的 效率。 所以,反过来,如果哪个RNA团体能够获得一层膜,把所有成员 都包围起来,成为一个原始细胞,只允许核苷酸和氨基酸之类有用 的小分子通过,而不允许大分子的RNA序列通过[2],就将在进化上 占据极大的优势。首先,那些无意义的RNA和有害的RNA会被隔绝在 外,不再干扰团体的正常秩序。其次,这个团体的每一个后代也会 拥有包膜,彼此之间明确地区分开来,有利突变更多、有害突变更 少的后代就会扩增更快,占据更大的优势。这样,经过许多代的扩 增之后,团体内部原本存在的有害序列和自私序列,也会被自然选 择逐渐淘汰了。再次,在此基础上,团体中的RNA拥有了稳定的合作 关系,可以进化得更加专一高效,这个酶RNA专门水解这一个序列, 那个酶RNA专门连接那两个序列,许多复杂的功能就渐渐诞生了。 而在这些专一高效的复杂功能中,毫无疑问,最重要的就是 “蛋白质合成”。 在今天的细胞内,蛋白质合成是中心法则的又一个重要环节。 氨基酸在信使RNA、核糖体RNA、转运RNA的三重协作之下缩合起来, 变成了多肽,又折叠成了蛋白质。所以,我们可以畅想,某些原始 细胞的随机突变产生了这三种RNA的雏形,它们与氨基酸相互作用, 就产生了最初的蛋白质。 对于最初的蛋白质,我们无须苛求它立刻就能发挥什么重要的 生化功能,因为那个自我复制的团体还很稚拙,会刻板地复制一切 可及的RNA。那些催化合成蛋白质的RNA只要不闯什么祸,不害死整 个原始细胞,就能存留在原始细胞的RNA基因组中,持续地复制下 去。
然而,蛋白质终究有着无限的潜力。它们在无数次的复制中积 累了足够的突变,就会崭露头角,给原始细胞赋予复杂的结构,实 现高效的催化,像今天这样成为生命活动最重要的功能物质,使纯 粹的RNA世界变成一个“RNA-蛋白质联合世界”。这个世界里的细胞 拥有RNA和蛋白质,但还没有DNA,我们将它称为“核糖细胞” (ribocell)。 从原始细胞到核糖细胞的转变标志着中心法则最关键的部分已 经落成,也代表着这个日益完善的控制系统又向着真正的生命靠近 了一大步。实际上,第四章里总结的三种最基本的控制功能,很可 能在这之后很短的时间内就全部实现了,那些核糖细胞也因此成为 第一批真正意义上的生命。但这一大步究竟要怎样迈出是个非常复 杂的问题,我们把它留到这一幕剩余的章节里细细讨论。眼下,我 们权当这一步已经迈出,看看核糖细胞在之后的进化中遇到了什么 样的麻烦。 ·两双螺旋,两种碱基· 原始细胞或者核糖细胞有了完整的细胞膜,但基因组还是不够 明确。因为在这些细胞内部,所有RNA都还是散装的、乱糟糟的一 团。这就让原始细胞的每次分裂都充满了变数,每个后代细胞继承 的基因不尽相同,比例也不定,好不容易突变出来的优良性状很可 能被不均匀的遗传破坏掉。 对此,核糖细胞似乎有一种非常简单的策略:把所有基因都写 进一条RNA,再把这条RNA复制许许多多份,就能保证每个后代都有 一个完整的基因组了,如今以RNA为遗传物质的病毒,大都是这样做 的。[3]
但可惜RNA有个无法克服的毛病:RNA链条越长,自行折断的概 率越大。如图4—21,这是因为核糖在构成RNA之后仍然带有一个空 闲的羟基,而这个羟基的攻击性非常强,它一方面给RNA赋予了丰富 的催化能力,另一方面疯起来连自己都打,常常攻击旁边那个磷酯 键,把自己的骨架打断,这在碱性溶液里尤其显著。所以RNA分子不 能无限地延长,今天的RNA病毒用各种衣壳蛋白巩固了自己的RNA, 整个基因组最多只有3万来个碱基,编码10多个基因I,对于碱性热 液喷口上的核糖细胞来说,这个数字只能更小,复杂化仍然面临着 严峻的障碍。 图4—20 2019新型冠状病毒(分离株Wuhan-Hu-1,GenBank登录号MN908947)的基因 组,约3万个碱基对编码了大约10个基因。(来自Furfur | Wikicommons)
图4—21 碱性水环境中充斥着氢氧根离子,而核糖在2’位置上的那个羟基会招引氢 氧根离子,把整个磷酸核糖骨架剪断。图中的黑色箭头指示电子对的转移。(作者绘) 对于那些熟悉有机分子的读者,这个问题的解决之道已经含在 嘴里了:换成脱氧核糖不就行了! 脱氧核糖,顾名思义就是比核糖少个氧原子,而少的那个氧原 子就在那个羟基上。当然,脱氧核糖构成的核酸已经不能再叫RNA 了,它已经变成了我们期待已久的DNA。 图4—22 核糖与脱氧核糖的比较图。如果你觉得右边还少了一个氢,那是因为在有机 化学的键线式里,直接连接碳原子的氢原子通常省略不写。(作者绘)
图4—23 双螺旋两种右旋构想图示。“碱基所在的曲面”是为了理解方便而构造的假 想曲面,双螺旋的碱基会大致分布在这个曲面上,你可以将这幅图与图2—43对照一下。 (作者绘) 就因为这一个氧原子的区别,DNA不仅拥有更加牢固的骨架,还 更容易与互补链稳定地缠绕起来,形成那个著名的双螺旋结构。在 第六章里,我们曾把碱基互补配对的双链核酸比作一架梯子,所谓 双螺旋,就是让这架梯子绕着某个旋转轴扭起来。但是,梯子具体 怎么扭,却有图4—23中的两种方式:一种是像左边那样,像缠胶带 一样缠在旋转轴上;另一种是像右边那样,像拧麻花一样两端朝不 同的方向转动,旋转轴就是梯子固有的对称轴[4]。
于是我们发现,某些以双链DNA为遗传物质的病毒,比如第十一 章里那些新发现的巨型病毒,竟然可以拥有有上百万个碱基的基因 组,编码上千种蛋白质。而对于细胞来说,哪怕只是一个细菌,也 能用一个DNA双螺旋存下近千万个碱基组成的基因组,编码上万个蛋 白质。这都是因为,DNA的双螺旋,实在要比RNA的双螺旋稳定得多 了。 对于那些好奇DNA来自何处的读者,这一章结束之后会有一篇 “延伸阅读”,介绍一类非常古老,足能追溯到末祖身上的酶。但 在正文里,我们要继续观察DNA与RNA的另一项重大差异。 我们在中学的生物课上就已经知道,那个与腺嘌呤(A)配对的 碱基,在RNA上是尿嘧啶(U),在DNA上却换成了胸腺嘧啶(T), 比较一下这两个碱基的差别,你会发现T比U只多了一个甲基。 这是为什么? 因为碱基C并不是一种非常稳定的物质,它在水溶液里自己就会 发生一种“自发脱氨反应”,直接变成碱基U。在我们这样的动物体 内,每个细胞每天都会发生大约190次的C-U突变,而DNA肩负着遗传 的功能,指望着要绵延无限长的岁月,这样频繁的突变日积月累, 必成大患。 所以幸好DNA不使用碱基U,这样的突变一旦发生就会立刻暴露 出来。今天的细胞都有一套精密的DNA修复系统,会沿着DNA不断巡 查,把所有的U统一改成C,就能纠正这种错误了[5]。 对此,一定会有读者提出这个问题:细胞何不干脆放弃碱基U, 无论DNA还是RNA,一律使用T,不就一了百了了吗?这是因为,RNA 并不害怕这样的突变,倒是很厌恶那种纠错机制。
在今天的细胞里,信使RNA的寿命非常短,通常来不及突变就已 经降解了,偶尔发生一次,遗传密码也有相当大的容错能力,未必 影响到最后的蛋白质,即便破天荒地产生了一个严重错误的蛋白 质,细胞还有精密的蛋白质回收机构[6],能把这个坏掉的蛋白质及 时水解。 图4—24 碱基C在水中自发脱氨基,变成碱基U。(作者绘) 图4—25 碱基C突变成U以后仍能与G配对,只是少了一个氢键,错开了一点。(作者 绘) 转运RNA与核糖体RNA的功能主要来自二级结构,也就是碱基之 间的互补配对。但是,我们一直以来默认的那种“碱基互补配对原
则”并不是唯一的,C可以与G配对,变成U之后照样可以配对,所以 对于已经形成二级结构的RNA来说,C-U突变几乎不会有任何影响。 细胞之内除此之外的其他RNA尺寸更小,寿命更短,突变概率更 低,所以,总的来说,RNA的C-U突变根本不用处理。 但是,如果有一套修复系统要在RNA链上不断巡逻,纠正这些错 误,那反倒坏了事。因为RNA要参与各种活跃的生化反应,实在忙得 很,中间突然附着上一个巡逻员,必然碍手碍脚。而且巡逻员既然 要巡逻,势必要解除RNA的三维结构,把它抻直成一条线,好把碱基 序列完全暴露出来。这下,RNA的武功算是全废了,什么生物活性都 没了。更何况细胞要制造这些巡逻员出来还得消耗大量的氨基酸与 能量,在RNA这种消耗品上折腾纯属柴火棍上雕花,卫生纸上刷漆。 更根本的是,今天的细胞并没有单独合成DNA单体的能力,我们 都是先合成A、U、G、C四种碱基的RNA单体,再给它们的核糖脱氧, 变成A、U、G、C四种碱基的DNA单体,最后再给碱基U的DNA单体加上 一个甲基,变成碱基T的DNA单体。这整个过程中都没有碱基T的RNA 单体,那么作为单体的聚合产物,RNA序列也当然绝少有T了[7]。 这个代谢过程强烈暗示了这样一件事:细胞最初只有RNA,后来 才在此基础上加工改良,产生了DNA。如果你还记得序幕的两篇“延 伸阅读”,也应该会记得改造旧结构产生新功能正是进化最擅长的 事情。在RNA世界假说的诸多依据里,这也是非常重要的一个。 总之,把RNA变成DNA,把U换成T,细胞获得了空前的基因组容 量和遗传稳定性,进化又将进入一个全新的阶段了。 可那个问题又来了:进化为什么会进入这个全新的阶段呢?
·俘虏来的逆转录世界?· 在某些版本的RNA世界假说里,从RNA到DNA的过渡平滑而顺畅: 首先是某些偶然的反应把一部分核糖变成了脱氧核糖,然后是这些 脱氧核糖混进了细胞的基因组,形成了一些DNA与RNA的杂交链,而 当DNA的优势逐渐展现出来,它们在基因组中的比例就会越来越高, 最终完全取代RNA。就在2018年,斯克里普斯研究所,24—3聚合酶 诞生的地方,又有另外一组分子生物学家成功培养出了基因组中带 有45%到50%的RNA的大肠杆菌II,这意味着DNA与RNA的杂交链仍能发 挥正常的生化功能。 但事情恐怕没有这样简单,DNA与RNA的杂交链能够存在是一回 事,有优势就完全是另一回事了。DNA双链的确比RNA双链稳定得 多,但DNA-RNA杂交链的稳定性不是介于两者之间,而是比RNA双链 更不稳定。所以原本活得好好的核糖细胞一旦在基因组中掺入了 DNA,反倒会在竞争中处于劣势,被淘汰掉了。 这说起来有些遗憾,但自然界的进化不受任何意志干预,既不 受什么超自然神明的意志控制,也不受有机体自身的意志控制,因 此绝不会展现出任何“远见”,一切都只在于“眼前”的片刻得 失:某个突变眼下能带来某种好处,就会被自然选择相中,而不考 虑它将来可能招致的任何祸患;某个突变眼下是个弊端,就会被自 然选择淘汰,而不顾惜它将来可能带来的一切裨益。 所以DNA的出现更有可能是跃进式的,在很短的时间内就占据了 基因组的主导地位,而不曾经历一个漫长而尴尬的“杂交链”阶 段,比如说利用逆转录,把整个基因组一次性地转移到DNA上。
至于从“核糖细胞”到“逆转录细胞”的跃进是如何发生的, 倒不难解释。核糖细胞已经拥有RNA复制酶,这个酶负责以RNA为模 板,用RNA的单体聚合新的RNA链。那么,只要随机发生一些细节上 的突变,它就有可能变成一个逆转录酶,改用DNA的单体聚合出DNA 链了。这个突变后的酶如果再以刚刚聚合出来的DNA为模板再聚合一 次,就能获得双螺旋的DNA了。就目前所知,逆转录酶与RNA复制酶 的结构的确很像III。 但在很大程度上,逆转录酶的表现只能称得上差强人意。直到 今天,逆转录酶的错误率都和RNA复制酶不相上下,至少也有几万分 之一。DNA作为遗传物质的稳定性,要到复制DNA的酶系统充分健全 之后才能体现出来,然而早在第七章的结尾处我们就说过,这个酶 系统是在细菌和古菌分野之后才健全的,而那已经是很晚之后的事 情了。所以,关于这个“逆转录世界”的起源,我们还是有许多细 节没有推敲清楚。 同样是在第七章结尾处,我们讨论生命起源图景的建立的时 候,提到过法国巴斯德研究院微生物学部的帕特里克·福泰尔,提 到过他对于DNA起源的大胆设想,那个设想应对的正是眼前的这个问 题。福泰尔设想,最先使用DNA的是病毒,把核糖变成脱氧核糖的 酶,还有把RNA逆转录成DNA的酶,都来自病毒,因为DNA可以帮助病 毒突破细胞的防御,而逆转录世界的起源,就是细胞俘获了病毒的 基因IV。 对于人类这样的多细胞生物,击退病毒最惯常的办法就是把受 到感染的细胞全杀死,弃卒保车。但对于单细胞生物尤其是原核生 物而言,这样做就未免太激进了。它们更倾向于设法识别出病毒RNA 的双链部分,将它们剪碎、降解——我们在第十四章遇到过这套RNA 干扰机制,它可以追溯到末祖那里。
但是,如果有某种RNA病毒突变出了把基因组写入DNA的能力, 进化成了逆转录病毒,就会立刻占据这场斗争的上风。上文刚刚说 过,双链DNA和双链RNA有着非常不同的螺旋形态,这就让RNA干扰只 能剪断双链RNA,却不能剪断双链DNA。所以,逆转录一旦完成,病 毒就再难清除,只会牢牢盘踞在细胞之内,复制得又多又快,再去 感染其他细胞。 然而,逆转录病毒终究是病毒,它们只顾着感染和复制,却顾 不得保守秘密,经常会把自己的基因遗落在宿主细胞内。那么,当 核糖细胞被逆转录病毒大规模地感染,就很可能有少数幸运儿非但 没被病毒杀死,反而俘获了制造逆转录酶的基因,在很短的时间内 把整套基因组都搬到了DNA上,这就绕开了自然选择的短视,帮助它 们在长远的竞争中占据了优势。 这乍听起来非常神奇,但是在进化史上太稀松平常了,别说40 亿年前那些什么机制都不健全的核糖细胞,就连最复杂的哺乳动物 细胞,也照样能从逆转录病毒那里占到便宜。在第十一章我们说 过,真核细胞的基因组中有许多逆转录转座子,而在这些逆转录转 座子中,有相当一部分就是细胞俘获的逆转录病毒,被我们称为 “内源性逆转录病毒”。 就拿人类来说,我们和绝大多数哺乳动物一样,胎儿要通过胎 盘与母体交换物质。为此,胎盘的表面长满了绒毛状的凸起,可以 扎进子宫内膜,增大物质交换的效率。但人类的胎盘表面不只有这 些凸起,还包裹了一层特殊的细胞,叫作“合胞体滋养层”,它们 会不断分泌蛋白酶,然后像肠道消化吃下去的肉一样,把紧挨自己 的子宫内膜消化掉,让胎盘直接浸泡在母体渗出的血液里,这样就 可以更加高效地交换物质了。另外,合胞体滋养层还能制造多种激
素,维持妊娠期间的子宫内膜完整,避免怀孕早期的流产(参见图2 —63和图2—64)。 而控制合胞体滋养层发育的最关键的基因,就是“内源性逆转 录病毒W封装成员1号”(ERVW-1),它来自2 500万年前感染了我们 灵长类祖先的一种逆转录病毒,这个病毒的所有碎片占据了人类基 因组的1%,而迄今发现的各种内源性逆转录病毒一共占据了人类基 因组的8%。这个数字远比看起来惊人,要知道,那些真正编码了蛋 白质的外显子全加起来也只占人类基因组的1.5%。当然,也不是只 有人类或者灵长类动物俘获了逆转录病毒,鼠、兔、象和蝙蝠也以 相同的途径获得了合胞体滋养层,对各种真核生物来说,内源性逆 转录病毒都能占据基因组的10%左右V。 说回核糖细胞,它们从病毒那里俘获了逆转录机制,开始把遗 传信息写入DNA,但这时的DNA仍在使用碱基U [8]VI,那么,又是什 么让核糖细胞改用碱基T了呢? 在福泰尔的推测中,这与它们改用的DNA的原因如出一辙,都是 俘获了病毒的基因,也都是病毒要躲避细胞的防御:细胞与病毒的 对抗永远都不会停止,病毒把遗传信息写进了DNA,细胞就会设法识 别DNA中的碱基序列,追杀病毒,那么病毒就再反过来修饰自己的碱 基,让细胞认不出来。 给U碱基增加一个甲基,正是一种简便易行、立竿见影的修饰。 这个甲基不改变碱基配对时的氢键,也就不影响DNA的合成。T和U用 起来没什么不同,却改变了碱基的形状,让那些在DNA上巡逻的蛋白 质哨兵结合不住,无法被识别。像这样修饰碱基突破防御的做法, 直到今天都被许多DNA病毒延续着。比如许多专门感染细菌的噬菌体 就会编码一些专门的酶,给自己的碱基C增加一个羟甲基,成为“5-
羟甲基胞嘧啶”。而这个给碱基C增加羟甲基的酶,刚好就与给U增 加甲基的那个酶,有着相同的进化来源VII。 不过也应该指出的是,福泰尔是在2003年左右总结的这个设 想,当时5-羟甲基胞嘧啶还只在病毒的DNA中发现过。但是到2009年 我们就发现,这个特殊的碱基也存在于哺乳动物的胚胎干细胞,以 及灵长类动物和啮齿类动物的大脑中VIII,与这些细胞的分化有着密 切的关系,能够促进某些基因的表达。这背后究竟意味着什么,有 着怎样的进化历史,到这本书写成的时候还没有任何清晰的结论。 总之,在福泰尔的推测里,核糖细胞在与逆转录病毒和DNA病毒 的厮杀中“师夷长技”,获得了DNA的基因组,其中的某些细胞,就 是我们的末祖。但末祖的样貌我们要等到下一幕才能细说,此时, 我们又要回忆第七章快要结尾的部分。在那里我们提过,白烟囱假 说与福泰尔的推测“若合一契”,共同构成了一幅生命起源的图 景。那么,这是怎样一种契合法呢? 白烟囱,刚好能给核酸提供必要的复制条件。 ·温差中的链式反应· 无论是RNA还是DNA,一旦缔结成连续的双链,就会变得更加稳 定,但也同时遇到一个问题:这些双链的碱基都已经互补配对了, 还怎么拿去复制、转录、翻译、逆转录,完成中心法则的信息流动 呢?在今天的细胞内,会有一些专门的酶去把双链解开,让模板链 恢复单身,以便让各种酶结合上去。但是在双链初次形成的联合世 界或者逆转录世界里,稳定的双链要如何才能打开呢?
温度,靠温度的变化就可以! 碱基配对靠氢键,而氢键对温度很敏感。在较高的温度下,所 有的碱基对都会自行断开,双链也就被拆成了两条舒展的单链。当 温度有所下降,碱基又可以重新配对。当然,此时的原配早就不知 漂到哪里去了,单链要重新配对就只能随遇而安,在复制酶、聚合 酶、逆转录酶的帮助下新造一条互补链。 不难想到,温度如果忽升忽降,这个过程就会循环往复,溶液 中的核酸也会因此不断扩增。实际上,这正是人类在实验室中大量 复制某段DNA或RNA序列的标准做法,被称为“聚合酶链式反应”。 比如第十四章里那些施皮格尔曼怪就是这样扩增出来的。 而白烟囱的矿物管道刚好能给链式反应提供非常恰当的温度条 件:碱性热液的温度可以高达90℃,酸性海水的温度又在30℃以 下,它们在管道里持续不断地对流,就能给原始细胞、核糖细胞和 逆转录细胞带来周期性的温差,促成链式反应了。在实验室里,相 同原理的“对流式PCR”可以在25分钟之内把模板链扩增10万倍IX, 白烟囱在40亿年前的效率哪怕只有这个实验的万分之一,也远远超 过现代细胞的复制速度了。
图4—26 DNA聚合酶链式反应图解。(来自Enzoklop | Wikicommons) 如果温差产生的链式反应真的提供了DNA扩增的关键辅助,那么 早期的逆转录细胞就很难进化出独立完整的DNA复制系统了,因为温 度变化能像拆包装一样骤然撕开双链,而解旋酶只能像拉拉链一样 从头到尾逐个打开双键,相比之下效率低得很,并没有什么明显的 适应优势。 而这又恰恰解释了第七章里尤金·库宁发现的疑问:复制DNA的 酶系统,是在末祖分化成细菌和古菌,开始独立生存的过程中各自 进化完善的。 至于末祖是如何分化成了细菌和古菌,细菌和古菌又是如何获 得了独立生存的能力,这两个问题将会收拢迄今为止的整个故事, 拼成一幅空前完整的生命起源图景。那些急切地想要欣赏这幅图景 的读者,可以现在就跳到下一幕去,一口气读完这本书的正文。而 那些愿意留在这一幕的读者,我们将一起回到RNA世界向联合世界过 渡的时刻,进入核糖细胞内部,思考一个具体且重要的问题:
最初的蛋白质,是怎么合成出来的? 延伸阅读 核糖核苷酸还原酶的工作原理 DNA当然有可能像RNA一样是地质化学作用的产物。比如就在 2019年,一项新研究证明了乙醛等小分子有机物可以循序渐进地从 头合成DNA的单体。X 但是,正如正文里反复讨论过的,如今的生化反应强烈暗示了 DNA是RNA改良的产物,而不是一种从头开始的创新,所以,今天的 细胞里发生的事情,恐怕更值得思考和借鉴。 在今天的细胞里,负责制造脱氧核糖的是“核糖核苷酸还原 酶”(RNR),但它不是给单独的核糖脱氧,而是给RNA的单体脱 氧,直接产生DNA的单体。 RNR是一类高度保守的酶,它在任何细胞中的催化机制都高度一 致,这明显又是从末祖那里继承下来的。而这种催化机制也非常有 趣,可以用“威逼利诱”来形容:它先是制造出了一些非常凶猛的 “自由基”,去攻击核苷酸上的核糖,使核糖变得非常不稳定;之 后又用一些活跃的氢原子引诱核糖,核糖当然会伸“手”去抢,而 核糖的“手”正是那个活跃的羟基,这一抢就不可避免地上了当-羟 基遇上氢原子,立刻就会结合成稳定的水分子,兀自离去,核糖也 就失去了那个氧原子,变成脱氧核糖了。 如果你想把这个过程了解得再清楚一些,那么就以真核细胞的 RNR为例,它的催化过程主要包括三个阶段XI。这三个阶段的研究虽
然还在理论推测中,其中有很多细节并不严谨,但这并不妨碍我们 试着理解它。 第一个阶段是制造自由基。XII所谓自由基就是带有不成对电子 的化学基团。或者说得粗糙一些,自由基大多是分子被“暴力”夺 去了一部分,化学键从中间扯断,形成的“带有半个化学键的分子 碎片”。通常来说,这些自由基都极其不稳定,一定要从别的分子 上抢回自己失去的部分才甘心,而这又往往造成一个新的自由基, 这个新的自由基又会去别的分子上抢别的碎片,由此不断地传递下 去,直到一个自由基遇上另一个自由基,合并成一个稳定的分子。 而在RNR的α亚基的活性中心,就有一对很暴躁的铁原子,它们 会联合起来暴力攻击旁边的一个酪氨酸[9],夺走它的一个氢原子, 把它变成一个酪氨酸自由基。那个酪氨酸自由基反应过来,转身就 从旁边一个色氨酸上抢来一个氢原子,恢复了稳定,然而那个色氨 酸又成了新的自由基……就这样,如图4—27,一连串的氨基酸欺软 怕硬地抢劫氢原子,接力的终点是β亚基里一个半胱氨酸自由基。 第二个阶段,自由基攻击核苷酸的核糖,迫使核糖脱氧。XIII那 个半胱氨酸的自由基毕竟是个自由基,一定要从哪儿抢回一个氢原 子来,于是瞄向了身旁的核糖核苷酸,从它的核糖上夺走一个氢原 子,恢复了稳定。如图4—28,这下又轮到核糖变成自由基,想要抢 夺氢原子了。 接下来的事情就有点儿复杂了,这也是整个“脱氧”过程的关 键。RNR左右开弓,一手威逼3号碳原子的羟基,一手利诱2号碳原子 的羟基,兜兜转转,巧妙地把2号碳原子上的羟基换成了氢,最终脱 掉了那个碍事的氧。
如图4—29,在红色箭头标记的变化中,RNR预备了一个电离了 的羧基,去撕扯3号碳原子上的羟基的氢。如果要在3号碳原子和与 它相连的那个氧原子之间构思什么对话,那大概就是这样的: 图4—27 RNR的α亚基的活性中心用一对铁原子制造酪氨酸自由基,由此开始连续不 断的自由基攻击,如箭头指示,一直抵达β亚基的活性中心,虚线框里会发生第二个阶 段。(作者绘) 图4—28 在RNR的β亚基的活性中心,半胱氨酸自由基攻击核糖的3号碳原子,夺走一 个氢原子。图中的虚线框与图4—27的虚线框对应,蓝色键线连接的分子是一个核糖核苷 酸分子,周围的氨基酸都是RNR的β亚基的氨基酸残基,为了表现方便,这里将它们都画 在一个平面上,但它们实际上存在于三维空间里。此外,红色圆点表示自由基的不成对电 子,黑色圆点表示负电荷,虚线化学键表示氢键,鱼钩箭头(半箭头)表示不成对电子转 移。(作者绘)