登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書

『簡體書』上帝的手术刀:基因编辑简史(大字版)

書城自編碼: 3553085
分類:簡體書→大陸圖書→科普讀物人类故事
作者: 王立铭
國際書號(ISBN): 9787500292227
出版社: 中国盲文出版社
出版日期: 2020-09-01

頁數/字數: /
書度/開本: 大16开 釘裝: 平装

售價:HK$ 77.9

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
爱的能力:为什么我们既渴望爱,又害怕走进爱(第13版)
《 爱的能力:为什么我们既渴望爱,又害怕走进爱(第13版) 》

售價:HK$ 83.8
环艺设计手绘:景观/室内 马克笔 手绘效果图技法精解
《 环艺设计手绘:景观/室内 马克笔 手绘效果图技法精解 》

售價:HK$ 95.8
明清与李朝时代
《 明清与李朝时代 》

售價:HK$ 81.6
感动,如此创造
《 感动,如此创造 》

售價:HK$ 71.8
商业人像摄影
《 商业人像摄影 》

售價:HK$ 95.8
抗争表演
《 抗争表演 》

售價:HK$ 74.4
咏春八斩刀
《 咏春八斩刀 》

售價:HK$ 83.8
聊不完的艺术家:跨界设计师穆夏
《 聊不完的艺术家:跨界设计师穆夏 》

售價:HK$ 117.6

 

建議一齊購買:

+

HK$ 97.5
《 缤纷的生命 》
+

HK$ 72.5
《 生命的未来 》
+

HK$ 60.0
《 巡山报告:如何理解一种全新疾病 》
+

HK$ 91.1
《 生命是什么 》
+

HK$ 63.4
《 巡山报告·基因编辑婴儿:小丑与历史 》
+

HK$ 99.3
《 创造的本源 》
編輯推薦:
回望遗传秘密的追寻之路 迎接基因编辑的梦幻未来
会不会有一天,我们也会利用基因编辑技术,让自己更聪明、更强壮、更长寿、更美丽?会不会有一天,我们也会按照我们的意愿改进自己的下一代,把生命稍纵即逝的光华写进我们的遗传密码,从此成为永恒?如果那一天到来,等待我们的是焕然一新的人类,还是魔鬼出没的世界?
对于这些问题,整个世界都没有准备好答案,但是未来的未来,真的已经开始到来。
內容簡介:
作者在书中娓娓道来基因编辑的历史脉络,展现人类探索自身的历史进程,从分子层面出发,重新思考人类的过去、现在和未来。不管是艰难的探索、惊喜的突破,还是犹疑的后撤、磅礴的希冀,基因编辑这把上帝的手术刀都让我们倾倒。
關於作者:
王立铭
浙江大学教授,神经生物学家。本科毕业于北京大学,在美国加州理工学院获得博士学位。曾在美国加州大学伯克利分校和波士顿咨询公司工作。入选国家青年千人计划和浙江省千人计划。 先后获得求是杰出青年学者奖菠萝化学奖顾孝诚讲座奖文津图书奖全球华语科幻星云奖吴大猷科普著作奖金奖等。著有大众科学读物《吃货的生物学修养:脂肪、糖和代谢病的科学传奇》《生命是什么》。
目錄
赞 誉 001
推荐序 科学的故事之旅 004
前 言 007

01
基因的秘密
达尔文的麻烦
种豌豆的神父
围猎遗传因子
双螺旋
中心法则

02
给基因动手术
让人生病的基因
基因入药
成也病毒,败也病毒
绝望后的希望

03
黄金手指
缺啥补啥遇到的新问题
里德先生的烦恼
基因组手术三件套
20年的独角戏

04
编程时代
开源破牢笼
神话蛋白
颠覆和被颠覆
超轻量级选手
看不见硝烟的战场


05
未来,和未来的未来
意想不到的突破
基因编辑进化论
未来的未来
未雨绸缪:伦理还是监管

后 记
图片来源
內容試閱
达尔文的麻烦
“遗传”,听起来是个人人都能理解的科学名词。中国人说“种瓜得瓜,种豆得豆”“老鼠的儿子会打洞”,英美人说“like father like son”(有其父必有其子)。这些俗语里反映的生物代际之间的相似性,就是遗传。其实从这几句俗语就能看出来,先人们大概早就发现,不管是动物还是植物,不管是生物的外形、行为,还是性格,这些性状都能在一代代的繁衍中顽强地延续和保留下来。
实际上,早在人类文明开始之前,人类就已经充分——尽管也许是下意识——观察到了遗传现象的存在,甚至已经开始利用遗传规律改善自己的生活了。
现代人类的祖先可以追本溯源到数百万年前的非洲大陆。2015年,古生物学家在东非埃塞俄比亚发现的下颌骨化石,将人属生物出现的时间又一次大大前推至距今280万年前。在200多万年的无尽岁月里,先祖们在非洲大陆上采集植物果实、捕获动物,过着靠天吃饭、随遇而安的生活。人类文明的曙光出现在距今十几二十万年前。那时,现代人的直系祖先——人属智人种——出现在非洲大陆,并且很快一批批地走出非洲,在全世界的各个大陆和主要岛屿上开枝散叶,也把采集和狩猎的固有天性带到了世界各地。在那个时候,还压根看不出我们这些身材矮小、面相平凡的先祖会在日后成为整个地球的主宰。
然而,就像突然拥有了某种未知的魔力一般,差不多从10000年前开始,在世界各地快乐采集和狩猎的智人先祖们,几乎在一眨眼间就改变了赖以生存的生活方式。这些变化开启了农业时代,也终催生了今天建立在发电机、汽车、互联网和生物技术基础上的全新人类社会。而这一切变化的开端,就是祖先们对于遗传规律的利用。
在贾雷德·戴蒙德(Jared Diamond)的名著《枪炮、病菌与钢铁》中对此有着生动详尽的讨论。就在人类先祖走出非洲的必经之路上,地中海东岸生长着繁茂的野生小麦,它们的种子富含蛋白质和淀粉。因此我们不难想象,当生活在中东新月沃地的人类先祖们在偶然间发现这种植物后,一定会如获至宝地将它们作为日常采集和储藏的对象。对于先祖们来说,这和他们数百万年来在非洲大陆进行的日常采集工作并无分别。
如果先祖们想要把这些野生小麦挖出来,栽培在自己村庄的周围,为他们提供稳定的食物来源,就会遇到一些棘手的问题。野生小麦的麦穗会在成熟后自动从麦秆上脱落,将种子尽力播撒到周围的泥土里。这是这些禾本科植物赖以生存繁衍的性状之一,但这也使得人类先祖想要大规模收获小麦种子变得非常困难。毕竟,总不能一天到晚盯着快要成熟的麦穗,在它们刚要成熟尚未脱落的短暂时间窗口里眼疾手快地收割吧?
后来,在某个不知名的具体年代,生活在中东地区的远古居民们无意间发现了一些偶然出现的遗传变异小麦。这些小麦的麦穗即便成熟以后,也不会自动脱落。我们可以很容易想象,如果这些变异小麦出现在野外,将注定只有死路一条。因为它们完全无法通过脱落的麦穗散播自己的后代。但这些变异植株对于我们的先祖们来说却无比珍贵,因为这样的遗传突变小麦会大大方便他们在固定时间大批收割麦穗、储存麦粒(见图1-1)。


图1-1 古埃及壁画
画中的农民们正在收割小麦。今天在全球范围内广泛种植的小麦是人类驯化的产物,在漫长的驯化过程中,野生小麦天然出现的遗传突变被远古居民发现并小心保留下来。

更要紧的是,先祖们一定也在无意间发现了遗传的秘密——种瓜得瓜,种豆得豆,因此这些仿佛是上天赐予的神奇的小麦种子,也将会顽强地保留这种对人类先祖而言——而不是对小麦自身,极其有利的性状。所以我们可以想象,先祖们可能会将这些奇怪的植物小心移植到村庄周围,用心呵护,直到收获批成熟的种子。这些种子将成为下一年扩大种植的基础。就这样,伴随着一代代人类先祖们的细心发现、栽培和收获,符合人类需要的优良性状被保留了下来,一直保留到今天。
这些无意间发现的遗传突变小麦,可能标志着人类农业社会的开端。
在中东、黄河两岸以及中美洲的丛林里,对遗传现象的理解和利用给我们的先祖带来了籽粒更饱满、发芽和成熟时间更统一的小麦和大麦,豆荚永不会爆裂的豌豆和大豆,有着超长纤维的亚麻和棉花,还有绵羊和鸡鸭等各种家畜家禽。人类的文明时代就这样开始了。因为这些遗传现象,人类祖先们得以告别随遇而安的狩猎采集生活定居下来,靠小心侍弄作物和家畜过活。也因为这些遗传现象,人类祖先们可以生产出多余的粮食来养活四体不勤、五谷不分的神父、僧侣、战士和科学家,可以组织起复杂的政府和疆域辽阔的国家,建造辉煌的神庙和宫殿,并终孕育出了神迹般的现代人类社会。
但是遗传的本质究竟是什么呢?为什么是“种瓜得瓜,种豆得豆”“老鼠的儿子会打洞”呢?反过来,如果遗传的力量是如此强大,为什么我们仍然可以在自然界看到各种各样的丰富变异?为什么生长在中东新月沃地的野生小麦,百万年来遵循着成熟即脱落的繁衍规则,却还是能偶然产生麦穗不会脱落的后代,而这种奇特性状又可以稳定地遗传下去?为什么经过一代代的筛选后,长得像狗尾巴草一样的野生玉米会变成今天穗壮粒满的模样(见图1-2)?


图1-2 野生类玉米(左)和今天广泛种植的玉米作物(右)
两者看起来几乎不像是同类生物。在玉米的驯化过程中,玉米穗的大小变化更是惊人。

早从理性高度思考遗传现象本质的,是同样生活在地中海边的古希腊人。
在古希腊哲学家德谟克利特和希波克拉底看来,遗传现象必然有着现实的物质基础,不需要用虚无缥缈的神祇来解释。在他们的想象里,遗传的本质是一种叫作“泛生子”(pangene)的微小颗粒。这种肉眼不可见的颗粒在先辈的体内无处不在,忠实记录了先辈从形态到性格的各种性状,并且会在交配过程中进入后代体内。以泛生子颗粒承载的信息为蓝图,子代得以表现出对先辈们的忠实模仿。
必须承认,泛生子的概念本身,其实并没有解决任何实际问题。或者刻薄点说,这只是把人们习以为常的遗传现象用一个听起来晦涩难懂的名词概括了出来而已。但是这个从现象到概念的抽象过程绝非毫无用处。至少,借用这个概念,人们可以把许多看起来很不一样的现象联系起来。例如,无性生殖——微小的细菌和酵母能够一分为二产生两个后代;有性生殖——雌雄家畜交配后会生出一群嗷嗷待哺的小崽儿;甚至还包括果树的嫁接——为什么果树嫁接后的果实会带有接穗(用来嫁接的枝条或嫩芽)和砧木(用来承接接穗的树木)的共同特征,不就是因为泛生子颗粒能够从砧木毫无障碍地流动到接穗里面去,和接穗的泛生子合二为一嘛。因此,这个生命力顽强的概念从古希腊时期一直流传到了近代。甚至在19世纪中期,在达尔文创立进化论,为地球生命和人类的起源找到科学解释的时候,他仍然借用泛生子的概念作为自然选择理论的遗传基础。


图1-3 泛生子融合理论
按照这种理论,父母的遗传信息隐藏在泛生子颗粒内,在交配过程中,父母双方的泛生子颗粒混合进入子代,决定了子代的性状。

在达尔文看来,一个生物个体的所有器官、组织乃至细胞,都拥有自己专属的泛生子颗粒。手的泛生子记录着每个动物的手掌大小、宽窄、掌纹乃至毛发的生长位置,眼睛的泛生子当然少不了记录眼睛的大小、虹膜的颜色、视力的好坏,等等。在交配过程中,来自父母双方的泛生子融合在一起,共同决定了后代们五花八门的遗传性状——就像红蓝墨水混合以后产生的紫色液体,仍旧带着红色和蓝色的印迹(见图1-3)。
更要紧的是,泛生子携带的生命蓝图一旦出错,就会导致后代遗传性状的“突变”,而这些突变,就是达尔文进化论中自然选择和适者生存的物质基础。正是因为有突变,一代代生物个体才会具有微小但能够稳定遗传的差异,而这些遗传差异影响着生物个体在环境中生存和繁衍的能力,并终导致适者生存。
就像许多读者早在中学时期就耳熟能详的那样,达尔文的进化论在诞生后遭到了猛烈攻击。特别在宗教界人士和虔诚的信徒们看来,达尔文的学说亵渎了人类万物之灵的神圣性,也把传说中按照自己的模样造人的上帝置于可有可无的尴尬地位。牛津主教塞缪尔·威尔伯福斯(Samuel Wilberforce)的那个著名问题:“尊敬的赫胥黎先生,你是否愿意承认自己的祖父或祖母是猿猴变来的”也因此进入了中小学教科书。
但很少有人知道的是,进化论同样遭遇了严肃的科学批评。热力学创始人之一、物理学家开尔文勋爵(Lord Kelvin,原名威廉·托马森)当时估算出地球的年龄至多不会超过一亿年,而这点时间远远不够积累出达尔文进化论所需要的五花八门的遗传突变(当然,后来人们意识到地球的年龄远大于此)。古生物学家们对此发出了诘难,按照进化论,地球上必然存在许许多多物种之间的中间形态,但是它们的化石又在哪里呢?(越来越多的化石发掘已经填补了大量进化过程的所谓“缺环”。)有一个批评可能是致命的,因为它声称发现了进化论和遗传融合理论的深刻矛盾,换句话说就是,达尔文辛辛苦苦为进化论找到的遗传基础,可能根本不支持进化论的声明。
这一批评来自苏格兰工程师、爱丁堡大学教授亨利·弗莱明·詹金(Henry Fleeming Jenkin)。他评论说,按照达尔文的进化论,生物的遗传物质需要经历漫长、微小的突变过程,才能产生足够显著的性状变化,终造就地球上五花八门的物种(见图1-4)。


图1-4 泛生子融合理论(左)和自然选择理论(右)的矛盾
按照泛生子融合理论,父母体内泛生子的微小变化会在交配繁衍过程中被“稀释”不见。这一点和自然选择理论是矛盾的。按照后者,微小的遗传变化也是可遗传的,这将成为自然选择的物质基础。

打个比方,就像有一头小猪,今天替换掉鼻子,明天替换掉尾巴,几个月后(如果在这个过程中不考虑小猪的感受的话),我们就能把它变成一头小牛。如果泛生子融合理论是正确的,那么任何生物个体中出现的一点点微小的遗传变异,都会在交配繁衍的过程中湮灭不见——就像一滴墨汁滴入一大杯牛奶,黑色很快会消失不见。
我们立刻可以看出,小猪变小牛和墨汁滴入牛奶,是完全无法相容的两套理论。如果前者是正确的,就像在说一滴墨汁——不管多么微小——都可以让整杯牛奶变黑;而如果后者是正确的,那么小猪根本就不会失去任何原有的特征,因为所有微小的遗传变异都会像牛奶里的一滴墨汁一样,会被毫不留情地稀释直至消失。
达尔文也许并没有多么严肃地看待詹金的辩驳。数年后,达尔文发表了他的另一本巨著《人类的由来和性选择》,正式把人类开除出伊甸园,成为猿猴们的近亲,他的依据仍然是自己的进化论。而达尔文和詹金都不知道的是,就在他们为泛生子融合理论反复辩驳诘难的同时,在数百公里之外的欧洲大陆一座不起眼的修道院里,人类的目光已经穿透纷繁壮美的地球生命,次看到了遗传的真正秘密。
遗传的秘密隐藏在黑暗之中。
上帝说,请让豌豆开花结果,于是一切有了光明。

种豌豆的神父


在抽象的哲学思辨——想想德谟克利特、希波克拉底和达尔文——之外,世界各地的农牧民们也在自觉不自觉间研究着遗传的秘密。


图1-5 安康羊
这种短腿的变种在野外将毫无生存能力,但是它能够极大地方便牧民圈养,因此被牧民细心挑选并推广开来。很明显,安康羊是一次偶然的遗传变异的结果,因为其父母的腿都是正常的。

当然,这里头的缘由是很朴素的。农民和牧民们担心的问题也许只是,怎样能培育出更符合人类需要的动物或植物?如果发现了有益于人类的生物性状,怎样保证这样的性状能稳定存在下去为我们所用?一个很经典的例子是达尔文曾经在自己的《物种起源》中讨论过的“安康羊”(见图1-5)。1791年,美国马萨诸塞州的一位牧民偶然在自家的羊圈里发现了一只腿短、跳跃能力极差的小羊。这只小羊立刻被用来繁育更多的后代,因为它的后代根本无法翻过低矮的羊圈,这使得羊群管理变得方便了许多。
当然了,农牧民们还有一些在技术层面上更复杂的目标,例如怎样把不同的优良性状整合起来(当然,这里的“优良”一词仍然仅对人类适用,对于动植物而言就不一定是什么好事了,比如短腿的安康羊和麦穗不会自动脱落的小麦)。以另一种重要的驯化动物家猪为例,脂肪含量比野猪高、体型比野猪小、圈养在一起也从不打架斗殴的家猪是远古农民们梦寐以求之物,而繁育出这样的猪并不容易。农民们经常会发现,试图把几种优良性状集中起来的尝试往往以失败告终,而成功一般只会在漫长的等待和无数次的失败中偶然且随机地出现(见图1-6)。


图1-6 两种家猪杂交的假想结果
将分别携带两种优良性状的猪(“肉”和“乖”)杂交,后代的性状可能有数种完全不同的组合方式。

打个比方吧。假设农民手中现在有了两种还算差强人意的家猪:一种肥肉较多,但脾气暴躁,不易于集中饲养,我们叫它“肉猪”;一种脾气倒是不错,可惜骨瘦如柴,我们叫它“乖猪”。当然,又肉又乖的猪是完美的啦。一个简单的思路就是,选一头公肉猪,一头母乖猪(当然也可以选公乖猪和母肉猪),让它们交配产崽儿。按照泛生子融合理论,后代岂不是应该同时具备来自父母的两种优良属性?然而现实往往是,生出来的小猪有很大概率不会是又肉又乖,反而连原本的“肉/乖”属性也会减弱。更可气的是,可能还会有一些小猪居然整合了两种较差的性状,变得又瘦又暴躁。往往需要反复多次的交配繁殖,农民们才能得到真正整合了两种优良性状的小猪;而往往他们还需要同样长的时间,才能找到把这两种生物性状稳定遗传下去的小猪,真正开始他们繁育“肉 乖”猪的伟大事业。
为什么有的性状能够稳定遗传,而有的出现了一次就消失不见了呢?为什么有的性状看起来黑白分明,有的就会出现各种复杂的数量变化?为了搞清楚遗传的秘密,1854年,一位瘦削的中年神父在奥匈帝国边陲的圣托马斯修道院的后院种下了一批豌豆。他的名字叫格里高利·孟德尔(Gregor Johann Mendel)。
那个时候,我们故事的位主角达尔文早就结束了贝格尔号上的环球旅行(见图1-7)。他从非洲、美洲和太平洋小岛上采集的无数珍奇标本早已让他作为博物学家享誉天下。而旅途中,达尔文曾在厄瓜多尔以西的加拉帕戈斯群岛短暂停留了一个月。在那里,


图1-7 达尔文随贝格尔号的旅行(1831—1836)
达尔文把这次航程称为“次真正的训练或教育”。也正是在环球航行的5年间,达尔文通过观察生物物种的变化,形成了物种进化的观念。在这次旅行中,位于东南太平洋上的加拉帕戈斯群岛具有特别的意义,直到今天仍然是不少进化生物学家开展研究的圣地。

达尔文看到了许多让他困惑不已的现象。一些体型不大、毛色暗淡的小鸟(这些鸟后来以“达尔文地雀”名垂史册)吸引了他的注意。这些地雀分属十几个物种,嘴巴形态不一,有的更圆钝,有的较尖锐,而其他性状都非常接近,这暗示它们有着很近的亲缘关系。所以,达尔文自然而然地设想,这些鸟儿应该有着共同的祖先,在漫长的世代繁衍中逐渐出现了各种遗传变异,影响了鸟嘴的形状,进而进化出了不同的物种。这个现象对于笃信《圣经》教义的达尔文来说是个重大危机,因为按照《圣经》所言,地球上所有物种都是上帝在创造世界的几天里创造的,是一成不变的。《圣经》并没有给地球生物的任何细微变化留出空间,更不要说全新物种的出现了。可能也正是基于这样的观察和思考,让达尔文在结束旅行后的20年里离群索居,直到1859年出版了那本注定要震惊世界的《物种起源》。


图1-8 达尔文(左)和孟德尔(右)
两位生活在同时代的巨人一生中从未谋面。虽然孟德尔肯定了解达尔文的进化论,但达尔文很可能并没有注意到孟德尔的研究。


而作为我们故事的第二位主角,孟德尔神父的目标远没有达尔文那么宏大(见图1-8)。和我们刚刚提及的农牧民一样,他大概仅仅希望从自己的豌豆田里,看看能否发现遗传的秘密——就像我们刚刚说过的,生物的性状究竟是按照什么样的规律遗传下去的,为什么有时稳定,有时不见踪影,有时黑白分明,有时又呈现出黑白之间的各种灰色地带呢?
而这时候,我们马上可以看到孟德尔和达尔文的不同,可能也正是这种不同确保了前者的成功。
孟德尔并没有像达尔文那样,从古希腊哲学中借鉴来“泛生子”的概念,并试图拓展这个概念,用来解释遗传的所有秘密——我们已经知道,这样的做法固然可以自圆其说,但并不能为解释遗传现象提供任何新的线索。毕竟,谈论了上千年之久,达尔文仍然不知道这种肉眼不可见的“泛生子”到底是个什么东西,又有着怎样的特性。
孟德尔的做法几乎完全相反,他抛开了一切预设的学说和假定,单纯从豌豆杂交的现象出发,试图发现隐藏的遗传规律。


图1-9 豌豆花
豌豆开着像蝴蝶翅膀一样的花朵。豌豆是一种典型的自花授粉植物,花瓣密闭,在自然状态下只有自身的雄蕊可以为雌蕊授粉。这可能也是孟德尔挑中豌豆的原因之一。这样一来他可以完全控制授粉过程,不需要担心随风飘散的花粉的干扰。

孟德尔神父首先选择了一些看起来泾渭分明、非常容易确认和定量统计的性状,例如豌豆种子的表皮是光滑的还是褶皱的,种子表皮是黄色还是绿色,豌豆花(见图1-9)的颜色是白色还是紫色,等等。然后选出性状截然不同的一对“父亲”和“母亲”豌豆,把“父亲”花朵的花粉小心翼翼地收集起来,轻轻播撒在“母亲”花朵的雌蕊上,开始了他的杂交试验。
轮试验的结果就足够让人震惊了:在孟德尔挑选的全部七种性状方面——不管是种子表皮的颜色、花朵的颜色还是植物的高度,杂交后代都表现出了高度一致的性状来。比如说,黄豌豆和绿豌豆杂交的后代全部是黄豌豆(见图1-10),紫花豌豆和白花豌豆的后代全部是紫花豌豆,高豌豆和矮豌豆的后代全部是高豌豆。换句话说,在杂交一次之后,来自“父亲”或者“母亲”一方的某种性状就彻底消失了,这似乎已经在挑战人们习以为常的融合遗传理念了:难道孩子不是会从父母那里分别继承一些性状才对吗?难道不是父母的泛生子水乳交融构成了孩子的一切吗?


图1-10 孟德尔的次杂交试验
黄豌豆和绿豌豆杂交的结果是,后代结出的是清一色的黄豌豆。


孟德尔的做法仍然是非常实用主义的。看到这样的结果,他想到的不是去修补看起来出了问题的遗传融合理论,而是做了一个非常技术性的处理:他把杂交后消失的性状称为“隐性”的,而把杂交后仍然顽强显现出来的性状称为“显性”的。
“你看,”孟德尔解释说,“性状只能有一个——种子不可能又黄又绿,而来自父母的遗传性状却有两个。那么我们看到的结果就说明,来自父母的遗传性状如果互相矛盾,则只有一个会胜出——就像黄色的种子、紫色的花朵,以及高高的茎秆,而另一个就会被‘隐藏’起来。很简单,不是吗?”
嗯,确实挺简单。不过,你可能会马上反驳,和泛生子的概念一样,显性和隐性的概念也并没有提供任何新的信息,只不过是把孟德尔看到的现象换了个名词描述一下而已。他看到黄色种子的杂交后代,于是黄色种子就是显性的;他没有看到白色花朵的杂交后代,白色花朵就是隐性的,仅此而已。
如果你仔细想想,就会发现显性、隐性的概念不但能解释孟德尔已经看到的现象,而且还可以给出某些他尚未观察到的现象的预测。
比如,按照这套显/隐性的遗传逻辑,我们马上可以想象,在孟德尔收获的杂交豌豆中,必然同时存在来自父母双方的两套遗传物质,而这两套遗传物质并没有像红色和蓝色墨水一样均匀混合在一起变出非红非蓝的紫色,而是其中显性的一套“压制”了隐性的一套。那么问题就来了,如果我们栽培这样的杂交豌豆,等待它们再次开花,再让它们继续杂交一次,会看到什么现象呢?
简单起见,我们来考虑一下黄色和绿色豌豆杂交的产物。这些长着黄色种子的代杂交豌豆如果自己和自己交配会出现什么情况呢?第二代杂交豌豆又会是什么样子的?它们结出的种子会是黄色还是绿色呢?
孟德尔确实这么做了。第二年,他细心交配了258株结着黄色种子的代杂交豌豆,并在当年收获了超过8000颗新一代(也就是第二代)的豌豆种子。果然如他的显/隐性假说所料,绿色豌豆又重新出现了。这个发现已经毋庸置疑地证明,绿色豌豆这一性状并没有在次杂交中被永久性地稀释和消失。即便在一律呈现黄色的代杂交豌豆中,绿色豌豆的遗传蓝图仍然顽强地存在着。
更有意思的是,在第二代杂交豌豆种子中,孟德尔发现了一个相当有趣的比例关系:6022颗为黄色,2001颗为绿色,比例为3.01∶1(见图1-11)。


图1-11 孟德尔的第二次杂交试验
黄豌豆和绿豌豆杂交产生的黄豌豆后代,继杂交一代之后,后代重新出现了绿色豌豆,黄∶绿比例非常接近3∶1。

这个数字是如此接近3∶1的简单配比,已经很难用巧合来解释了。而且这个比例还出现在孟德尔所关注的全部七种豌豆性状中。不管是豌豆表皮的光滑或褶皱,豌豆花是紫色或白色,豌豆茎秆是高还是矮,每一次试验中,3∶1这个比例都在反复出现。
我相信读者们可能对中学课本里的孟德尔遗传定律仍旧记忆犹新,因此完全能够条件反射般地说出这个3∶1比例关系背后的原因。但是在这里,我倒是建议你们干脆忘记课本上的知识,我们一起来想一想,站在孟德尔神父的立场上,我们该如何试图去理解3∶1背后的规律,甚至进一步通过试验来证明它呢?
首先我们已经知道,绿色豌豆在第二次杂交中重新出现这个事实,已经证明了在豌豆交配和繁殖过程中,来自上一代豌豆的遗传信息并没有被稀释和丢失。记录着“绿色豌豆”的遗传信息仍然顽固存在于黄色的代杂交豌豆的种子里。而孟德尔对此提供的解释是他的显/隐性理论:黄色是显性,绿色是隐性,两者都存在的时候显性压制了隐性。
因此我们马上可以推出,代杂交出现黄色豌豆,必然是黄/绿遗传信息同时存在;而第二代中出现的占比1/4的绿色豌豆,肯定拥有绿/绿遗传信息,因为只有这种组合才会显现出“隐性”的绿色嘛。
好了,黄/绿豌豆和黄/绿豌豆杂交,会出现占比1/4的绿/绿豌豆,以及占比3/4的黄色豌豆。当然了,根据孟德尔的假说,我们目前还不知道这些黄色豌豆究竟是黄/黄还是黄/绿——两种情形下豌豆表皮都会是“显性”的黄色。

代杂交:黄/绿=黄/绿
第二代杂交:黄/绿×黄/绿=3黄/?∶1绿/绿

或者我们可以借用孟德尔的方法,用大小写字母代替显性或隐性的遗传性状(见图1-12):

代杂交:AA(黄色)×aa(绿色)=Aa(黄色)
第二代杂交:Aa(黄色)×Aa(黄色)=3A?(黄色)∶1aa(绿色)


图1-12 两次豌豆杂交试验的遗传学解释
如果我们用A代表黄豌豆性状,a代表绿豌豆性状,那么孟德尔的杂交试验就可以被完美解释。

看到这里,3∶1比例背后的逻辑已经昭然若揭。要在Aa杂交的后代中产生aa,的可能性,是父母双方分别给出一个a类型的遗传信息,从而组合出aa来。可以想象,如果Aa父母能给出a类型的遗传信息,自然也可以给出同等数量的A类型遗传信息。因此,后代遗传信息的组合至少有三种:AA、Aa和aa。三者的比例关系很明显是1∶2∶1。考虑到显性A相对隐性a的“压制”,3∶1的比例关系也就自然而然出现了。
那么有没有办法直接验证这个推理呢?
有,而且并不复杂,把第二次杂交的豌豆继续做第三次杂交就可以了。如果上面的推理正确,我们马上可以推算出,所有的绿色豌豆(aa)杂交的产物必然全部是绿色豌豆(aa),而黄色豌豆杂交的结果就会较为复杂:接近1/3的黄色豌豆(AA)杂交将会产生清一色的黄色豌豆后代(AA),而剩下2/3黄色豌豆(Aa)杂交的后代中,将会再一次浮现3∶1这个简洁的比例关系。
事实上,孟德尔把这样的杂交试验一共进行了五六代。在长达8年的时间里,孟德尔神父照料着上万株豌豆,在豌豆开花的季节小心收集雄蕊的花粉,拨开紧闭的花瓣进行人工授粉,仔细清点收获的种子……每一次,豌豆后代的性状都完美符合这些简单的数字分配规律。
这就是孟德尔杂交试验所揭示的遗传秘密。这秘密并不仅仅关于豌豆,也不仅仅关系到种子表皮的颜色或者褶皱。上述推理的价值,在于说明遗传信息在一代代的传递过程中不存在像液体一样的融合和稀释,而是以某种坚硬的“颗粒”形态存在。每一次生物交配,都意味着遗传信息“颗粒”的重新分离和组合。遗传信息的组合方式可以五花八门,但遗传信息本身却始终顽强存在着,并且随时准备在允许的场合影响生物体的性状。
一个历史的遗憾是,尽管达尔文进化论和孟德尔颗粒遗传理论几乎出现在同一时代——达尔文的《物种起源》和孟德尔的《植物杂交实验》发表相距仅有短短6年,但事实上直到70多年后的20世纪30年代两者才真正被联系在一起。然而我们完全不需要替他们两位感到遗憾。站在科学的高度上,颗粒遗传理论使得詹金的责难不复存在,不管是多么微小的遗传变异,都仍然可以以这种颗粒的形式顽强地存在下去,不被稀释。从某种意义上说,孟德尔为达尔文的学说提供了坚实的物质基础,而达尔文则为孟德尔的发现找到了壮丽的用武之地。两位生活在同时代却缘悭一面的科学巨人,如果在天堂相见,一定会对此无比欣慰。

围猎遗传因子
孟德尔的豌豆杂交试验有一个直白的推论,那就是在父母亲的体内存在许多颗粒状的、携带着父母遗传信息的物质——例如“黄豌豆”遗传物质和“绿豌豆”遗传物质——这些物质会在交配过程中同时进入后代的体内。而在此之后,在这些后代每一次繁衍的时候,都会重复一次分离再组合的过程,孟德尔把这些物质简单称为“遗传因子”。到了20世纪初,孟德尔的遗传因子又被重新命名为“基因”(gene)。“gene”这个单词明显是从泛生子(pangene)简化而来的,反倒是“基因”这个来自中国代遗传学家谈家桢先生的中文翻译颇具神韵。基因基因,不就是携带着遗传信息的“基”本单元的“因”子嘛。
有些读者可能会马上想到,基因分离和组合的过程有点类似于化学反应的过程。比如说,将氢气和氧气混合后点燃,在爆炸声中就产生了水。在此过程中四个氢原子和两个氧原子反应生成两个水分子,化学反应式可以写成下面的样子(见图1-13)。


图1-13 氢气和氧气反应生成水的示意图
在此过程中,氢原子和氧原子发生了连接方式的变化,但是其数目并没有变。

在此过程中,不论是氢原子还是氧原子本身都没有发生什么变化,反应前我们有四个氢原子、两个氧原子,反应之后仍然有同样多的氢原子和氧原子。发生变化的只是这些原子之间连接的方式。
同样,按照颗粒遗传理论,不管在哪一代豌豆体内,也不管豌豆表皮是黄是绿,“黄豌豆”遗传因子和“绿豌豆”遗传因子也都始终如一,发生变化的是它们组合的方式。
就像原子论极大地推动了化学的发展一样,至少在科学意义上,颗粒状的基因要比像液体一样混合的泛生子方便处理得多。从我们对豌豆杂交结果的讨论就能看出来,颗粒状的基因能简单用各种字母代替,而我们甚至难以想象能自由融合的泛生子到底是一种什么东西。
随之而来的问题是,这种颗粒状的基因到底是什么呢?它们当然非常微小——否则也不可能隐藏在豌豆花粉之中随风飘散。既然每一代生物体内都有它的存在,我们是不是可以用某种方法把它提取出来,就像我们从成吨的金矿石中通过破碎、研磨以及化学反应提取出区区几克黄金一样?
进入20世纪,特别是在孟德尔的颗粒遗传理论被重新发现,正式进入人类的主流科学认知之后,一代代聪明的头脑投入到猎取基因颗粒的工作中。
当然了,与淘金相比,猎取基因颗粒要困难得多。我们至少早早就见到了天然存在的纯金的样子,也知道它具备的许多物理化学性质:它的密度很大,超过了大部分矿石;它很难和酸碱发生化学反应;它能溶解在由三份盐酸和一份硝酸配比成的王水里;等等。利用这些信息,我们可以设计出提取纯金的程序,也可以设计出检验终黄金成色的方法。而基因呢?基因长什么样我们可是一无所知啊。
在孟德尔的试验里我们已经知道了基因的一个至关重要的属性,比如“黄豌豆”基因能够让豌豆表皮呈现黄色。那么我们是不是可以这么做——找一堆黄豌豆,切碎磨细,用各种化学方法将其分离成各种各样的物质,然后把每种提取出来的物质再通过某种方法放到一颗绿豌豆里面去。如果这颗绿豌豆从此就能结出黄色的种子,我们是不是就可以反推这种物质就是传说中的“黄豌豆”基因?
这么说下来你们可能会觉得很可笑,这方法听起来一点也不高明,而且也没什么“科学”的影子。基因这么高大上的科学概念,难道不是该有一套更先进、更现代的研究方法吗?传说中的显微镜、离心机、培养皿这些电视上常见的生物研究设备呢?不过仔细想想你就会明白,这几乎是能够帮助我们猎取基因的办法了!因为关于这种被叫作基因的东西,我们知道的就是它存在于生物体内,能够产生某种特别的性状(例如“黄豌豆”基因能够让豌豆长出黄色的表皮)。我们当然必须靠这一点来寻找和理解它。
猎取基因的个重大突破发生于20世纪20年代的英国。为英国政府工作的病理学家弗雷德·格里菲斯(Fred Griffith)试图发明出疫苗来对抗当时肆虐全欧的细菌性肺炎。当时人们已经知道,想要获得对某种传染病的免疫力,一个办法是让人先接触某种较弱的传染源。英国医生爱德华·琴纳(Edward Jenner)正是让孩子们先感染对人危害较小的牛痘病毒,从而让他们获得对致死性的人类天花病毒的免疫力。格里菲斯当然也想重复琴纳的成就。因此,他也试图寻找毒性较弱的肺炎链球菌,人工催生人体对肺炎的免疫力。


图1-14 两种肺炎链球菌
粗糙型(左)和光滑型(右)肺炎链球菌的显微镜照片。

格里菲斯手里有两种从病人那里收集来的肺炎链球菌(见图1-14),一种外表光滑,一种表面粗糙(是不是又让你想到了孟德尔手里表皮光滑或褶皱的豌豆)。前者能够引起肺炎,对实验老鼠来说是致命的,但后者并没有什么毒性。当然我们现在知道,表面光滑的细菌外层包裹着一层多糖外壳。实际上,并不是细菌本身,而是这层多糖外壳引发的剧烈免疫反应杀死了病人和实验动物。
所以自然而然,格里菲斯产生了两个想法:给老鼠注射表面粗糙的细菌,或者注射已经杀死的表面光滑的细菌,这两种“较弱”的刺激是不是能够催生老鼠对抗致命性肺炎的免疫力?
结果让格里菲斯很失望(见图1-15),实验老鼠看起来很健康,这说明这两种刺激确实“较弱”,老鼠也并没有获得什么免疫力。于是他再接再厉,干脆把两种较弱的刺激混合在一起注射给老鼠。也许这样能好一点?与其说格里菲斯的想法是顺理成章,不如说是破罐破摔。


图1-15 格里菲斯的肺炎链球菌转化试验
简单来说,给老鼠注射不能致病的粗糙型细菌(左一),老鼠安然无恙。注射能致病的光滑型细菌(左二),老鼠会死亡。致病性光滑型细菌如果经过热处理(左三),也就失去了致死性。有意思的是,活着的粗糙型细菌在与热灭活的光滑型细菌混合后(左四)重新产生了致死能力,这说明活着的粗糙型细菌从死亡的光滑型细菌那里获取了后者的遗传物质,被“转化”成了后者。

可是混合注射的结果大大出乎了格里菲斯的意料——老鼠居然很快就死掉了,就像它们真的患了肺炎一样!可这肺炎是从何而来的呢?能够致病的光滑型细菌已经彻底煮熟死掉了,活着的粗糙型细菌又明明没有任何致病性。更要命的是,格里菲斯从死亡的老鼠体内,居然发现了活着的光滑型细菌。煮熟的光滑型细菌“菌死不能复生”,那这些活着的光滑型细菌又是从何而来的呢?
看到这里大家大概已经明白了,格里菲斯无意间做的这个混合注射试验,不就是我们刚刚假想过的寻找“黄豌豆”基因试验的翻版吗?已经死掉的光滑型细菌和活着的粗糙型细菌放在一起,能让后者干脆“变成”光滑型细菌,并且杀死可怜的小老鼠。这不就正好说明,细菌表面是光滑还是粗糙,就和豌豆表皮是黄还是绿一样,是由某种基因决定的吗?既然死掉的光滑型细菌能让活着的粗糙型细菌华丽变身(格里菲斯把这种现象叫作“转化”),岂不是说明光滑型细菌基因能够轻松进入粗糙型细菌,并且改变它的遗传性状?更进一步说,如果能够利用这个简单的实验系统,从光滑型细菌里提取出能让粗糙型细菌变身的物质,我们不就能看到基因的真面目吗?
也正是因为这个原因,猎取基因的进展在格里菲斯的偶然发现之后骤然加速了。至少,在这个系统里,科学家需要处理的仅仅是微小的细菌,而不是豌豆这种一年才开一次花的庞然大物。在大洋彼岸的美国纽约洛克菲勒医学研究所,几位科学家的接力赛跑在十几年后终于为我们揭示了基因的真面目。而他们的做法其实就和我们刚刚假想的“黄豌豆”基因分离实验差不多。
在那个时代,人们已经对组成生命的几大类物质——蛋白质、脂肪、碳水化合物及核酸(特别是DNA和RNA)——有所了解了。洛克菲勒医学研究所的奥斯瓦德·西奥多·埃弗里(Osward Theodore Avery Jr.)在将光滑型肺炎链球菌煮沸之后,从中提取了可溶于水的物质(这样就首先去除了不溶于水的脂肪),再利用三氯甲烷将蛋白质去除,之后又利用乙醇沉淀出了某种纤维状的透明物质(见图1-16)。他证明,


图1-16 埃弗里实验
简单来说,埃弗里发现,如果用能够降解RNA分子的RNA酶或者能够降解蛋白质分子的蛋白酶处理光滑型肺炎链球菌,就不会影响其将粗糙型细菌转化成光滑型细菌的能力。如果消化掉DNA分子则会破坏这种转化能力。因此,具备转化能力的遗传物质就是DNA。

这种纤维状物质能够将粗糙型的肺炎链球菌成功转化为光滑型。也就是说,光滑型细菌的基因就是这种纤维。
埃弗里有足够的信心认定这种纤维分子就是已知的化学分子DNA。他首先证明,这种纤维状分子的化学组成和人们熟知的DNA别无二致,都含有一定比例的碳原子、氢原子、氮原子和磷原子。更重要的是,他发现一种能特异性消化DNA分子的酶,能够破坏掉纤维的转化能力,如果用能消化蛋白质或者RNA分子的酶来处理,则不会对这种转化能力产生任何影响。
因此,在孟德尔提出颗粒遗传理论近百年后,我们终于开始对遗传因子颗粒的物质属性有了了解。解释遗传真相,我们再也不需要泛生子这样的抽象理论了。遗传信息的载体是一种叫作DNA的化学物质!它携带着来自父亲和母亲的遗传信息进入后代的机体中,作为生命蓝图决定了后代丰富多彩的性状(从豌豆表皮的颜色到肺炎链球菌的外壳)。
当然,我们这么说有点事后诸葛亮的乐观主义。实际上,在20世纪40年代,尽管埃弗里的实验很快得到了同行的重复验证,但大家对于DNA就是遗传物质这件事还是有点将信将疑。
甚至对于埃弗里实验程度的接受——DNA至少在遗传过程中起着很重要的作用——都不是很普遍。同行们质疑的原因倒是也很直白:埃弗里实验有一个逻辑上无法克服的缺陷,他是依靠化学提取从光滑型细菌中得到纤维状DNA分子的。尽管从技术上说,他可以尽量优化提取过程,保证提取出来的DNA纯而又纯,不包含任何杂质(埃弗里和同事也证明了这一点),但是从逻辑上说,反对者总是可以质疑也许埃弗里提取出的DNA携带了极其微量的、现有技术无法检测出来的蛋白质。因此,质疑者总是可以说,是这些蛋白质“杂质”传递了遗传信息。DNA只不过是碰巧在那里出现,却因为数量巨大、长相又抓人眼球,才窃取了遗传因子的美名。
想要严格排除微量蛋白质杂质的干扰,光靠实验技术的改进是不可能的——不管埃弗里将蛋白质去除得多么干净,反对者都可以用同一个逻辑来反问:“你怎么知道里面不存在现有技术检测不出来的微量蛋白质?”想要真正彻底排除蛋白质的干扰,我们需要换一个方法来思考问题。
当然,必须得说埃弗里实验已经让一部分人先明白起来了。他们突然意识到,DNA分子是遗传物质这件事,虽然听起来像是天方夜谭,但似乎并不是没有蛛丝马迹可循。早在此前40年,人们就已经知道生物体的细胞中隐藏着一种能被碱性染料染成深色的丝状物质,也就是我们今天熟悉的染色体。在动物产生生殖细胞的时候,这些细丝会小心翼翼地平均分配到两个后代细胞中去(见图1-17)。而当两个生殖细胞——精子和卵子——融合,开始发育时,两个生殖细胞中的这种丝状物质又会很有默契地配对到一起。


图1-17 细胞分裂的过程
在一次细胞分裂的过程中,深色的染色体分散到细胞的两端,细胞从中断裂,一分为二,染色体也随之进入到两个后代细胞当中。染色体的移动规律和孟德尔杂交试验中遗传因子的行为看起来很相似。


这个过程听起来是不是和孟德尔对遗传因子的猜测有点像?染色体的分离对应着父母遗传信息的分离,而精子和卵子内的染色体的重新配对又对应着后代体内遗传信息的重新组合。因此,当时就有人猜测,基因其实就定位在染色体上。继孟德尔之后伟大的遗传学家,托马斯·亨特·摩尔根(Thomas Hunt Morgan)进一步发展了这个猜测,他利用果蝇证明了基因,比如决定果蝇的眼睛颜色是红还是白的“白色”基因,就定位在果蝇性染色体的某个特定位置上。
而关于染色体的化学组成人们是很清楚的,就是DNA和蛋白质。
DNA这种物质连续两次出现已经不太像是巧合了。难道说,埃弗里实验的结论是正确的,DNA真的就是遗传物质?
距此约10年后的1952年,两位美国科学家,艾尔弗雷德·赫尔希(Alfred Hershey)和他的助手玛莎·蔡斯(Martha Chase)用完全不同的思路重新证明了DNA就是遗传物质(见图1-18)。为了避免蛋白质的干扰,他们走了一条和埃弗里完全不同的路,非常巧妙地利用了基因的另一个特性——世代间的传递。


图1-18 赫尔希-蔡斯实验
这个设计精巧的实验旨在追踪到底是蛋白质还是DNA进入了病毒后代体内。为此,赫尔希和蔡斯用放射性同位素分别标记了病毒的蛋白质外壳(上,外壳)或内部的DNA分子(下,内部曲线),再用这些病毒感染细菌,繁殖后代。随后,他们在后代病毒体内检测放射性信号的强弱,终发现当标记蛋白质外壳时后代放射性信号较弱(上),而标记DNA分子时放射性较强(下)。



我们已经知道,遗传因子的一大特性是能够影响后代的各种性状,比如豌豆表皮是黄色还是绿色,以及肺炎链球菌表面是光滑还是粗糙。埃弗里正是利用了这一点,首先证明了DNA就是这种遗传因子。我们稍微思考一下就会发现,遗传因子的这个特性需要一个前提条件,就是它必须能够有效地从父母那里传递给子女,再由子女传递给孙辈,世世代代传递下去。它就像一张蓝图,一个标签,一个设计师,决定了后代豌豆和后代肺炎链球菌的性状。反过来说,如果一种物质压根不能在世代之间传递,那它当然就不可能是遗传因子。赫尔希和蔡斯就是利用这一点,证明了是DNA而非蛋白质才能够在世代之间传递,因此,我们也就根本没有必要担心埃弗里实验中大家假想出来的所谓蛋白质杂质的污染了。
他们的实验用到了一种比细菌还要微小的生物——噬菌体,这是一种依靠入侵细菌为生的病毒颗粒。人们当时已经知道,DNA的化学组成中含有磷元素而没有硫元素,蛋白质则恰好相反。因此赫尔希和蔡斯利用了这点微小的差别,用两种不同的放射性同位素——磷-32和硫-35——分别标记了噬菌体的DNA和蛋白质。当这种病毒入侵细菌,疯狂复制繁衍时,遗传因子就会进入它们后代的体内。可以想象,如果病毒后代带有磷-32的放射信号,那么DNA就更像遗传物质;反过来,如果病毒颗粒带有硫-35的放射信号,那么蛋白质才更有资格做遗传物质的候选。赫尔希和蔡斯的实验结果表明,病毒后代体内磷-32的放射性要显著地超过硫-35。换句话说,相比众望所归的蛋白质,DNA才更像那个能够在病毒世代之间传递遗传信息的分子。DNA就是遗传物质,我们苦苦寻觅的基因,一定是以DNA分子形式存在的。

双螺旋
豌豆杂交提示了遗传因子颗粒,肺炎链球菌和噬菌体的研究证明了DNA就是遗传物质。遗传的秘密是不是就此大白于天下了呢?
并没有。不仅如此,甚至可以讽刺地说,DNA是遗传物质这件事,反而使得遗传的秘密更令人困惑不解了。对于遗传性状在世代之间传递这件事来说,终极的问题不是遗传因子是什么物质——当然找到这种物质,理论上应该能帮我们解决终的问题——而是遗传因子是怎样记录遗传性状的信息的,比如豌豆表皮应该是黄色的,或者肺炎链球菌的表面必须是光滑的。
打个比方大家会更容易理解这个问题。假设我们手里有一份报纸,是用一种我们不懂的外国语言出版的。我们想知道这份报纸的头条社论在说些什么,光靠分析报纸的大小、密度、纸张的化学元素构成、油墨的配方和印刷方法,是不会有什么决定性作用的。我们真正需要的是解读这种陌生语言的词典,只有它能够帮助我们理解文章里每个单词、每句话的含义。
确定了DNA就是遗传物质,就像我们手上终于拿到了这份报纸。但是对“黄色豌豆”“光滑型细菌”这样的信息是如何写在DNA上的,我们仍然一无所知。更要命的是,在当时人们的视野里,DNA可能是不适合用来做信息载体的物质了。
为什么呢?当时人们已经知道,DNA分子由四种较为简单的脱氧核糖核苷酸分子组成(见图1-19)。这四种分子上分别带有一个名为碱基的标签,因此,


图1-19 DNA长链示意图
一小段由四种核苷酸单体分子(以A、T、C、G为代表)首尾相连串起来的DNA分子。


图1-20 组成DNA的四种碱基分子
DNA的一个很重要的特性是,这四种分子之间可以通过氢原子间的相互作用配对,A和T配对,C和G配对。这个特性我们还会反复提到。

人们很多时候干脆就用这四种标签的名字来指代它们(见图1-20):分别是腺嘌呤(Adenine,A)、胸腺嘧啶(Thymine,T)、鸟嘌呤(Guanine,G)和胞嘧啶(Cytosine,C)。纯净的DNA分子之所以会呈现细长的纤维形态,正是因为这四种核苷酸分子首尾相连形成了超长链条,就像一个个金属圈嵌套形成的铁链。当时甚至有一种观点(尽管未经证实)认为,就连四种金属圈嵌套的先后顺序都是完全一样的,这样的一根铁链不管延伸多长、套多少个金属圈,能携带的信息量都少得可怜,更别说记录像豌豆表皮颜色和细菌表面形态这么具体的信息了。
在这里顺便插句话,为什么埃弗里的DNA提纯实验自1944年发表之后,很长时间里都没有被同行接受?我们说过,同行们质疑的首要原因是技术性的:埃弗里没有能力保证DNA样品没有受蛋白质杂质的污染,也许就是那一点点蛋白质才是遗传信息的载体呢!但是在内心深处,大家很可能在感情上和逻辑上压根就难以接受DNA是遗传物质这个声明,因为这样会马上把遗传学家置于非常尴尬的境地——他们实在是无法想象如此单调的DNA长链,怎么可能是用来记载和传递复杂的遗传信息的。
不过,1952年赫尔希和蔡斯的噬菌体实验逼得遗传学家们不得不正视房子里的大象了。好了,DNA就是遗传物质,被大象逼到墙角的遗传学家们需要马上想出办法,解释遗传信息是怎么写在这根无聊的DNA长链里的。
伟大的夏洛克·福尔摩斯曾说过,当你已经排除了其他所有的可能性,不管看起来有多么不可能,剩下的那个就必须是真相(语出柯南·道尔的《斑点带子案》)。仅仅一年以后,1953年,DNA双螺旋模型横空出世。遗传信息的记录和传递方式从此大白于天下。四位科学家,詹姆斯·沃森(James D. Watson)、弗朗西斯·克里克(Francis Crick)、莫里斯·威尔金斯(Maurice Wilkins)和罗莎琳德·富兰克林(Rosalind Franklin)也因此名扬四海(见图1-21)。


图1-21 发现DNA双螺旋结构四人组
其中,富兰克林病逝于1958年,其余三人在1962年共享了诺贝尔生理学或医学奖。

今天,作为象征人类智慧的代表作品,大大小小的DNA双螺旋模型矗立在地球上的各个学校、科技馆和公园。读者们应该也或多或少了解一些那段激动人心的科学历史。但是不知道大家有没有想过,为什么DNA双螺旋会被认为是现代生物学的开端?故事看到现在我们已经明白,在1953年,通过埃弗里实验和赫尔希-蔡斯实验,我们已经确信DNA就是遗传物质。那么它究竟是一条长链还是两条,是优美的螺旋形还是一团乱麻,有那么重要吗?
有,还真就是这么重要(请原谅我的故弄玄虚)。围绕DNA双螺旋的发现,生物学历史上的英雄人物们悉数登场。在继相对论和量子力学刷新了人类的时空观和物质观之后,璀璨群星再一次照亮了人类世界隐秘的角落。
在故事的一开始,被大象逼到墙角的生物学家们不得不首先抛弃原来那个很有说服力、但从未得到证实的理论。他们不得不先假定,构成DNA链条的四种碱基分子可能并不是以一种固定不变的排列顺序串联起来的。只有这样,DNA长链上才可能出现五花八门的碱基排列顺序,而这些序列本身是可以携带遗传信息的。
这一点不难理解。比如,如果构成DNA的四种碱基分子,每一种都能决定一种遗传性状,比如A代表“黄豌豆”,T代表“褶皱豌豆”,C代表“紫色豌豆花”,G代表“高茎豌豆”,那么它们携带的信息无疑是特别有限的——就连孟德尔曾经研究过的区区七种性状都代表不完。如果两个碱基组合可以用来编码一种信息,那信息量一下子就从4种增加到了42种(AA、AT、AG、AC、CA、CT、CG、CC、TA、TT、TG、TC、GA、GT、GG、GC)。那么三个碱基的组合呢(那就是43种)?四个碱基的组合呢


图1-22 DNA双螺旋的X射线衍射图
这张照片由英年早逝的女科学家罗莎琳德·富兰克林拍摄。


(那就是44种)?一万个碱基的组合呢(那就是410000种)?不管实际情况如何,这么想来,DNA携带和传递遗传信息的能力至少在理论上是没有问题了。
那么实际情况如何呢?DNA双螺旋又能如何帮助我们理解遗传呢?晶体学家威尔金斯和富兰克林获得了DNA晶体的X射线衍射图谱(见图1-22)。根据这种射线穿透DNA晶体后在胶片上留下的黑色印记,沃森和克里克用硬纸板和铁丝手工制作搭建出了相互缠绕的DNA双螺旋模型(见图1-23)。更重要的是,


图1-23 沃森(左)和克里克(右)
他们在讨论他们用硬纸板和铁丝搭起来的DNA双螺旋模型。

他们敏锐地借鉴了生物化学家埃尔文·查加夫(Erwin Chargaff)的发现,意识到两条缠绕在一起的DNA长链应该遵循着非常朴素的配对规则。一条链上的A碱基总是需要和另一条链上的T碱基配对,而C碱基则一定要和G碱基配对,它们就像中式衬衫的纽扣结一样结合在一起,构成了稳定的双螺旋结构。而这
一点也就意味着,从任意一条DNA长链的碱基序列出发(如A-T-C-C-G-C),可以完美预测出双螺旋中另一条DNA长链的碱基序列(G-C-G-G-A-T,两条链是以相反的顺序配对的)——两条链所携带的信息是完全等同的。
既然如此,遗传信息的代际传递至少从逻辑上就变得非常简单了。当一个小小的肺炎链球菌需要一分为二,产生两个体型较小的后代时,它的DNA双螺旋只需要从中分开,公平地为两个后代各自分配一条单链就可以了。当然了,后代的这条单链DNA总还是要变成双螺旋形状,才好继续下一次分裂和繁衍后代的过程(见图1-24)。这个过程并不难理解,只需要想象有一个微小的分子机器,能够根据这条单链的碱基序列(如A-T-C-C-G-C)和朴素的配对规则(A和T,C和G)工作,新的G-C-G-G-A-T链就能形成,DNA双螺旋也就可以重新产生了。这个过程不涉及任何新信息的输入,图纸已经就绪,搬砖砌瓦的工作虽然烦琐,但还在生物学家可以理解的范围内。


图1-24 DNA半保留复制模型
简单来说,在DNA复制时,原有的DNA双螺旋会一分为二(①),分别按照碱基配对原则,为两条单链匹配上新的碱基分子(②),终形成两条独立的DNA双螺旋,每一条都是新旧参半(③混合)。

几乎是在一瞬间,人们就已经相信这就是遗传信息的传递法则。这套模型简直太简洁、太优美了。
有位科学家是这样评价科学发现和科学家同行的:看到一个科学发现,科学家们的反应一般只有两种,一种是“这有什么了不起”,另一种则是“我为什么没想到”。DNA双螺旋在科学界引发的反应毫无疑问是后者。作为公认的DNA双螺旋模型的创立者,詹姆斯·沃森和弗朗西斯·克里克在1953年发表的论文其实非常简短,简短到没有任何实际的实验数据,仅仅展示了一个他们猜测的DNA呈双螺旋缠绕的模型。DNA双螺旋的意义是如此简洁和清晰,在看到这篇论文的时候,世界上一定有数不清的聪明脑袋在懊悔地大喊:“我为什么没想到!”很快,这个优美的模型也获得了实实在在的证据支撑。
证据来自1958年,距沃森和克里克发表他们的双螺旋模型之后仅仅五年。马修·梅塞尔森(Matthew Meselson)和富兰克林·斯塔尔(Franklin Stahl)证明了双螺旋模型所揭示的DNA复制过程。在很多人眼里,梅塞尔森-斯塔尔实验可能是整个生物学历漂亮的实验了。因此,在我们的故事里,它也理应获得一席之地。
让我们回头再审视一下双螺旋模型,看看它所提示的DNA自我复制和遗传信息传递的过程。两条相互缠绕的DNA长链首先解离螺旋,鉴于两者都忠实遵循着A-T和G-C的碱基配对规则,所以,它们所携带的信息是完全等同的。这样一来,只要存在某种分子机器,能够为分解开的两条单链再次匹配相应的碱基,就能够实现从一个DNA双螺旋到完全相同的两个DNA双螺旋的复制变化。在这种变化中,原本的两条DNA链被平均分配到两个后代中,两条新生的DNA链随之加入它们。因此,在后代的DNA双螺旋中,一半DNA保留自上一代,另一半则产生于子代自身。沃森把这种过程形象地称为“半保留”复制。
可是我们怎么证明这一点呢?DNA为什么必须采用这种半新半旧的复制方式?我们同样也可以想象一种分子机器,能够根据DNA双螺旋的碱基顺序,直接制造出一个新的、完全一样的双螺旋来。甚至,为什么DNA一定要整条长链同时参与复制?难道不能首先把它断成一截一截再进行复制,之后再拼装起来吗?
你们可能已经看出来了,区分这三种可能性的核心在于,子代的DNA里面有多少成分是来自上一代。半保留模型预测,子代的DNA恰好有一半来自上一代,不多不少;全复制模型则预测子代的DNA全部是新生的,没有一点上一代的痕迹(尽管它们携带的信息是完全一致的);而在“碎片化复制”模型里,子代和上一代的DNA由于频繁的断裂和拼接已经水乳交融,根本区分不开了。那么,想要通过实验验证DNA复制和遗传信息传递的法则,核心当然就是,如何才能知道DNA分子是来自上一代还是由子代新生的呢?
借鉴了赫尔希-蔡斯实验的巧妙设计,梅塞尔森和斯塔尔也同样想到了用同位素标记DNA的方法,只不过他们这次利用的不是放射性,而是同位素原子之间的重量差异。他们首先把细菌在含有氮-15同位素的培养基上持续培养。我们已经知道,DNA分子中含有氮原子,因此,在经过许多代培养后,我们有理由相信细菌DNA分子的全部氮原子都已经被替换成了较为不常见的氮-15。在此之后,他们再把细菌转移到含有在自然界中常见的氮-14同位素的培养基上。从这个时间点开始,DNA复制将只能使用氮-14同位素。换句话说,任何新生的DNA分子和原本存在的DNA分子因为利用了不同的氮同位素,将会在密度上带有细微的差别。这些细微的差别就可以告诉我们,细菌子代的DNA到底从何而来。
在不同的时间点上,梅塞尔森和斯塔尔从一部分细菌中提取DNA分子,然后利用超高速离心的方法判断它们的密度。他们收获的代细菌DNA分子的密度,已经偏离了上一代DNA分子的密度,而且其密度恰好介于纯的氮-15DNA和氮-14DNA之间。随着分裂次数的增加,细菌DNA分子的密度继续降低,越来越多地出现在了氮-14DNA的密度区间。对这个结果的解释就是半保留复制模型——每一次的分裂繁衍中,子代细菌获得的都是由一条上一代DNA和一条新生DNA缠绕而成的双螺旋链(见图1-25)。


图1-25 梅塞尔森-斯塔尔实验
简单来说,饲养在氮-15条件下的大肠杆菌DNA较“重”,饲养在氮-14条件下则较“轻”,这点微弱的重量差别可以在高速离心中体现出来。而当饲养在氮-15条件下的细菌转移到氮-14条件下后,细菌次分裂繁殖产生的后代中,DNA的重量恰好介于两者之间,这说明这条新生DNA双螺旋是新旧参半的。

就这样,在百年间,孟德尔实验、埃弗里实验、赫尔希-蔡斯实验、DNA双螺旋以及梅塞尔森-斯塔尔实验,分别从几个方向上共同完成了对遗传因子的解密过程。终在猎人的捕兽网中剩下的,就是长得像一条长纤维的DNA双螺旋分子。DNA长链上紧密排列的碱基,用某种晦涩难懂的语言记录着生命的蓝图。在每一次生命的繁衍过程中,两条DNA长链都会解离螺旋构型各自为营,遗传信息就是这样代代相传、永不湮灭的。
从此,花朵像蝴蝶翅膀一样漂亮的豌豆、危险致命的肺炎链球菌、需要动用强大的电子显微镜才得以一窥真容的噬菌体、每过20分钟就能一分为二繁衍生息的大肠杆菌,把它们的形象留在了一代代学生的生物学课本上。经过科学家上百年的孜孜求索,地球生物世代遗传的奥秘,从一类模糊的日常观察、一段神秘的哲学理论,变成了一种具体的化学物质、一个精妙的生物繁衍过程。这种物质从化学组成上说可谓平淡无奇——氢、氧、碳、氮、磷,都是这个星球上常见的化学元素,但在亿万年流淌的地球生命河道里,DNA就是源源不断的水流。它就像很多家族世代珍藏的族谱,将先辈们的特征和记忆代代流传,成就了子子孙孙与生俱来的骄傲和荣光。

中心法则
我们的故事还没讲完。
“好了,我相信DNA分子确实就是遗传物质了,”你也许会说,“它的碱基顺序能够记录信息。它的半保留复制能够保证这些信息被完美复制和传递,甚至它的螺旋结构都是那么优美动人。可是这些到底和遗传有什么关系呢?讲了这么久,我还是不知道为什么‘种瓜得瓜,种豆得豆’,还是不知道黄色豌豆和绿色豌豆的区别,不知道为什么孩子总是长得像爸爸妈妈呀?”
这个疑问的核心其实是,遗传信息到底是以什么形式写进DNA的,或者反过来说,DNA上携带的信息是怎样决定生物性状的?就像我们刚刚举过的例子,如果把DNA看成用一种外国语言出版的报纸,报纸上的文章究竟该怎么读,又说明了什么事情呢?
还是拿孟德尔的豌豆来举例吧,我们现在已经知道,必须有一种“黄豌豆”基因能够决定豌豆的表皮颜色,而且这个基因就在DNA分子长链上。甚至我们都可以设计些简单的方法,准确地把它给找出来。但是一段由四种简单的碱基分子组装成的长链,怎么就能够决定豌豆的表皮颜色呢?
这个环节的主角,正是刚刚被遗传学家抛弃的分子——蛋白质。
从某种程度上来说,蛋白质就像是更加复杂的DNA。和DNA的组成方式类似,地球生物中的蛋白质分子是由20种氨基酸小分子首尾相连形成的长链——当然复杂程度明显要高得多。大多数地球生物的DNA分子总是呈现双螺旋的简洁结构,而蛋白质分子的三维结构则变化多端、复杂莫测。插句话,其实这也是为什么在埃弗里实验之后,很多生物学家拒绝相信DNA是遗传物质的原因——他们下意识觉得更加复杂和多样的蛋白质分子才是遗传物质。而人们对蛋白质的认识历史也要远远早于DNA。


图1-26 蛋白质(ATP合成酶)的三维结构

早在20世纪初人们就已经知道,生命体中存在着许多能加速各种化学反应的催化物质,而这些物质就是蛋白质(图1-26是一个非常复杂的蛋白质三维结构)。就在沃森和克里克看着DNA分子的X射线衍射图谱,用硬纸板和铁丝搭建双螺旋模型的时候,他们的同事马克斯·佩鲁茨(Max Perutz)和约翰·肯德鲁(John Kendrew)也在试图用同样的方法分析蛋白质分子的三维结构。他们的成功来得更晚一些,到了1959年,他们才成功获得了血红蛋白——血液中负责运输氧气的蛋白——的三维结构,而这也充分说明了蛋白质的高度复杂性。因此,在遗传的秘密终于得到解答以后,人们有理由做出这样的假设,即生命体的各种性状是由各种各样的蛋白质分子实现决定的。
不难想象,也许有一种蛋白质分子能够合成黄色色素,所以会让豌豆种子长出黄色的表皮;也许有一种蛋白质分子能够制造厚厚的多糖,从而让肺炎链球菌具备光滑的外壳——这一类有着几乎无穷无尽的组合(可以心算一下,一个由20个氨基酸组成的蛋白质就可以有2020种可能),有着复杂空间结构的大分子,给人们留足了想象的空间。
于是我们的问题就变成了:构成方式较为单调、结构也很简洁的DNA分子,是怎样指导生命体生产出各种各样的蛋白质,从而决定生命性状的?
说起来有点惊人,对这个问题初的回答居然不是在实验室里,而是在演算纸上完成的,这一点对于生物学这门绝大多数时候仍然依赖经验的科学来说非比寻常。大爆炸理论的发明者、物理学家乔治·伽莫夫(George Gamow)对DNA双螺旋也非常着迷,他试图用物理学家的思维方式帮助解决从基因到蛋白质的难题——这可能部分解释了为什么我们是从纸上而不是试管里得到问题的答案的。
在和克里克的通信中,伽莫夫推测,DNA如果能够指导蛋白质的准确合成,就意味着四种碱基A、T、C、G的排列顺序必须能够指导20种氨基酸的排列顺序。就像我们在故事里提到的,一个简单的思路就是,数个碱基的序列共同决定一个氨基酸。如果是两个碱基分子构成一个氨基酸“密码”,那么仅有的42(16)种组合不足以代表全部的氨基酸;如果是三个碱基形成一个氨基酸“密码”的话,那么43(64)种组合,仅仅比氨基酸数量略高;如果是四个碱基形成一个氨基酸“密码”的话,那么44(256)种组合似乎就太过浪费了(见图1-27)。因此,伽莫夫推测,DNA指导蛋白质合成的基本原则是相邻三个碱基的序列形成一个独特的密码子,用来指代一种独一无二的氨基酸。


图1-27 伽莫夫推理
根据伽莫夫的推理,三个碱基构成的密码子既能够覆盖所有的20种氨基酸,又不会太浪费。


我们现在知道,伽莫夫的简单推理精确得不可思议,所有地球上的生命都使用了三碱基密码子来指导氨基酸的装配序列和蛋白质的生产。这其实也是对生命进化之美的一次绝妙展示,在无数种可能的编码机制中,生命恰恰选择了足够多样而又非常节约的一种编码方式。
而解密密码子的实验也同样精巧美妙。如果三个相邻的碱基顺序能够决定蛋白质分子中一个氨基酸的身份,那么我们就可以用一串人工合成的DNA序列,生产出任何一种我们想要的蛋白质分子来。1961年,马歇尔·尼伦伯格(Marshall Nirenberg)证明,一长串人工合成的尿嘧啶核酸序列,会指导生产出一个由一串苯丙氨酸相连而成的蛋白质分子。(要说明一下的是,尼伦伯格实验中实际使用的是RNA而非DNA。RNA中的尿嘧啶对应的是DNA中的胸腺嘧啶。)随后尼伦伯格和他的同事们又相继证明,一长串腺嘌呤对应的是全部由赖氨酸组成的蛋白质,一长串鸟嘌呤则是脯氨酸。碱基序列和氨基酸序列的对应关系得到了初次证明(见图1-28)。



图1-28 尼伦伯格-霍拉纳实验证明了3碱基密码子假说



当然,严格说起来,尼伦伯格实验只能证明DNA序列对应氨基酸序列,还不能证明到底是几个碱基对应一个氨基酸。而在此后不久,哈尔·霍拉纳(Har Khorana)又利用更复杂的长链核酸序列,证明了只能是3碱基序列对应一个氨基酸(见图1-28)。在接下来的几年里,许多研究机构之间的白热化竞争终解密了3碱基密码子全部64种组合所携带的信息。终我们知道了,大多数氨基酸都对应着两到三种密码子,与此同时,还有三种密码子不负责编码任何氨基酸。它们作为终止信号,竖立在基因DNA序列的尽头,标志着氨基酸装配工作的完成。
好了,说到这里,我们大概可以再回头说说孟德尔神父的豌豆了。
我们现在已经知道,组成DNA分子的碱基排列顺序能够决定氨基酸的特定排列顺序,从而指导蛋白质的合成。那么想象豌豆里有这么一个“黄豌豆”基因就没有那么困难了。我们完全可以想象,豌豆里会有一种蛋白质,它的功能是帮助豌豆表皮生产一种黄色色素,从而把豌豆表皮变成淡黄色。而这种生产色素的蛋白质中氨基酸的排列顺序,都被一丝不苟地以三个碱基对应一个氨基酸的形式写在豌豆的DNA里。这段“黄豌豆”基因会随着豌豆的交配过程进入子孙后代的体内,再随着子孙后代的生长,不断地一分为二,二分为四,四分为八,进入每一个豌豆细胞的内部,从而让这些后代结出的千千万万颗豌豆都变成黄色。考虑到不管是豌豆还是人类,细胞内蕴藏的DNA分子都是由数十亿碱基所组成的,而与此同时,蛋白质一般是由数十个至数千个氨基酸构成的——这个数字乘以3就是编码所需的碱基长度。也就是说,复杂生物的遗传物质足以编码数以万计的蛋白质分子。这个庞大的数字,也就是丰富多彩的生物性状的物质基础。

DNA是遗传信息的载体。
遗传信息的小单位——基因,以碱基序列的形式存在于细长的DNA分子上。
DNA分子通过一轮又一轮的半保留复制,将遗传信息忠实地传递给了每一个后代。
基因通过3碱基对应一个氨基酸的形式,决定了氨基酸的装配序列和蛋白质的生产。
蛋白质催化了生物体内各种各样的化学反应,从而让生物体呈现出丰富多样的性状。

这,可能就是遗传的秘密。
当然,在我们今天的生物学认知里,遗传的秘密比这几条简单的原则要复杂得多。从某种程度上说,今天的地球生命正是在此基础上叠床架屋,增加了许多层次的复杂度,来保证对遗传信息的精确传递,以及对生物性状的复杂控制。
比如说,我们现在知道,大多数复杂生物的DNA并不是单纯用来编码RNA和蛋白质的。人类的基因组DNA中有多达90%的碱基序列并不用来制造任何蛋白质。单纯从蛋白质生产的角度而言,人类的基因组里充满了“垃圾”,效率惊人得低下。但是这些看似无用的“垃圾”DNA为遗传的秘密提供了新的复杂度。我们已经知道,很多不直接参与蛋白质制造的DNA能够通过各种方式参与到蛋白质合成的调节中去,是它们保证了生物可以在合适的时间和地点生产出合适数量的蛋白质分子。
再比如说,早在双螺旋模型刚刚诞生的时候,克里克就已经预言,DNA并不会直接指导蛋白质的合成,而必须借助一个中间桥梁——RNA。DNA首先要根据碱基互补的原则,以自己为模板制造一条RNA长链;然后RNA再根据3碱基对应一个氨基酸的原则制造蛋白质。这个假说之后也被证明了,DNARNA蛋白质的遗传信息流动规律,被冠以了“中心法则”的鼎鼎大名(见图1-29),站在了全部生物学发现的。RNA为遗传的秘密提供了又一层新的复杂度。因为RNA的存在,蛋白质生产的时空调节可以通过RNA来进行。比如我们可以想象,如果细胞大量合成某个特定的RNA分子,就可以极大地促进其对应的蛋白质分子的生产。


图1-29 中心法则
根据中心法则,遗传信息存储在DNA分子中,通过RNA介导,指导了蛋白质的合成,从而决定了生物体的各种性状。

还比如说,我们今天也知道,蛋白质分子自身的结构和功能也能够被精密地调控。许多蛋白质分子需要特定氨基酸位置上发生化学修饰——例如磷酸化、甲基化、乙酰化等——才能够发挥特定的功能。与此同时,我们也知道了生物体内的蛋白质分子并非永生不死,它们也有自己的生命周期,有诞生和独立存活,也有死亡和降解。正因为此,遗传的秘密可谓非常复杂。
如果抛开这些所有的复杂调节,DNA蛋白质的核心原则,始终存在于地球上的每个生命体内。
这个原则细细想来可谓意味深长。
对于地球生命而言,这无疑是传递遗传信息简洁高效的办法。我们可以把一个活的生物体看成许许多多化学物质在三维空间里的时空分布——对于人体而言,这意味着差不多有近1023个原子,在以纳米为空间精度、微秒为时间精度的约束下完成排列组合。其中蕴含的信息量远远超过人类文明的理解范围。即便在遥远的将来,它对于人类文明来说也可能是永久的秘密。所有这些时空组合的源头,却不过是区区30亿个碱基对组成的DNA长链。在DNA长链上,遗传信息以碱基组合变化的方法存储,呈简单的一维线性排列,而且精确到在世代传递中几乎不发生任何错误。可想而知,在生物世代繁衍的过程中,想要准确复制一条DNA分子的难度——就像我们刚刚讲过的那样——要远远低于临摹先辈三维空间里的全部生物性状。而DNA复制和传递过程中出现的偶然错误——概率大约是1/109,反过来也可以赋予生物体足够的多样性,为达尔文的进化论提供基础,让地球生命在严酷多变的地球环境中熬过自然选择的洗礼。
而对于渴望理解生命、理解人类自身的我们而言,DNA为我们的探寻提供了方便的入口。对于刚刚走进生命大厦的一楼大厅却渴望探索大厦里每一处神秘角落的我们而言,DNA就像建筑师的蓝图,为我们提供了可靠的指南。人类遗传学手段帮助我们理解了许多人类基因的功能。简单来说,当我们发现某个疾病患者体内存在某个基因的功能缺失,我们就可以将这个基因与这种疾病联系在一起。类似的例子包括先天性色觉障碍、白化病、血友病,以及更为复杂的某些癌症和代谢疾病。反过来,我们马上也可以想象,如果有一天我们期望能够改造人类本身,消灭某些顽疾,甚至是增强某些机能,直接在人类的基因组上下手将是快捷和高效的做法。
路漫漫其修远兮。
在过去的亿万年里,是遗传规律促成了地球生命的开枝散叶,并呈现出了五彩斑斓的模样。基因就像亿万年间从未止息的河流,把地球生命带向一个又一个新的港湾。
在过去的一万年间,对遗传现象的认识和利用催生了农业社会的到来,人类这种不起眼的灵长类生物也正是基于此建立起辉煌的文明大厦,开始了认识自身、认识世界、认识宇宙的漫漫征程。
而在过去的一两百年中,我们才真正开始理解遗传的秘密,理解在一代代生命的繁衍中,是什么样的规律主宰了遗传信息的流动,这些信息又如何塑造了每个独一无二的生物体。我们甚至已经开始利用这些规律来改造地球生物,甚至改造我们自己。
在即将到来的未来,遗传的秘密又将把我们带往何处?人类有一天会不会操起上帝的手术刀,主动修改自身的遗传信息,就像在河流上建坝修堤,让生命的河流顺着我们自己的意愿流淌?






04 编程时代//




04
编程时代


 开源破牢笼
 “神话”蛋白
 颠覆和被颠覆
 超轻量级选手
 看不见硝烟的战场


开源破牢笼
在锌手指核酸酶技术领域,圣加蒙公司充分利用了专利保护制度,打造了一个外人无法染指的技术牢笼。曾带给人们无限想象空间的“黄金手指”,终只是帮助圣加蒙公司上演了一出20年的独角戏。
我相信很多科学家的脑海里,都会不经意间涌现出这样的想法:如果……那该有多好!如果圣加蒙公司压根就没有垄断锌手指核酸酶技术的专利;如果圣加蒙公司能够开放专利壁垒,将自己的独门技术向学术界开放;如果有更多的科学家能参与到锌手指核酸酶相关技术的进一步完善和改进中;如果有许多家公司能够在市场上展开短兵相接的竞争……也许我们今天早已可以享受到锌手指核酸酶在临床上带给我们的福利了。
也正是因为这许许多多的“如果”,始终有一批愤愤不平的科学家,没有放弃打破圣加蒙公司技术牢笼的努力。他们决心要在实验室中“再次”开发出高效的锌手指核酸酶设计方法,彻底绕过圣加蒙公司设置的壁垒。并且这一次,他们发誓要让新知识在学术界和工业界自由共享。这有点像时下互联网中时髦的“开源”概念。
美国麻省总医院的韩国科学家基思·郑(Keith Joung,见图4-1)就是其中的代表人物。郑曾经是我们前文提到的卡尔·帕博实验室的博士后,他和锌手指核酸酶的缘分也是从帕博实验室开始的。在帕博离开学术界前往圣加蒙公司就职时,郑选择了留在学术界,致力于开发锌手指核酸酶组装和筛选的新技术平台。也就是说,从郑独立建立实验室的天起,他的目标就是亲手打破由自己参与建设的锌手指核酸酶的技术牢笼。


图4-1 麻省总医院的科学家基思·郑
基思·郑为锌手指核酸酶技术的开源立下了汗马功劳,之后也参与了基因编辑领域的许多重要革新。

他们的努力没有白费。2008年,郑和同事们发表论文,展示了他们实验室10年来辛苦开发出的新型锌手指核酸酶组装平台。为了表明他们建立开源平台、共享新技术的决心,新平台被巧妙地命名为“OPEN”(意为“开放”,由Oligomerized Pool Engineering的首字母组合而成)。和圣加蒙公司拥有的“黄金手指”筛选方法迥异,OPEN方法的原则其实比较暴力。如果一个科学家希望得到串联在一起的三个锌手指,用于识别一段9个DNA碱基组成的DNA序列,他需要做如下两件事。首先,他要将9个碱基拆分成3 3 3的三段DNA序列。我们已经知道,一个3碱基DNA序列恰好对应一个锌手指。因此,他就可以利用3碱基序列作为“鱼饵”,去汪洋大海般的锌手指蛋白库里“钓”上许多能“咬钩”的蛋白。3个3碱基序列,需各取95根锌手指备用。第二,他再将这95 95 95根锌手指随机组合产生953(约86万)个组合,然后再检测它们结合目标DNA序列的能力。OPEN方法的思路是,尽管相邻的锌手指并不总能完美配合,但在这86万个组合中,总是应该有一些恰好配合默契的组合,科学家要做的就是把它们给找出来。
大家马上会发现,OPEN方法的逻辑虽然简单有效,但实际操作起来非常烦琐。组装出86万个锌手指组合然后再挨个检测是一项非常耗时的技术活。如果需要串联更多的锌手指,那么需要筛选的组合将会以几何级数增长(每多一个锌手指,需要筛选的组合数量就增加95倍)。基于同样的考虑,郑和同事再接再厉,在两年后又推出了CoDa方法。与OPEN方法不同,CoDa是一个主要基于计算机预测的锌手指组装平台。郑和同事们在背后事先做了大量锌手指组合的筛选和测试,再将不同锌手指之间的配合情况放进数据库,然后开发了一套算法用于从数据库中找出配合可能性较大的锌手指组合。至此,学术界的开源努力虽然姗姗来迟,但还是终于修得了正果。尽管已经比圣加蒙公司的组装平台晚出现了差不多10年,但是OPEN和CoDa方法意味着,从此科学家们可以绕开圣加蒙公司的专利壁垒,自由设计所需的锌手指蛋白组合,并用在基础研究和临床应用中了。
然而,这一次锌手指核酸酶技术的开源革命偏偏时乖命蹇。
命运和基思·郑,也和圣加蒙公司开了一个不大不小的玩笑。就在他们双方正在进行一场静默的角力,使出浑身解数优化锌手指蛋白筛选和组合技术的时候,在广茂生物学疆域中的一个默默无闻的角落,一个新发现横空出世,宣告了基因编程时代的终来临。仿佛就在一瞬间,无论是圣加蒙公司也好,还是OPEN和CoDa也好,这一切的努力都白费了,就连锌手指蛋白之间不完美的配对问题仿佛都不再重要了。

“神话”蛋白
要说清楚基因编程时代的来龙去脉,我们还得从锌手指蛋白的问题说起。
上一章的故事里曾经提起过,一个由大约30个氨基酸构成的锌手指蛋白,和一段3个碱基组成的DNA序列,并不是严丝合缝地完美对应的。形象地说,一根锌手指会比一段3碱基DNA略大一点。因此可想而知,几个锌手指串联起来就有可能会互相干扰,就像我们试着戴上一副太大的手套,难免会出现两根手指钻到一个洞里的情形。所以针对任何一段DNA序列设计锌手指组合都是一个需要技巧和经验的任务。这是为什么圣加蒙公司依靠独门的锌手指组合筛选技术就可以独霸整个领域,也是为什么郑的团队会孜孜以求一种开放给全世界的锌手指组装平台了。
说得抽象一点,锌手指组合的可编程性是不完备的。是的,我们确实可以像玩乐高玩具一样把不同的锌手指组装起来,实现对任意一段DNA序列的精确识别。但是哪些锌手指可以组装在一起,哪些会互相干扰,仍然无法完全从理论上预测,就凭这一点,它也远没有乐高玩具那样完美地模块化——任意两块总是可以组合在一起。这一点严重限制了锌手指核酸酶的基础应用与临床应用。
一个可能性当然是给锌手指动动小手术,看能否把这种天然存在的基因组GPS改造成完全可编程的。我们当然也可以尝试一种更科幻的思路:如果我们暂且收回聚焦在锌手指上的目光,用上帝视角俯瞰整个地球生物界,在某一种地球生命内部,会不会已经存在着完全“可编程”的基因组GPS呢?我们一旦把它找出来,所有围绕锌手指核酸酶的技术和专利难题岂不是通通迎刃而解了吗?
尽管这种想法听上去像是神话,但不得不说,这样的想法是符合逻辑的。我们知道,生物体在亿万年的光阴里进化出锌手指,当然不是为了给后世的人类提前准备基因编辑工具的。生物体内的锌手指有着非常重要的生物学功能——精确定位DNA序列,调节基因在不同发育阶段、不同细胞类型、不同环境刺激下的活性。这一点,相信大家在TFIIIA的故事里已经能够一窥端倪。那么我们自然也有理由相信,千千万万种地球生命的亿万个细胞内,应该都拥有自己的基因组GPS,拥有用某种方法精确定位DNA序列的能力。既然如此,凭什么锌手指蛋白这种不完全可编程的方式就是好的?自然选择这个地球上伟大的生命建筑师,难道不会在某个角落已经为人类准备好了具备完全编程性的基因组GPS吗?
你可能会说,好吧,权且相信童话,权且相信王子和公主能幸福地生活在一起,但科学家们又怎么能真的把童话里的主角给找出来呢?地球上已经发现的物种有上百万种,尚未发现的可能还有上千万种,难道还能一种一种地仔细审视一遍不成?
如果我们的研究目标就是从地球生物身上寻找完全可编程的基因组GPS,我们就给自己安排了一项无比烦琐又看不到尽头的搜查任务。然而命运的安排有时候巧合得不可思议。就在圣加蒙公司小心翼翼守护着他们的锌手指组装专利,基思·郑在百折不挠地尝试着开发锌手指组装方法的2009年,两篇学术论文的发表震撼了整个基因编辑领域。
更有意思的是,这两篇论文还不是来自基因编辑专家,而是看起来风马牛不相及的细菌学家。换句话说,这些震动基因编辑领域的发现,纯属误打误撞,绝非精心策划的结果。


图4-2 乌拉·伯纳斯
德国马丁路德·哈勒维腾贝格大学细菌学家。


来自德国马丁路德·哈勒维腾贝格大学的细菌学家乌拉·伯纳斯(Ulla Bonas,见图4-2)在此前的20年里,一直致力于研究一种常见的植物寄生细菌——野油菜黄单胞菌野油菜致病变种。对于农业生产来说,这种细菌是个不折不扣的噩梦。它和它的近亲可以入侵包括水稻、番茄、大豆和青椒在内的上百种植物,在叶片上留下恼人的黑斑,甚至引发严重的植物叶斑病和溃疡病(见图4-3)。


图4-3 柑橘溃疡病
一种由黄单胞菌引起的植物病害。



和体型大得多的寄生虫类似,像黄单胞菌这样的寄生细菌会利用宿主的营养和资源来满足自身的生存和繁衍需要。除了像寄生虫那样直接以宿主为食,黄单胞菌还能够巧妙地欺骗宿主细胞,让宿主细胞为自己生产出各种蛋白质。大家应该还记得我们讲到过HIV是如何进入人体免疫细胞,藏身于人类基因组中,并让人类细胞为它们繁衍后代的。黄单胞菌的本事就与这些狡猾的病毒类似。
当然了,和HIV不同的是,黄单胞菌不会直接进入植物细胞内,它们的个头太大,模样太显眼,很难逃过细胞内免疫系统的攻击。它们的做法显得更经济一些。简单来说,黄单胞菌会利用一套类似针头的装置,将自己的一些蛋白“注射”到植物细胞内。这些蛋白可以欺骗植物细胞,启动植物细胞的蛋白质合成系统,合成一些黄单胞菌急需的蛋白质,来满足它们的生存和繁衍需要。
伯纳斯感兴趣的正是这套精密的微型注射系统。早在20世纪90年代初,伯纳斯实验室就已经发现,黄单胞菌会注射一种名为AvrBs3的蛋白质进入植物细胞。一旦AvrBs3进入植物细胞内,它就能伪装成植物的转录因子,进入细胞核内启动蛋白质合成。而且很明显,AvrBs3的效劳对象并不是植物,而仅仅是黄单胞菌。伯纳斯他们发现,在AvrBs3的控制下,植物细胞会老老实实地合成一系列为细菌服务的蛋白质。有些蛋白质会运输更多的养分进入植物细胞(不用说,自然是为细菌之后的大餐做准备),有些蛋白质则会清除掉植物细胞内可能会毒害细菌的金属离子,等等。
很显然,AvrBs3必然像真正的转录因子那样,有精确定位DNA序列的能力,否则就无法解释为什么它能够启动几个特定基因,而不是所有基因的表达。与此同时人们还发现,和锌手指蛋白一样,AvrBs3蛋白内部也有一些重复的氨基酸序列,一个由34个氨基酸构成的模块反复出现了17.5次,彼此间的氨基酸序列的差别十分细微。
自然而然,伯纳斯他们希望搞清楚AvrBs3到底是怎样实现DNA序列精确识别的。是不是通过一种类似于锌手指蛋白那样的、由一段氨基酸序列对应几个碱基的识别机制?但我们可以想到,仅有AvrBs3一个蛋白实际上是无法展开研究的。伯纳斯他们需要一大批这样的同类型蛋白,才能通过对彼此之间的比较,理解其基因组定位的机制。
这一等就等了10年。到21世纪初,人们才逐渐开始意识到,在黄单胞菌的近亲中,像AvrBs3这样的“间谍”转录因子其实相当普遍。不同的细菌有不一样的植物宿主,因此,它们也都准备了不同的“间谍”转录因子,能够在不同的植物细胞中起到调节蛋白质合成的作用。于是大家干脆为这一类蛋白起了一个新名字——“TALE”(transcription activator-like effector, TALE。中文为“类转录激活因子效应蛋白”)。而这个英文缩写,恰好是“神话”的意思。
利用AvrBs3和它的近亲,伯纳斯终于可以开始尝试理解“神话”蛋白的工作机理了(见图4-4)。在2007—2009年,伯纳斯实验室彻底解析了“神话”蛋白的魔法。他们证明,“神话”蛋白的工作原理确实与锌手指蛋白类似。在锌手指蛋白中,30个氨基酸组成一根“黄金手指”,粗略对应一段3碱基的DNA序列。而在“神话”蛋白中,34个氨基酸组成一个“神话”手指,精确对应一个DNA碱基。在2009年,伯纳斯实验室和美国艾奥瓦州立大学亚当·伯格达诺夫(Adam Bogdanove)同时证明,“神话”蛋白具备完全可编程性。通过删减、添加和自由组合不同的“神话”手指,可以轻而易举地定位任意长度、任意序列的DNA片段。


图4-4 “神话”蛋白的工作原理
可以看出,和锌手指核酸酶系统不同,“神话”手指和DNA碱基乃是一对一的对应关系。每一段“神话”蛋白对应一个DNA碱基。如果将“神话”蛋白组装后与FokI剪刀相连,就可以实现DNA特定位置的切割和编辑。

毫无疑问,“神话”核酸酶(TALE nuclease,TALEN)比锌手指核酸酶要优越得多。完全可编程性让“神话”手指的组装变得极其容易,服务于锌手指的组合和筛选步骤变得完全没必要了。与此同时,因为每一根“神话手指”对应一个DNA碱基,而DNA一共只有4种碱基,那么理论上,我们只需要4根不同的“神话”手指就可以玩千变万化的万花筒游戏了。相比之下,每一根锌手指对应的是一段3碱基序列,而3碱基序列的可能组合有64种,做锌手指组合所需的手指数量,理论上显然多得多(现实中更是需要数百个)。
无意之中,基因编程时代的大门悄悄开启了。
过去20多年来,针对黄单胞菌进行的研究一直安静地待在生物学殿堂的角落——不管是从注意力角度还是从地理角度说都是如此。乌拉·伯纳斯的科学兴趣也始终是植物细菌和它们的宿主。在发现AvrBs3蛋白的时候,她一定没有想到这个狡猾的家伙日后会作为基因编程时代的领路先锋永载史册。没有比这更能说明科学探索的奇妙之处了:人类知识前沿的探索者在走向未知世界的时候,并不知道迎接自己的到底是猛兽出没的丛林还是伴随着鲜花掌声的坦途。也没有比这更能说明基础研究的价值了:人类知识疆域中任何看起来微不足道的扩展,都可能在不经意间打开全新世界的大门。
2009年,全世界对基因治疗和基因编辑心心念念的科学家们,在同一时间看到了这种诱人的可能性。


图4-5 华人科学家张锋
在开发基于“神话”蛋白的基因编辑技术时,张锋刚刚结束了在斯坦福大学的博士研究,在哈佛大学接受了一份历史悠久的“青年研究员”职位。这个创立于20世纪30年代的精英学会巨星云集,包括行为心理学奠基人斯金纳(B.F.Skinner),二极管发明人、双料诺贝尔奖得主约翰·巴丁(John Bardeen),经济学家保罗·萨缪尔森(Paul Samuelson)等均是该学会的青年研究员。以青年研究员的身份,张锋在基因编辑技术先驱乔治·丘奇(George Church)的实验室开始了“神话”核酸酶技术的开发。


率先撞线者之一是一位年轻的华裔科学家张锋(见图4-5)。1981年生于中国河北石家庄的他,11岁时随父母移民美国,在著名的哈佛大学和斯坦福大学先后获得学士学位和生物学博士学位。值得一提的是,张锋在攻读博士学位期间的工作早已注定要载入史册。他和他的导师卡尔·戴瑟罗斯(Karl Deisseroth)一起发展了光遗传学技术。这是一种利用光学刺激和光敏感蛋白,精密控制神经元活动的工具。对于希望理解大脑如何工作,又如何在各种疾病中导致故障的神经科学家来说,光遗传学是阿拉丁神灯一般的存在。
2011年,张锋和合作者设计并组装出了全新的“神话”蛋白,并证明它可以精确定位人类基因组并调节邻近基因的表达。与此同时,来自圣加蒙公司的科学家也证明,如果在“神话”蛋白上连上科学家们已经用过多年的FokI基因剪刀,新一代的基因编辑工具“神话”核酸酶就诞生了!他们证明,人工设计组装的“神话”核酸酶,可以媲美他们自己开发的锌手指核酸酶,能够对基因组实施精确而高效的编辑。
我们也可以说,圣加蒙公司这是在自己革自己的命。他们也明白,“神话”蛋白的旭日初升,标志着锌手指蛋白时代的落幕。哪怕不惜抛弃自己钻研已久的独门绝技,也必须赶上“神话”蛋白和基因编程时代的列车!于是,围绕锌手指核酸酶的争议和对抗,终以一种出人意料的方式收场了。专利和技术壁垒阻挡不了人类了解自然、认识和改善自身的永恒向往。
神话降临人间。2011年,人类正式开启了基因编程时代。

颠覆和被颠覆
说起来也有意思。“神话”蛋白开启了基因编程时代,但编程时代的主角并不是它。“神话”蛋白的光芒如流星般转瞬即逝,说起在科学史上的影响,可能还比不上被它革了命的锌手指!
话说清末学人龚自珍有名句“但开风气不为师”,意思是说,自己只会用诗文引领思想潮流,绝不开馆授徒、建立朋党影响政治。这句诗后来被中国新文化运动奠基人之一的胡适先生故意歪曲了一下用来自嘲,说自己但开文学革命风气之先,成就却难称一代宗师之誉。
想来很有意思,胡适的故意歪曲反而无意间说出了人类历史发展的某种宿命:作为革命契机的突破,往往不会同时成为新时代的卓越建设者。历史的演进有自己缓慢而坚决的步伐,一个天才既披荆斩棘在旧思想的牢笼上剪破一道缺口,又总领新思维的全局成为一代宗师,这种可能性确实太小了。
我们讲到的“神话”蛋白,恰恰也是这么个“但开风气不为师”的角色。
它领风气之先,一手开启了人类基因组的编程时代。对于它的前辈锌手指来说,科学家们需要烦琐地筛选和组装步骤才能找到一套能够定位基因组特定序列的GPS。而对于“神话”,基于它的完全可编程性,科学家只需要在计算机上把几根“神话”手指按照基因组DNA的编码顺序串联起来,就可以完成“神话”蛋白的设计工作。这两者之间的差别,就像模拟电视和数字电视的差别一样深刻久远。想想吧,在模拟电视时代想要插入一个动画形象需要做多少手工绘画和裁剪,而在数字时代,这一切都可以在计算机上高效完成。
同时,致力于开发“神话”蛋白技术的科学家,充分吸取了锌手指核酸酶技术被专利禁锢的教训,几乎总是时间分享和公开新的技术进展,供全世界同行们利用和进一步完善。于是,一时间风起云涌、群贤毕至,各种技术进步以眼花缭乱的节奏出现在学术期刊上。似乎利用“神话”核酸酶技术改造人类基因组的临床实践很快就要发生了!实际上,在短短一两年内,也确实有不少实验室已经开始在探索这种技术的临床价值了。例如,2013年,南非科学家就发表学术论文称,可以利用“神话”核酸酶技术在乙肝病毒基因组上制造基因缺陷,破坏乙肝病毒在人体内的复制机制,用以治疗乙型肝炎。当然了,我们也必须知道,基础研究到临床应用之间的距离往往十分漫长——彼此之间隔着十几二十年的时间、数十亿美元的投入,以及难以预测的运气因素。但至少在当时,人们对于“神话”核酸酶技术的光明前景还是非常乐观的。
但我们不得不承认,“神话”蛋白也有自己的隐忧。正是这点不为人知的毛病,终决定了它难以成为基因编程时代的一代宗师。
大家可能还记得,我们讨论过如果想要定位人类基因组上的一个特定位置,需要多少碱基排列信息,又需要组装出什么样的GPS。就拿镰刀形红细胞贫血症相关的HBS基因为例,9个碱基的排列是不足以完成精确定位的,而21个碱基就足够了。我们可以假定21个碱基是能够确定人类基因组中任何一个位置的魔法数量,以此来大致估算一下我们需要组装的基因组GPS有多大。
21个碱基,根据一个锌手指对应3碱基序列的规则,需要7个串联的锌手指。一根锌手指大致包括30个氨基酸,那么我们一共需要把大约210个氨基酸串联起来。210个氨基酸是什么概念呢?
必须说明,蛋白质分子并不能随心所欲地进出细胞,因此,当我们把锌手指送进人体细胞的时候,并不是直接把蛋白送进去。医生需要借助传统基因治疗的办法,用病毒工具把编码锌手指蛋白的DNA序列送进细胞,让人体细胞帮助我们制造“黄金手指”。因此,在实际操作中,我们需要借用病毒把一段大约630个碱基长度(3个碱基密码子对应1个氨基酸)的DNA送进细胞。也就是说,锌手指蛋白的效率大约是1∶30(1个目标碱基需要30个工具碱基)。当然,实际情况远比这个计算复杂得多,我们还没有算上FokI核酸酶的长度,没有算上许多辅助DNA序列,更没有考虑一般而言我们需要一对,而不是一个锌手指核酸酶来制造DNA双链的断口。
然而“神话”蛋白的效率是多少呢?按照这个简单的计算,是1∶102——每一个目标碱基,需要动用一整根“神话”手指,也就是102个碱基!
“神话”蛋白的效率要远远低于锌手指。这种低效率造成了两个问题。,针对人类基因组任一位置的定位,都需要超长片段的“神话”DNA,可是病毒载体运输DNA的能力是有极限的,这样一来,想要在运输“神话”DNA的同时携带各种DNA操作工具(FokI基因剪刀)往往就会捉襟见肘。第二,尽管设计出这一长段“神话”DNA仅仅是在计算机上动动手指的事情,但要在实验室里实际克隆出这么一段DNA就没有那么简单了,因为这需要把20多段序列几乎完全一致的DNA分别合成出来,然后再按顺序连在一起,不光实际操作的技术员会觉得困惑,负责DNA连接的蛋白质分子(我们称其为“连接酶”)也经常会搞错顺序。因此,在“神话”蛋白出现的前几年,科学家都在忙活着发明各种能够保证“神话手指”正确组装的技术。
然而,也就是在这短短一两年的时间里,也就是科学家们站在基因编程时代的大门口,充满热情地推动技术发展的时候,“神话”蛋白的风头迅速被另外一种更新的基因编辑技术盖过了,而且还被越甩越远。站在锌手指蛋白肩头,开启基因编程时代的“神话”蛋白从此化身为科学史上一级窄窄的阶梯,任由科学家们摩肩接踵地踏过,走向基因治疗的前沿。
在“神话”蛋白降临之后的一两年里,发生了什么惊天动地的大事呢?
大家应该已经习惯这样的出场方式了:首创基因编辑之风的锌手指蛋白,来自罗伯特·里德实验室对DNA转录的研究。他们的研究发现了一类能够结合DNA特定位置,并启动RNA合成的蛋白质分子——转录因子。而针对转录因子TFIIIA的研究找到了能够一指点中3碱基序列的“黄金手指”——锌手指蛋白。锌手指蛋白在基因治疗中的亮相完全是意外之喜。“神话”蛋白也一样。它脱胎于乌拉·伯纳斯对黄单胞菌的研究——这本是一个和基因治疗、基因编辑风马牛不相及的研究领域。
2012年,来自生命科学僻静角落的纯粹基础研究,第三次彻底震撼了基因编辑领域。
这次出头抢了“神话”风头的小兄弟,有个长得可以吓跑一半读者的学术大名,叫“成簇的规律间隔的短回文重复序列”(clustered regularly interspaced short palindromic repeats)。不过大家先不用害怕,这么佶屈聱牙的名字别说你们,就连科学家们也都记不住。于是大家用首字母组合“CRISPR”来称呼这种新技术。CRISPR的发音和英文单词“crisper”(保鲜盒)相似,而新鲜出炉的CRISPR技术也真的像这个发音暗示的那样,鲜活水灵,一个猛子扎到基因编辑的领地里,成功扮演了搅局者的角色。
其实CRISPR本身是个已经有些年头的发现。这种东西早发现于1987年,那个时候就连锌手指都才初露峥嵘,更别说“神话”蛋白了。
1987年,一些日本科学家在研究大肠杆菌的时候,发现它的基因组DNA上有一些看起来怪里怪气的重复结构:有一段29碱基的序列反复出现了5次,两两之间都被32个碱基形成的看起来杂乱无章的序列隔开了。形象地说,就像是给你几块一模一样的砖头,再发给你几根颜色不同的皮筋,然后要求你用不同的皮筋把砖头分别连起来,这样就有点像日本科学家发现的这段DNA序列了(见图4-6)。


图4-6 CRISPR序列的特征
在细菌基因组DNA上,出现了多次重复的DNA序列(双线),中间夹杂着多变的序列
(单线)。


对于这种奇怪序列的具体作用,大家当时完全是一头雾水。在当时看来,DNA主要有两种功能:一是负责编码蛋白质的氨基酸序列,直接参与蛋白质生产(3碱基对应1个氨基酸);二是辅助蛋白质生产(例如有些DNA序列是负责和转录因子结合的)。而这种串联起来的重复结构看上去两者都挨不上边。
当然了,这本身也谈不上是什么大问题,生物学里奇奇怪怪的发现实在太多了。地球生命在半径6000多千米的地球上进化了40多亿年,有着什么样奇怪的特征都不足为奇。也许大肠杆菌这段DNA压根就没什么用也未可知,人的腋毛和阑尾不是看起来也没什么用处嘛!


图4-7 弗朗西斯科·莫西卡
西班牙埃尔坎特大学科学家,CRISPR/cas9系统早期研究的重要人物。

然而,仅仅几年以后事情就开始发生变化了。1993年,西班牙科学家弗朗西斯科·莫西卡(Francisco Mojica,见图4-7)在另一种细菌——地中海嗜盐菌——里又一次发现了这种古怪的重复序列。
这就有趣了。要知道从大肠杆菌到地中海嗜盐菌,这两种细菌从生活环境到进化历史都毫无相似之处可言。如果我们在大街上看到一个壮汉提着一串用彩色皮筋绑起来的砖头,还可以认为是这个壮汉闲得无聊或者在酒后装疯,但要是一天之内见到了两个这样的壮汉,肯定会自问一下,这串砖头是不是当地的某种奇怪民俗啊?
好巧,莫西卡也是这么想的。于是他继续在各种奇奇怪怪的细菌里寻找。到了2000年,莫西卡利用当时刚刚兴起的生物信息学技术,在海量DNA数据库里进行检索,竟然在20种不同微生物中都发现了这种名为CRISPR的重复DNA结构。
这就有意思了,而且这几乎肯定说明了CRISPR不太可能是偶然现象,也不太可能仅仅是某种奇怪而无用的民俗,它应该有着非常重要乃至性命攸关的生物功能。要知道,对于任何有机生命来说,保存、复制和传递遗传物质都是件很困难也很浪费资源的事情——大家可以回忆一下我们故事里讲到过的DNA半保留复制和DNA损伤的修复。要是CRISPR没有用处,在自然选择的作用下,我们很难想象会有这么多不同的物种会不约而同地同时保留了这么一长串的废物DNA。
于是莫西卡和他的同事决定去探索一下这种未知的功能到底是什么。2005年,他们手里已经掌握了来自60多种细菌的多达4500段CRISPR序列,接下来就是看看它们之间有没有什么共性。一经对比,自然就看到奥妙了,有88段DNA居然在不同细菌中出现了多次!这88段大多是CRISPR序列中夹在重复序列之间的片段——不是砖头,是连接砖头的彩色皮筋。更妙的是,这88段中还有相当部分——47个——居然还不只存在于细菌里面,它们居然和许多病毒的基因组序列信息高度一致。
当然了,听过了基因治疗的故事,相信你们马上会想到,这些DNA也许是病毒入侵细菌之后,藏身于细菌基因组里的痕迹,就像寄居人体细胞的HIV。但这个简单的解释其实是站不住脚的。莫西卡他们发现的并不是完整的病毒DNA,而仅仅是病毒DNA的一小段,只有这一小段是没法制造出病毒来的。更重要的是,看起来对于这些病毒DNA片段,细菌是经过了小心处理的,因为它们总是被夹在一段段精心设计的重复序列里。
所以简单来说,这些CRISPR应该不是病毒藏身于细菌基因组的痕迹,反而像是细菌在基因组里收藏了某些病毒不同角度的快照。
这当然不是细菌暗恋病毒的证明——生物学家们没那么浪漫,而且,细菌大概也不会那么热爱这些病毒。因为这些被CRISPR序列记录下来的病毒并不普通。与入侵人体细胞的HIV和入侵植物细胞的烟草花叶病毒类似,CRISPR记录下的病毒,恰好是专门入侵细菌的病毒。它们依靠细菌维持自身的生存繁衍,也因此会对细菌造成致命伤害,所以它们被恰如其分地命名为“噬菌体”。
我们已经说过,宿主和病毒在亿万年的光阴里一直在玩猫捉老鼠的游戏。以人体为例,人体进化出了多种多样的机制来清除入侵身体的病毒颗粒,比如免疫系统。我们身体里有一类具备特殊功能的细胞,能够有效识别和杀灭身体里的病毒,保护身体的其他组织和细胞。
细菌作为一种单细胞生物,显然不可能期待来自其他细胞的帮助。因此,如果细菌也希望抵御病毒的入侵,必须依靠自身细胞内的资源和手段。会不会就是CRISPR?
这个想法初看起来很疯狂:谁能相信一段DNA就能实现一整套免疫系统的功能?但是仔细想想却很耐人寻味。CRISPR肯定有着重要的功能,同时又携带着许多病毒的信息;这些病毒恰恰又是对细菌威胁的噬菌体。这三条放在一起的话,一个自然的猜测不就是CRISPR能帮助细菌抵抗噬菌体吗?
这个想法验证起来也不难。我们大家也能设计出这样的实验来:如果一切正如我们的猜测,那携带着某种病毒信息的CRISPR序列应该就具有病毒疫苗的功能。拥有这段CRISPR序列的细菌应该不容易被这种病毒入侵,如果把这种CRISPR转移到另一种细菌中,也能让这种新的细菌具有免疫力。
很快,就在2007年,这个想法得到了完美证明。一群在丹尼斯克食品配料公司工作的科学家证明,在嗜热链球菌中人工添加一段CRISPR序列,可以帮助细菌抵挡某种对应病毒的入侵。这群科学家甚至还证明,细菌的免疫系统和人体一样,居然还有自我进化的高级功能。每当有新的噬菌体病毒入侵,侥幸存活下来的细菌就会把它的基因组序列整合到自己的CRISPR序列中。下次有同样的病毒入侵时,细菌就可以正确识别和对抗它们了。顺便提一句,这帮科学家的研究对象——嗜热链球菌,乃是现代酸奶工业的基石。因此,他们开展研究的出发点,也许仅仅是为了解决酸奶生产中经常出现的噬菌体感染问题。
好了,截至目前,CRISPR的生物学价值应该足够惊世骇俗了。原来以为只有人类这样的高等生物才拥有复杂的免疫系统,谁能想到只有一个细胞、几微米大小的细菌居然也有。而且和人体免疫系统一样,细菌的免疫系统居然也具备自我进化、迅速适应和对抗新病毒入侵的能力。从任何角度出发,这都是项足以载入史册的重大发现。这个发现无比优雅和简练地说明了有机生命的伟大生命力。一个小小的细菌,没有多余的空间和资源来创造复杂的免疫系统,仅仅用自身基因组序列上的一小段重复DNA片段,就能够抵挡病毒的侵袭。
讲到这里,你可能会问,CRISPR的故事再精彩,和基因编辑、基因治疗又有什么关系呢?其实真相并不复杂。如果合上书本,把前因后果想上几分钟,也许你就会明白其中的奥妙。CRISPR里面含有病毒的部分DNA序列与CRISPR能够抵御病毒的入侵,这两点之间有什么关系吗?凭什么仅靠记录一张病毒的快照,细菌就能够杀死入侵的病毒呢?
想清楚这一点,全新的基因编辑技术就呼之欲出了。

超轻量级选手
继续我们的问题:靠记录下病毒的遗传信息,细菌为什么就能抵御病毒入侵呢?
为了说清楚这个问题,我们再来回想一下病毒的生命史。我们已经知道,病毒本身并不具备独立生存繁衍的能力。病毒的“生命力”依赖于病毒颗粒能够进入宿主细胞,释放出自身的遗传物质,并且利用宿主细胞的资源帮助其复制繁衍。那么可以想象,对于病毒而言,它们进入宿主细胞后的件事就是迫不及待地把自己的遗传物质给释放出来——或者说暴露出来。反过来,对于饱受噬菌体之苦的细菌而言,病毒入侵的个标志是不是就是病毒遗传物质在细胞内的出现?既然如此,细菌是不是也可以利用这一点来实现对病毒的精确打击:一旦在细胞内监测到病毒遗传物质的出现,就时间启动防御机制?
如果真是这样的话,CRISPR序列的功能也许就可以理解了。既然CRISPR序列中有一部分和病毒遗传物质完全一样,那么是不是可以想象这样一个过程:细菌会把细胞内存在的所有DNA都一一抓来和CRISPR序列仔细比对,一旦发现两者完全一致,就意味着病毒在细胞内出现了,就必须马上启动防御机制?
这种做法听上去很合理。不过,合理的可能性和真实的生物学之间,还间隔着漫长的探索过程。在做酸奶的法国科学家揭示了细菌的免疫功能后,许多实验室立刻开始着手尝试解释CRISPR序列的工作机理(见图4-8)。
科学家发现,和细菌体内正常编码蛋白质的基因一样,CRISPR序列也能被转录成RNA分子。这些短短的RNA分子会和细胞内的某种蛋白质结合(这类蛋白也因此被称为cas蛋白,也就是CRISPR结合蛋白的意思),像哨兵一样在细胞里终日巡逻。这位哨兵寻找的对象,是任何一段能够和CRISPR RNA完美配对的DNA分子。一旦两者相遇并结合,哨兵就会启动cas9蛋白的切割功能,将这段DNA切成一个个小的片段。也就是说,细菌的全套免疫系统,仅仅就是一个自带切割功能的蛋白质,一段自带识别功能的RNA。


图4-8 CRISPR/cas9系统的工作原理
当cas蛋白携带着来自CRISPR的向导RNA在细胞内“巡逻”时,一旦捕获到一段DNA序列能与向导RNA完美契合,就会激活cas9蛋白,实现DNA切割,立刻消灭掉潜在的病毒入侵者。



如果此时我们再度回想锌手指和“神话”蛋白就会发现,与细菌相比,复杂生物的DNA识别机制竟然是如此低效。我们说过,锌手指识别DNA的效率是1∶30,而“神话”蛋白更是低至1∶102。细菌的CRISPR识别DNA的效率则是1∶1,这是在理论上就无法逾越的识别效率。如此惊人的识别效率,是因为CRISPR完全避免了DNA和氨基酸之间的转换,完全依赖RNA而不是氨基酸序列实现对DNA的识别。由于DNA的每个碱基恰好对应RNA的一个碱基,因此,CRISPR实现了简洁的DNA识别,堪称超轻量级的基因组GPS。这个能力也迅速被用于开发新一代的基因编辑技术。
2005年,就在莫西卡从海量CRISPR序列中发现规律,次提出细菌免疫可能性的时候,美国加利福尼亚大学伯克利分校的结构生物学家珍妮弗·杜德纳(Jennifer Doudna)也偶然从地球微生物学系的同事吉利恩·班菲尔德(Jillian Banfield)那里听说了CRISPR。某天在校内的“言论自由运动”咖啡馆小坐闲聊时,班菲尔德告诉杜德纳,她的实验室从附近铁矿中发现的许多细菌,也带有这种神奇的CRISPR序列。
与一心想着解决免疫问题的细菌学家不同,杜德纳是功成名就的结构生物学家,长期利用X射线衍射方法研究蛋白质大分子的三维结构。因此,对CRISPR产生兴趣的杜德纳自然希望利用老本行来探究CRISPR的三维结构,看看它们究竟是怎样实现对病毒DNA分子的识别的。
但杜德纳在几年内都没有取得很好的进展。事后想想,她的探索其实是有点超前的。2005年的时候,人们还不知道CRISPR DNA需要先转录成较短的RNA分子,才能发挥功能(这一点直到2008年才发现),也不知道CRISPR的真实功能是切割病毒DNA(这一点直到2010年才发现),更不知道CRISPR RNA发挥功能需要一系列与之结合的cas蛋白(这一点也是2008年才发现)。实际上,即便是在2010年,人们已经知道细菌的免疫系统是cas蛋白和几段RNA的复合体时,杜德纳都还没有找到合适的入手点。2010年,人们发现CRISPR RNA会结合好多个cas蛋白,而解析一个拥有七八个蛋白质分子、好几段RNA片段的庞大蛋白复合体结构,直到今天在技术层面都还相当困难。
到了2011年,杜德纳终于找到了突破口。或者更准确地说,是突破口找到了她。
当年3月上旬,杜德纳飞往美丽的波多黎各参加一场由美国微生物学会组织的会议。会议的主题是细菌中的RNA分子——这正是杜德纳整个职业生涯一直关注的目标。从浓雾时雨的北加州飞往阳光明媚的加勒比海,杜德纳的心情无疑是轻松愉快的。直到一位表情严肃的女科学家走上前来,轻声问她:“能出去走走顺便请教您几个问题吗?”
这个女科学家是任教于瑞典于默奥大学的法国人艾曼纽·卡朋特(Emmanuelle Charpentier)。这场不期而遇的对话标志着人类基因治疗领域新的起点,毫无异议将被写入当代科学史(见图4-9)。


图4-9 盛装亮相的两位女科学家
2014年11月,杜德纳(右二)和卡朋特(右三)一同获得了由硅谷创业精英创立的“生命科学突破奖”,并获得了每人300万美元的奖金。这也是史上数额的科学奖项。顺便说一句,图中右一是著名女演员卡梅隆·迪亚茨(Cameron Diaz),左一是Twitter公司前CEO迪克·科斯特罗(Dick Costolo)。

和杜德纳一样,卡朋特也对CRISPR序列有着特别的兴趣,但两人的研究背景大相径庭。和结构生物学出身的杜德纳不同,卡朋特受过长期的细菌生物学训练,对细菌本身所属的生物学更加熟悉。在这场海边的对话中,卡朋特提到她自己的实验室在研究一种危险的人类致病菌——化脓链球菌——当中的CRISPR序列。她的实验室发现,细菌中仅仅需要一种cas蛋白(后来大名鼎鼎的cas9,当时的名字还是csn1)和两段RNA分子,就可以识别和切割病毒DNA!
于是,杜德纳和卡朋特顺理成章地开始了她们的合作。对杜德纳而言,研究一个蛋白质的结构和功能显然比研究一大堆蛋白质轻松得多;而对于卡朋特而言,她也非常想从结构生物学的角度,更好地理解cas9到底是如何发挥功能的。两个相隔万里之遥的实验室迅速展开了合作,终在2014年完美解释了CRISPR/cas9系统的工作原理。我们可以把cas9蛋白想象成有着两个卡槽的接线板,卡槽内能够同时插进一条CRISPR RNA和一条病毒基因组DNA。当插入的CRISPR RNA和病毒DNA的序列一一配对时,cas9蛋白就会发生变形,准确卡住病毒DNA,毫不犹豫地挥起剪刀。这正是细菌免疫系统的工作原理。
在此之前的2012年,两个实验室首先证明了CRISPR/cas9系统能够作为新一代的基因编辑工具。他们对这个系统进行了进一步简化,把系统所需的RNA从两条合并成了一条向导RNA。与此同时,他们抛开病毒免疫的概念范畴,次证明了这个双组分系统的完全可编程性:人工设计的向导RNA可以让cas9蛋白指哪打哪,切割任意指定的一段DNA序列。
而这个时候距离“神话”核酸酶技术的出现也不过短短一年而已。当科学家们还在努力改善“神话”蛋白的组装方法,生物技术公司还在跃跃欲试准备用“神话”蛋白展开基因治疗尝试的时候,CRISPR/cas9技术的从天而降,宣示了“神话”技术的终结。毕竟这一次,要定位和切割任意一段人类基因组序列,只需要科学家设计几十个碱基长度的序列即可,这把基因编辑的工作量一下子减少到原来的1/100。

看不见硝烟的战场
即便在几年后的今天,我们仍然可以感受到整个科学界的狂热反应。杜德纳和卡朋特的发现不仅仅是一项基础研究成就——尽管这项成就几乎肯定会获得诺贝尔奖。如果这项技术确实如两位女科学家所言那么高效便捷,也许整个基因治疗市场会被重新定义。谁能抢得先机,谁就能在这个广阔的舞台和市场上占据先发优势。
在2013年年初的短短数周内,三个实验室相继证明,人工设计的CRISPR序列与cas9蛋白结合,确实可以高效编辑人类基因组。新一代人类基因编辑技术正式走入现实。这三个研究组包括杜德纳自己,也包括任教于哈佛大学医学院的乔治·丘奇和任教于麻省理工学院布罗德研究所的张锋——后两位在“神话”蛋白的研究中已经发挥过重要作用,是基因编辑领域的老兵了。
与以往的基因编辑技术相比,例如锌手指蛋白和“神话”蛋白,CRISPR/cas9技术的优势实在太过明显了。从工具准备的角度看,设计和制造一个用于基因组定位的RNA片段,对于任何一个稍加训练的生物学研究人员来说都是易如反掌的事情,远远简便于锌手指蛋白和“神话”蛋白的组装。与此同时,上述三个实验室的工作也证明,CRISPR/cas9系统的工作效率要远远高于其他两种技术,这意味着现实中改变任何生物乃至人类自身的基因组的成功率都会大大提升。甚至在张锋实验室2013年发表的论文中,他们还证明可以一次性利用几段不同的向导RNA来实现对基因组的多点精确手术操作,这是之前任何基因编辑技术都无法达到的高效率。
在工业和临床应用中,易如反掌就意味着低门槛,高效率就意味着低成本和短周期。这些优势也就意味着新的CRISPR/cas9技术会把许多不可能都变为可能。
过去几年间,整个科学界的的确确见证了许多不可能的实现。
利用CRISPR系统实现对特定基因的破坏、修复、关闭和启动;对cas9蛋白和向导RNA的不断优化(以提高效率,降低差错率);多线程的CRISPR/cas9;利用CRISPR/cas9系统尝试治疗疾病(已经尝试过的疾病类型包括癌症、肥胖症、艾滋病、乙肝,以及包括镰刀形红细胞贫血症在内的各种遗传病);利用CRISPR/cas9系统研究基础生物学问题(包括用于大规模遗传筛选和制造各种基因缺陷的动物模型)。终,就在2016年,来自四川大学华西医院的医生,已经开始将这项技术应用于治疗人类疾病。在一项2016年10月开始的临床试验中,中国的科学家们将肺癌患者的免疫细胞提取出来,利用CRISPR/cas9技术修改了细胞中的一个基因,再将这些细胞注入患者体内。他们期待,经过基因改造的免疫细胞能够攻击患者体内的肿瘤。此时,距离CRISPR/cas9系统的发现才过去了短短4年。
和学术界的高歌猛进同时发生的是,资本也在疯狂涌入这个看起来遍地黄金的市场。是啊,在如此高效的技术背景下,有太多太多愿景可以自由畅想。我们是不是可以利用这项技术,修改各种农作物和家禽牲畜的基因组,让它们更加高产、抗害、有营养?我们是不是可以改造各种工业微生物,让酸奶更可口、让奶酪更香醇、让葡萄酒更醉人?是不是可以用它来修改受精卵的基因组以避免先天遗传病?是不是可以用于修改患者的基因组,治疗他们的疾病,甚至让人类更聪明、更健康、更长寿?
有市场分析认为,几年之内以CRISPR/cas9系统为基础的基因编辑市场会达到每年数十亿美元的规模。而更乐观的估计则认为,这是一个年销售额接近500亿美元的庞大市场。
于是,在全世界的实验室你追我赶地继续完善和发展CRISPR/cas9技术的同时,围绕着知识产权和商业利益的战争也开始了。
2014年4月15日,美国专利与商标局在万众瞩目中,将与CRISPR/cas9技术相关的项专利,授予了张锋和他所在的布罗德研究所(见图4-10)。这项内涵深广的专利涵盖了CRISPR/cas9技术在所有真核生物方面——包括各种动物、农作物以及人类自身——的应用。


图4-10 CRISPR/cas9技术的项专利许可
授予布罗德研究所和麻省理工学院,发明人张锋,授予日期2014年4月15日,专利编号US 8 697 359 B1。

这项专利意味着从此以后如果任何公司试图利用CRISPR/cas9技术改造动物、植物、微生物乃至人类自身,必须首先从布罗德研究所获得专利授权,否则就会侵犯布罗德研究所的专利权。布罗德研究所靠这项专利不光可以坐拥主动送上门来的滚滚专利许可费,而且可以从源头上控制整个基因编辑和基因治疗产业。
这边布罗德研究所的庆功酒还没开场,一场战争就已经箭在弦上。CRISPR/cas9技术的专利所有权到底是谁的?
从前面的故事来看,CRISPR/cas9技术早的发现者难道不是杜德纳和卡朋特吗?为什么她们没有拿到专利?就算是张锋实验室确实早证明这项技术在人类细胞中可以工作,那差不多同时哈佛大学的乔治·丘奇实验室以及杜德纳本人的实验室也证明了这一点,为什么专利不是三方共享呢?
在讲锌手指核酸酶故事的时候我们已经掰扯过一点知识产权保护的来龙去脉和巨大影响了。如果说在那个故事里,虽然有圣加蒙公司利用专利保护构建壁垒的历史遗憾,但知识产权保护系统还是更多起到了正面作用的话,在CRISPR/cas9的故事里,这套系统更多的则是暴露出了问题和缺陷。
一切还需要从头说起。实际上,杜德纳和卡朋特所在的加利福尼亚大学和维也纳大学,也绝不会无视CRISPR/cas9技术的巨大价值。早在两位科学家的学术论文发表前,两家学术机构就已经在2012年5月向美国专利与商标局提交了正式的专利申请,内容涵盖了该技术几乎全部的应用领域。在那个时候,张锋他们证明CRISPR/cas9技术用于编辑人类基因组的学术论文尚未发表(2013年1月发表),张锋和布罗德研究所的专利申请也尚未提交(2012年12月提交)。看起来不管是学术承认还是专利授予,杜德纳和卡朋特都占尽了先机。事情要是就这样发展下去,CRISPR/cas9的专利毫无疑问属于杜德纳和卡朋特,也属于加利福尼亚大学和维也纳大学。
但魔鬼在细节里。
在这场看不到硝烟的战斗中,两个看起来微不足道的细节决定了成败——至少是在战局一开始。个细节是,布罗德研究所的律师们在提交专利申请时,大概是意识到己方已经严重落后,因此特别申请了美国专利与商标局的快速审批通道。简单来说,美国专利与商标局近年来审核专利申请的人手严重不足,导致许多专利申请被挤压,等待一纸批文可谓遥遥无期。于是他们就想了个非常“资本主义”的办法:着急的专利申请者可以交钱申请快速审批。急于获得专利的人交钱买时间,不着急的人慢慢熬但可以不用出这笔钱,也算是皆大欢喜。布罗德研究所正是充分利用了这个条款,硬是无中生有创造出了时间。实际上,美国专利与商标局首先审核了张锋他们的专利申请,尽管他们的申请比加利福尼亚大学晚了足足7个月!
那这个让张锋他们后来居上的快速审批,需要交多少额外的申请费呢?说出来你可能觉得难以置信:只有区区70美元!想到区区70美元就决定了价值数十亿美元的专利以及价值成百上千亿美元的基因治疗市场,真是让人哭笑不得。
当然,你可能会说,这未免也太不公平了吧?专利应该授予的是个做出发明创造的人啊?如果谁交钱谁就能拿到专利,那这样的专利保护制度还有什么用?别急,知识产权保护系统当然没有这么唯利是图。这套系统的本意当然是为了保护和激励个做出发明创造的人。但到底如何认定谁是“个”,特别是在有好几方都抢着说自己才是“个”的时候?
这就要说到第二个魔鬼的细节了。在世界上绝大多数国家的专利法系统里,如果出现不同的人或实体试图申请同一类东西的专利时,一般遵循的是谁先提交申请谁就能获得专利的规则(“first-to-file”)。换句话说,谁是“个”就看谁先提交专利申请。这样处理的好处是避免纠纷,因为关于谁先递交申请这事儿是有据可查、一目了然的。当然,这种处理办法的坏处就是,万一隔墙有耳偷去了发明人的想法或技术,然后抢先申请专利,那谁也拿他没有办法。
美国长久以来采用的都是所谓谁先发明谁就能获得专利的规则(“first-to-invent”)。实际上,在过去的十几年时间里,美国还是全世界一个采用这种规则的国家。这种谁先发明谁获得专利的系统,看起来非常理想主义:专利应该保护真正率先将它实现的人,而不是那个匆匆提交专利申请的人。万一有人鼠窃狗偷,真正的发明人就可以借由这个规则保护自己的利益。但我们马上就会意识到,这个系统在现实操作中却造成了巨大的麻烦。专利申请人如何才能证明自己是个发明的人?总不能靠自己空口无凭去说吧?
可能也正是基于这个理由,美国决定在2013年年初彻底改革专利法系统,追随“世界潮流”,也开始按照谁先申请谁获得专利的办法做事(见图4-11)。可是别忘了,不管是杜德纳和卡朋特身后的加利福尼亚大学,还是张锋身后的布罗德研究所,都是在2012年内提交的专利申请。因此,对他们两家专利权纠纷的裁决,还必须按照原先那个比较“天真幼稚”的“谁先发明谁获得专利”的思路来。


图4-11 奥巴马签署批准《美国发明法案》
2011年9月16日,美国前总统奥巴马签署批准《美国发明法案》,正式确定了美国专利法系统将于2013年3月16日转向“谁先申请谁获得专利”系统。不要小看了专利法范畴的这个微小变化,对知识产权的保护是美国的立国精神之一,是美国的立国之本。在1787年美国宪法中已有明文规定,为了促进科学和技术的进步,国会有权授予作家和发明家著作权和专利权的保障。

这样一来就更麻烦了。因为证明“率先发明CRISPR/cas9技术”这件事并没有那么轻而易举。要知道现代生物学研究已经变得非常复杂,任何一个技术的实现都免不了翻来覆去、周而复始的试错和改进,到底做到什么程度才算是“实现”?又怎么证明这一点呢?
如果仅看公开的论文发表记录的话,杜德纳和卡朋特本来是有天然优势的,毕竟是她们俩在2012年率先发表论文,证明了CRISPR/cas9技术的可行性,而张锋他们的论文到2013年1月才问世。然而,有备而来的布罗德研究所一口气提交了上千页原始证据,从基金申请书、个人通信记录一直到实验记录本,试图证明张锋实验室早在2011年已经有了开发CRISPR/cas9技术的想法,在2012年初就已经发明了这项技术——比杜德纳和卡朋特的论文发表时间还早!既然如此,依据“谁先发明谁获得专利”的制度设计,专利理所当然属于张锋,属于布罗德研究所。
平心而论,相比加利福尼亚大学原本的专利申请,布罗德研究所的专利申请范围要小一点点——其中包括了CRISPR/cas9技术在真核生物中的应用,但并不包含该技术在细菌中的应用。考虑到真核生物包括所有的真菌、动物、植物,当然也包括人体,布罗德研究所几乎没有给加利尼亚大学的专利申请留下任何机会。
深感被忽悠和羞辱了的加利福尼亚大学和杜德纳、卡朋特一方显然不会轻易放弃这只下金蛋的鹅。在经过长达一年的精心准备之后,加利福尼亚大学于2015年4月向美国专利与商标局提交了多达114页的抗辩材料,以及几千页的补充证据。他们试图让美国专利与商标局相信,布罗德研究所申请的专利与加利福尼亚大学的专利申请“存在抵触”从而无效,而加利福尼亚大学才是这项技术真正的拥有者。
可能刚刚看明白布罗德研究所为什么能获得专利批准的你,这下又糊涂了。不管这个优先审批通道是不是有点不靠谱,布罗德研究所确实老老实实交了70美元申请费;不管这个“谁先发明谁获得专利”的制度是不是有点蠢,张锋他们也确实提交了充足的证据。加利福尼亚大学这下又能使出什么绝处逢生的招数呢?
这里就要稍微多讲几句专利保护制度:什么样的发明创造才能申请专利呢?大致而言,各国的专利法都规定,只有满足以下三种情况的申请才会被授予专利:新颖性、创造性和实用性。其中,新颖性不用解释,指的就是发明创造“人”的地位。实用性理解起来也很容易:你的发明创造总得有点可能的实用价值,否则拿来申请专利就等于是在浪费国家知识产权保护系统的有限资源。
而创造性就值得多说两句了。创造性,可以理解成如果一个发明创造尽人皆知、显而易见,就不该获得专利。打个比方,如果你看到一个红色的玩具很受孩子欢迎,你觉得把颜色换成绿色也挺不错,这个想法就不能获得专利保护,因为实际上任何孩子(或者任何玩具制造商)都能轻而易举地想到这个主意。这项条款本质上是为了防止专利保护被滥用。要知道,专利保护的本质,是国家通过保证专利发明人在一段时间内的商业价值独占权,以“纵容”垄断为代价推动和鼓励创新。那么可想而知,如果一个发明创造显而易见,根本不需要人为去推动和鼓励就能出现,那自然也就不值得为此付出“纵容”垄断的代价了。
而恰恰是这一点要求成了现代许多专利官司的入手点。毕竟绝大多数创新都是微小的、局部的、改良性的。一项创新是否真的显而易见,往往并没有那么容易判断。
被逼到绝路的加利福尼亚大学正是紧紧抓着这一点不放。他们声称,布罗德研究所的专利压根就不能成立,因为张锋一方的研究结果并不能满足创造性的标准。他们的解释是,在张锋他们提交专利申请的2012年年底,杜德纳和卡朋特的学术论文早已公开发表,已经证明了CRISPR/cas9技术在试管里的有效性。从这篇论文出发,想到在人类细胞中应用该技术,无非是一个“显而易见”的推广应用而已。加利福尼亚大学的律师们反复强调,从杜德纳和卡朋特的发现到张锋的发现可谓顺理成章、水到渠成,“不需要任何特殊的佐料”!
于是加利福尼亚大学看起来似乎稍稍扳回一局。毕竟他们的论据无懈可击:在杜德纳和卡朋特的论文发表后短短几个月里,全世界数家实验室都证明了CRISPR/cas9技术能够编辑人类基因组(其中就包括杜德纳自己的实验室、张锋所在的实验室以及乔治·丘奇实验室)。如此一呼百应的技术发展,恰恰说明其“显而易见”。而布罗德研究所一方也绝非只能坐以待毙,他们的抗辩也一定会从是否“显而易见”上入手。比较重要的是,杜德纳本人数次在公开场合声称,在人类细胞中应用CRISPR/cas9技术并不是特别简单,自己的实验室也遇到了不少技术问题。相信这一点一定会被布罗德研究所的律师们牢牢抓住用来反驳“显而易见”的理论。事实上,生物学研究历史上,也确实有不少这样的例子:理论上看起来有效的工具,到实际上能在生物系统中高效应用,之间还是需要反复的试错和优化过程。
2016年1月,美国专利与商标局宣布开始重新审查CRISPR/cas9技术的相关专利。整个世界都在屏息等待终的专利归属。2017年2月,美国专利审判和上诉委员会做出裁决,判定布罗德研究所和加州大学的专利并没有抵触之处,前者的专利继续有效。当然必须说明,此判决并不意味着加州大学的专利申请失去了机会。鉴于双方的专利诉求存在较大范围的重合,可以预计未来仍然会有大量围绕CRISPR/cas9技术的专利纠纷。上一次一纸薄薄的专利授权书吸引了全世界的目光,可能要追溯到近100年前,天才的勤杂工、发明家费罗·法恩斯沃斯(Philo Farnsworth,见图4-12)赢得了与巨无霸美国广播公司的专利权官司,捍卫了自己电视发明人的地位。就在本书收尾的时候,专利争端尚未尘埃落定。我只能说,不管美国专利与商标局如何判决,这场专利大战都不太可能就此尘埃落定,落败的一方必然会诉诸更高级别的司法裁决。这场专利大战的终战果,也必然会给这个价值成百上千亿美元的市场留下深远的影响。


图4-12 费罗·法恩斯沃斯
电视之父、美国的国家英雄。对于中国读者来说,“电视发明人”的称号往往和另一位发明家,英国人约翰·贝尔(John L. Baird)联系在一起。实际上,贝尔确实是世界上台电视的发明人,但日后使用更加广泛的阴极射线管电视(也就是我们耳熟能详的显像管电视)则出自法恩斯沃斯之手。值得说明的是,法恩斯沃斯虽然成功捍卫了自己的电视专利和“电视之父”的称号,但他本人却没有从电视的商业化中获利。


专利战争的硝烟,并没有阻挡资本的脚步。尽管现在谁都难以预测CRISPR技术的专利终将花落谁家,又或者是否能以一种共赢的方式达成和解,投资人和医疗行业巨头对这项技术的兴趣仍在不断高涨。
商场上的竞争可能要比专利权之争更为复杂。加利福尼亚大学的杜德纳参与成立了卡里布生物科学(Caribou Biosciences)和易达利治疗(Intellia Therapeutics)两家公司。杜德纳的合作伙伴卡朋特参与成立了总部位于瑞士巴塞尔的CRISPR治疗公司。而杜德纳和卡朋特的直接竞争者、哈佛大学医学院的乔治·丘奇教授与布罗德实验室的张锋则联手创立了爱迪塔斯医药(Editas Medicine)公司。毫无疑问,利用CRISPR/cas9技术进行人体基因编辑和基因治疗将是四家公司的重点发展方向。背靠CRISPR/cas9这项21世纪革命性的生物技术,几家公司总计获得了上亿美元的风险投资,其中爱迪塔斯医药公司更是早早登陆纳斯达克。换句话说,在专利权归属尚未尘埃落定的时候,资本方已经抢先押宝,开始推动各式各样的商业化研究了。
带着对未来的不安和美好期待,故事也到了该说再见的时候。希望在我们的故事里,你们能看到知识产权和商业的白热化竞争,更能看到许许多多隐藏在进化背景里的奇妙现象,以及它们是如何一点一点被人类好奇的眼光所注视和理解的。我也希望你们能看到人类探索自然奥秘的道路上有多少曲折反复,有多少激动人心的高光时刻。重要的是,我还希望你们能看到多少实验室里不经意间的有趣发现,用一种巧夺天工的方式终造福了人类自己。
可能我们这种跳得不高、飞得不远、力气也不大的卑微的碳基生命,就是这样一步一步走出非洲,并在全世界开枝散叶建立文明的。也正是因为如此,我们才能够把飞船送出太阳系,把眼光投向亿万光年之外和原子之间的。而我们这一次终于操起了上帝的手术刀,开始对自身遗传信息进行编辑和修改,这会不会是人类文明漫漫征途上的下一个接踵而至的光荣与梦想?

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.