CH8 The Discovery of the Genetic Code and tRNA
主要人物
- Francis Crick:1916年出生,英国物理学家、生物学家。
- James Watson:1928年出生,美国生物学家。
- George Gamow:1904年出生,美国物理学家。
Gamow的贡献
发现DNA的双螺旋结构之后,下一件事就是确定双螺旋的功能。
双螺旋模型强烈地暗示我们——遗传信息隐藏在4种类型的碱基对里。
当时已有的知识:
- DNA在细胞核里
- 蛋白质合成在细胞质里
- 细胞质里有RNA没有DNA
以上三点暗示我们遗传信息从DNA流到RNA,再从RNA流到蛋白质。
很容易猜出DNA如何产生RNA,但从RNA如何产生蛋白质,当时一无所知。当时并不知道mRNA、tRNA的存在,只知道rRNA的存在。
1953年夏天,DNA双螺旋的文章发表后不久,沃森、克里克收到了一封来自美国的信,作者是大名鼎鼎的物理学家、宇宙学家George Gamow,宇宙大爆炸理论的提出者。Gamow在那时就已经成名了。(Gamow告诉克里克,相比于持续创造理论,天主教会更喜欢他的宇宙大爆炸理论,他甚至给了教皇一份论文打印版。)
Gamow大胆地假设,DNA上有20种凹陷,恰好对应着20种氨基酸。
沃森和克里克思考了一下,拒绝了第一点,接受了第二点。伽莫夫给出了自己认为20种氨基酸,兄弟俩一眼就看出其中几个很扯淡。两人把当时已经发现的所有氨基酸分成标准组和例外组。标准组的定义是在许多不同的蛋白质中都出现,例外组的定义是非标准组。比如说,bromo-tyrosine和diaminopimelic acid就属于例外组。最后,兄弟俩恰好得到了20种氨基酸。
现在,每本教科书上都会讲20种标准氨基酸,其它氨基酸几乎不会讲,而当时显然没有20种标准氨基酸的概念。克里克说,当时的生化教材上有许多例外组的氨基酸,因为在20世纪的前50年,发现一种新的氨基酸可是一种大事。
1954年夏天,沃森、克里克、伽莫夫一起度过。伽莫夫成立了一个神秘组织——RNA领带俱乐部(有点类似火影里的晓组织)。总共有20位成员,每一个成员代表一个氨基酸。克里克拿到的是色氨酸。很有钱的伽莫夫还送给每个成员一个领带。
言归正传。三人认为遗传密码是三联体,因为$4^2=16$,不足以对应20种氨基酸,于是他们只好先假设遗传密码是三联的,这样有$4^3 = 64$种密码子,可以对应64个氨基酸。如果这假设不对,他们还要试试四联、五联。
在继续往下看之前,我必须指出一件事:数学的证明和物理的证明、生物的证明不同。如果定义数学证明的严谨程度是100%,物理证明的严谨程度大概只有80%,生物证明只有60%。
下文中会出现很多“证据”、“证明”这样的字眼,希望读者牢记上一段话。
三联体是重复的还是非重复的?
假设三联体是重复的,那么,假设我们关注的密码子是AAT,它的右侧最多有4种情况:ATA、ATG、ATC、ATT。
假如在一个真实的序列中,发现一个氨基酸右侧有9个不同的氨基酸,那么它至少有3个密码子。
当时测蛋白质的序列还不是很容易,只有很少的数据[1]。尽管如此,利用这些很少的数据,布伦纳还是发现:如果三联体是重复的,那么它需要的密码子远远多于64个。
三联体的实验证据
本泽、布伦纳、克里克用T4噬菌体做实验,这玩意繁殖得很快,而且很容易突变。
实验的细节暂时跳过,他们发现,有时,基因突变会导致多一个碱基或者少一个碱基。前者记为+,后者记为-。
他们发现,+++、++++++、+-的噬菌体接近野生型,+、++、++++、+++++的噬菌体接近突变型。
下面这些图展示了这是怎么回事
野生型:

+:

+-:

+++:

遗传密码的实验证据
这时,克里克相当错误地认为——细胞不太可能在某种密码子上开启翻译。克里克认为这样也太简单了。他提出了一种复杂得多的翻译方式——必须沿着正确的相位,才能翻译出蛋白质。比如,对于序列ABCABCABC,只有ABC有意义,BCA,CAB都没有意义。克里克把前者称为有逗号密码(the comma code),把后者称为无逗号密码(the comma-free code)
我个人认为后者愚不可及,我也不太清楚克里克等人为什么这么看好这个蹩脚的模型。后来,Marshall Nirenberg发现UUUUUUUUU这样的序列是可以翻译出蛋白质的,击碎了这个模型。
但克里克依旧强词夺理地表示,无逗号密码模型可能在进化早期起过作用。
利用生物化学的办法,学者们最后破译了整个遗传密码表。
遗传密码表vs元素周期表
遗传密码表体现了分子生物学的精髓,而元素周期表体现了化学的精髓。
然而,元素周期表在宇宙各处都成立,遗传密码表连地球上某些生物都有例外。
克里克的理解是:遗传密码表是自然选择的产物,元素周期表不是。即,在几十亿年前,三联体、20种标准氨基酸、40-60种tRNA、20种氨酰tRNA合成酶出现了,含有它们的生物生存的机会更高,于是慢慢地它们开始流行起来。
tRNA的发现
克里克提出,翻译时,会有一种“接头”,接头一端和mRNA形成氢键(mRNA在tRNA之后才被发现,这里是假想的),另一端在酶的催化下和一个氨基酸形成化学键。
“接头”不久就被美国生化学家Mahlon Hoagland发现。现在高中生都知道,接头就是tRNA。
顺带一提,tRNA的发现和mRNA的发现都没有得到诺贝尔奖,我也感到很费解。这两个发现可比DNA聚合酶、RNA聚合酶重要多了。
[1] 1955年,Frederick Sanger才终于完成了测定bovine insulin(牛胰岛素)的序列的工作,这是人类历史上第一次测出一个蛋白质的序列。Sanger因此拿到了1958年诺贝尔化学奖。
