公益第十八课 | 你有“跳跃”基因吗?
我们知道每个人体细胞的细胞核内包含23对染色体,包括22对常染色体和1对性染色体(XX或XY)。线粒体中也含有一条微小的圆形染色体。因为同源染色体的存在,简单起见,生物学家只关心由一组25条染色体组成的单倍体基因组,这包括:22条常染色体、X染色体和Y染色体,以及线粒体染色体。每条染色体都包含一条完整的DNA链。我们假设生命是一本书,我们的基因组中每个核苷酸相当于这本书中的一个字母,这本生命之书没有空格没有标点符号没有插图或表格,需要3675个核苷酸填满一页。按照这样的形式将我们的基因组(22个常染色体,X和Y染色体,线粒体染色体)打印出来,将有8435000页。如果将其装订成一系列的书籍,基因组的生命之书系列将有49.21米高。我们是2倍体生物,那么这本生命之书将有98.42米高,近100米(图1)。
图1:生命之书
图片来源于网络,版权属于作者,如有侵权请联系删除。
我们常说蛋白质是生命活动的体现者,有趣的是,在基因组中98%的序列不编码任何蛋白,所以有人认为这是“垃圾基因”。这些“垃圾基因”中有很多序列都是重复序列。比如Alu元件,它在这本书中出现了120万次,约占有这系列书的11%的内容(图2)。每一个Alu大约含有300bp,这个重复序列属于短散在序列(SINEs)。在Alu的第170bp位置左右有段序列为AGCT,即Alu I限制性内切酶的识别位点,这也是Alu名称的由来。
图2:Alu在染色体上的分布
核型来自于一女性淋巴细胞(46,XX)。采用荧光原位杂交技术,Alu探针与染色体杂交处呈现绿色,对照TOPRO-3与染色体杂交呈现红色,即图中绿色荧光的部分为染色体中的Alu元件。
图片来源:https://en.wikipedia.org/wiki/Alu_element#/media/File:PLoSBiol3.5.Fig7ChromosomesAluFish.jpg
图片版权属于作者,如有侵权请联系删除。
目前我们仍不知道Alu是如何产生。但有证据表明,第一个Alu可能出现在6000万年前的高级灵长类基因组中。从那时起大约每200年,就会有一个新的Alu重复序列插入到人类基因组中。大家可以再看看图2,显示了Alu在染色体上的分布。在短短的6000万年中,这些序列已从零变为每个细胞约120万个拷贝!换句话说Alu不是固定不变的,它是一个可以跳跃的基因。Alu的跳跃,可以在同一条染色体上进行跳跃,它也可以从这条染色体上跳跃到另外一个染色体上。因为DNA位置的移动叫转座,所以Alu序列也称为Alu转座子。
那Alu是如何实现跳跃的呢?Alu不能实现自主“跳跃”,它需要另外一个转座子的帮助,这就是L1转座子,也称L1元件。L1转座子也是重复序列,但是这个重复序列比较长,约有6000bp。L1大约是Alu的20倍长,所以它属于长散在序列(LINEs)。L1转座子也是LINEs中最多的一种,占有人类基因组的17%。L1转座子可以编码Alu复制过程和跳跃过程中所需的所有的分子。
大致过程如下图3:
1. 以Alu的序列为模板,合成mRNA。
2. L1转座子编码逆转录酶。
3. 逆转录酶识别染色体上的TTAAAA序列,其互补链的序列为AATTTT,将剪切开AA TTTT。
4. TTTT将作为引物,与Alu mRNA的尾部匹配,并以Alu mRNA 为模板,在L1的逆转录酶的作用下将形成Alu的DNA序列。
5. 再以Alu的序列为模板,合成互补链。这样就在新的位点插入了Alu的序列。
图3:Alu如何跳跃
图片整理于冷泉港实验室DNA学习中心的教学动画视频,来源:https://dnalc.cshl.edu/resources/animations/alu.html
虽然有时我们说Alu基因,但这个基因不编码任何蛋白质,似乎它只是在不停的复制自己的序列,那它对于我们人类来说有没有意义?是垃圾吗?
人类从其他灵长类动物中分化出来之后,已有几千条Alus基因插入了我们的基因组。Alu重复序列分布并非所有的人都一样。一些Alu重复序列在一个种群中是固定的,这意味着这个种群中所有人在某个特定位置都有特定的Alu重复序列。不同的个体在特定的染色体位置可能携带或不携带特定的Alu序列。你听说过巴斯克人吗?
图4:巴斯克人
图片来源:https://zh.wikipedia.org/wiki/%E5%B7%B4%E6%96%AF%E5%85%8B%E4%BA%BA
图片版权属于作者,如有侵权请联系删除。
巴斯克人为西南欧民族,主要分布在西班牙比利牛斯山脉西段和比斯开湾南岸,法国及拉丁美洲各国也有少量分布。巴斯克人第16号染色体Pv92位点的Alu元件重复情况很特殊。Alus有两个不同亚形:Ya5和Yb8。Ya5组是在PV92处,插入时间比较久,Yb8是较新插入的组。新的Alu在PV92位点插入进原来的Alu序列中。Alu序列插入Alu序列中是罕见的,而且是最近才插入的,只在少数人身上发现过,特别是来自西班牙巴斯克地区和摩洛哥北部的人。那如何知道自己的第16号染色体上有这样特别的序列呢?我们可以通过之前学习的PCR技术来检测。特异性扩增这部分的序列。再使用凝胶电泳技术,根据扩增目的基因片段的长度推测你的16号染色体PV96处的Alu的“跳跃”情况。
参考文献:
1. Deininger, P. Alu elements: know the SINEs. Genome Biol 12, 236 (2011). https://doi.org/10.1186/gb-2011-12-12-236
2. David A. Micklos , Bruce Nash ,et al. Genome Science:A Practical and Conceptual Introduction to Molecular Genetic Analysis in Eukaryotes.1th ed. Cold Spring Harbor Laboratory Press. 2014
校对:刘知远
本文来自冷泉港亚洲DNA学习中心
如需转载请添加微信好友:CHSA-dnalc
账号+密码登录
还没有账号?
立即注册