环状RNA
真核生物中多外显子的基因通过剪接机器的线性顺向剪接(linear splicing)形成线性RNA,也就是外显子3'与下游的外显子5'连接;而环状RNA(circular RNA或circRNA)的产生则不一样,它是剪接机器的反向剪接(back splicing)将外显子的3'连接到上游外显子的5'形成的封闭环状RNA结构(如下图)。由于环状RNA分子呈封闭环状结构🦷,没有线性RNA的5'和3'♔,因而不受RNA外切酶影响,不易降解。大多数环状RNA是非编码 RNA 分子。环状RNA的产生、修饰☝🏽、功能、降解、以及演化,都是目前研究的热点🍽。
关于环状RNA的两个假说/理论
“适应性”假说:
基于两点👦🏻:(1) 高通量测序发现很多基因都会产生环状RNA,比如人类有超过50%的蛋白编码基因都可以产生环状RNA✊🏽;(2) 少数个别的环状RNA被实验验证具有重要的生物学功能,比如可以作为microRNA的靶点🤦♂️,起到调控“海绵”的作用。其中(1)表明的是环状RNA的“广泛存在性”📢,而(2)表明的环状RNA的“具有功能性”,两者一起就形成一种认为大多数环状RNA是具有功能的观点,我们称之为“适应性”假说(adaptive hypothesis)🧑🏻🦼➡️。
“分子错误”假说:
首先𓀉,虽然环状RNA比较普遍,其中个别有功能😓,但这并不能说明全部或者大多数环状RNA有功能🙅🏻♂️,所以从逻辑上,上面(1)和(2)的结合所形成的“适应性”观点就有问题,不能以个别概括整体🤹🏼♀️。第二,其实环状RNA很早以前(1979年)就被发现了,最初被认为是错误剪接的产物;即使到现在,也只有极少数的环状RNA被证实有功能🏍。第三,任何分子过程🙍♂️,其本质都是随机的👮🏽🗝,犯错误是不可避免的;而RNA的剪接过程已经被发现是一种容易犯错的分子过程,作为RNA剪接的一个子类,反向剪接也可能出错。
基于以上这些考虑,我们提出了与“适应性”假说相对立的“分子错误”假说(error hypothesis)🙇🏻♂️,认为🦝🌆:环状RNA大多数源自于RNA剪接错误,因此普遍应该不具有功能甚至是有害的。围绕产生circRNA的反向剪接,我们给出了支持该假说的一系列证据(文章Results里面的前6部分)🥦🎨,最后我们推测了有多大比例的反向剪接是无益的(即没有功能的、甚至有害的)。
“分子错误”假说的证据
“分子错误”假说有一系列推断。我们分析了大量的数据🦵🏽,发现结果符合所有这些推断。
证据1
“分子错误”假说推断:产生环状RNA的反向剪接对物种应是有害的👳♂️👨👧,对物种有害的东西在群体中会被自然选择逐渐清除,造成反向剪接发生的比率非常低。因此反向剪接发生率应该很低👩🍳。
我们分析数据后😖,发现确实如此,如下图。在所有剪接事件中,反向剪接所占的比例平均低于0.2%;即使只关注发生反向剪接的基因,也只有不超过2%的反向剪接比率。
证据2
“分子错误”假说推断💾:有至少3个原因使得反向剪接对物种演化是有害的:1) 反向剪接一旦发生,本应形成有功能的线性RNA分子没有形成🦵,这导致有功能的线性RNA分子减少👸🏽;2) 形成的环状RNA,是一种对细胞资源的浪费,而且还要去降解这些环状RNA及其可能的蛋白产物🏞,进一步浪费细胞资源⛸⛹🏼♂️;3) 产生的这些环状RNA及其可能的蛋白产物,是有可能直接对细胞有毒的。如果给定一个反向剪接的比率🐻,2) 和3) 会随着基因或位点的剪接量增加而增加,反向剪接带来的坏处也随着剪接量的增加而增加。因此,自然选择力度也会随着剪接量的增加而增加,最后会形成高剪接的基因或者位点出现较低的反向剪接率,也就是说基因或者剪接位点的反向剪接率会与基因的总剪接量成负相关性🏍。
我们分析数据后💁♀️🤦♂️,发现确实是这样的🆎,如下图。
证据3
证据2中♍️,比较的是同一个组织中不同的基因,实际上比较的是各个基因不同的顺式调控原件😟。而一个基因对于反向剪接的控制,可能还与反式作用原件相关,这个可以通过比较同一个基因在不同组织中的反向剪接来探究。 “分子错误”假说推断:一个基因在其高剪接的组织中应该有较低反向剪接率🩷,也就是我们应该观察到基因的反向剪接率与其在一个组织中的总剪接量成反比。
我们分析数据后👩🏽🏭,发现确实是这样的,如下图。
证据4
“分子错误”假说推断:大多数反向剪接在演化过程中不保守。
由于我们观察到的保守性可能是由于随机因素导致的,因此我们首先做了一个随机模拟得出随机情况下的反向剪接保守度,然后用观察到的保守度减去随机导致的保守度来估算出反向剪接中由非随机因素导致的真实保守度🙇♂️🤾🏿♂️。
以人类的受体剪接位点(acceptor)为例(如下图),在人类和老鼠中观察到有17%的保守位点(下图B);然而,如果去除由于随机导致的保守率以后🧝🏽🕉,只有2.5%的受体剪接位点才是真正保守(下图C)🔨,说明反向剪接中的保守比率很低🪸🛐,从而支持“分子错误”假说。
证据5
“分子错误”假说推断:反向剪接信号的保守性与位点的反向剪接量无关🥀。
由于反向剪接的剪接信号同时也是线性顺向剪接的信号,我们在研究反向剪接信号的保守性时🤼,需要排除掉由于线性顺向剪接导致的保守性,因此我们计算偏相关性📖,也就是在排除线性顺向剪接的因素下计算剪接信号与位点的反向剪接量之间的相关性👨🏿🎨。
我们分析数据后🛒,在排除线性顺向剪接的因素下,确实没有发现剪接信号的保守性与反向剪接量之间存在显著的相关性,如下图 (物种之间的divergence越高🪼👩🏽🦳,保守性越低)。G图表示的没有排除线性顺向剪接的影响下剪接信号的保守性与反向剪接量存在微弱正相关的;H图表示剪接信号的保守性与线性顺向剪接量确实存在正相关🤐;I图表示去除线性顺向剪接的影响后剪接信号的保守性与反向剪接量几乎没有相关性🧁。
证据6
“分子错误”假说推断:由于自然选择的强度与物种有效种群数量(Ne)成正比🤩,我们应该观察到有效种群数量大的物种中🧏♂️,反向剪接率应该更低。
我们分析数据后,发现确实是这样的,如下图👨❤️💋👨。有效种群数量👩👧👧:人类<猴子<老鼠,而反向剪接率:人类>猴子>老鼠。
我们估计出在观察到的反向剪接中有害的比率>97%
以上6种证据表明反向剪接是一种剪接错误,对物种实际上是有害的,因而环状RNA主要来自于这种剪接错误。那么到底有多大比率的反向剪接是有害的呢🚴🏻?对此我们做了两类估计👧🏿:
(1) 在还没有经历自然选择的情况下,有多大比率的反向剪接是有害的?
因为低剪接量的基因的剪接受到的自然选择力量最小,有害反向剪接被清除的就少🤖,因此我们可以以此类基因的反向剪接来代表原始的未被自然选择的反向剪接(T);而高剪接量的基因的剪接受到自然选择力量最大,有害的反向剪接被清除的就多,因此我们可以以此类基因的反向剪接代表经历自然选择后保留下来的无害反向剪接(ND)👨🏼🚀。以剪接量1为低剪接基因的阈值🧑🏽🎄,剪接量500为高剪接基因的阈值🔮,我们得出:未经自然选择时,有害反向剪接的比率是Fdel=(T-ND)/T,在人类🤚🏻、猴子和老鼠中有害反向剪接的比率分别是98.9%,99.8%和99.1%。
(2) 经历自然选择后,在观察到的反向剪接中,有多大比率的反向剪接是有害的?
如果我们以所有基因中观察到的反向剪接率作为自然选择后的反向剪接率 (T),高剪接基因(阈值为500的剪接量)的反向剪接代表无害的剪接(ND),我们可以估计现在观察中有害反向剪接的比率Odel = (T-ND)/T,我们在人类🤳🏻、猴子和老鼠中得到比率分别是:97.5%🚹,99.7%和98.9%
因此🥦,在现有观察到的反向剪接中↘️,有超过97%的反向剪接都是有害的。
写在最后
(1) 我们的结论是:环状RNA大部分来自于剪接错误🤽🏽♀️,因此它们多数应是垃圾RNA。我们的结果与少数环状RNA被证实具有功能的事实并不矛盾🗃♦︎。
(2) 环状RNA产生和降解调控机制的存在并不是“适应性”假说的证据💪🏻🦑,这就好比:家里每周产生的垃圾会以非随机的方式被处理(比如每周五处理)。这个非随机过程并不能说明垃圾是有用的。
(3) 目前环状RNA的研究火热🫱🏼,很多研究都尝试寻找环状RNA的功能👉。我们的研究结果意味着这些尝试大多会是徒劳,因为绝大多数环状RNA并没有功能👱🏼。
(4) 该研究与我们之前对于基因可变转录起始和终止🖲、RNA合成和转录后修饰👮🏿、可变翻译起始和终止🍞、翻译的延伸和翻译后修饰的结论一致💇🏻♂️,说明基因的转录与翻译易出错,细胞内的分子过程并不是大多数人认为的那样完美无缺🧝🏼♀️。了解这一生命的特征会为我们理解许多生命现象带来启示与帮助。
论文链接🫷🏻:
https://www.cell.com/cell-reports/fulltext/S2211-1247(21)00856-1
论文的中文简讯😚:
http://blog.sciencenet.cn/blog-3423233-1297318.html
胥川博士的个人主页:
https://life.sjtu.edu.cn/teacher/chxu
胥川实验室长期招收博士后/博士生/硕士生/本科实习生🙅🏽♀️,欢迎咨询联系:
https://postd.sjtu.edu.cn/info/1005/1888.htm