清华大学医学院沈晓骅研究组揭示重复序列对宿主基因组结构和功能的调控作用-清华大学医学院

研究成果

清华大学医学院沈晓骅研究组揭示重复序列对宿主基因组结构和功能的调控作用

2020-03-10

国际学术期刊Cell Reports(《细胞报告》)于3月10日在线发表了清华大学医学院沈晓骅研究组的最近研究成果“Genomic Repeats Categorize Genes with Distinct Functions for Orchestrated Regulation”,系统地揭示了基因组重复序列与其宿主基因功能,调控和表达之间的紧密联系。

13.jpg

图示:重复序列对宿主基因组结构和功能塑造示意图

重复序列是哺乳动物基因组中重要的组成部分,分别构成小鼠基因组中的~45%和人类基因组中的50%~70%。由于具有入侵宿主基因组的特性并且缺少相应的功能注释,它们在很长一段时间内被认为是基因组的“寄生虫”或者“垃圾”DNA。近年来,某些重复序列亚类如内源性逆转录病毒(ERV)转座子被报道在胚胎干细胞(ESC)里面起到一定的功能,但整体而言,研究者对于重复序列如何、多大程度地影响其宿主基因组的结构和功能还并不清楚。

首先,该文发现了重复序列在基因组上的非随机分布。SINE,L1和low-complexity重复序列将其相关宿主基因划分为三个主要的功能类别:富含SINE的基因更可能编码与RNA加工,核仁和翻译相关的管家蛋白;富含L1的基因倾向于产生在终末分化细胞中具有特殊功能的蛋白质;Low-complexity重复序列富集基因倾向于编码发育和组织特异性转录因子。这些功能类别特异的基因在不同的发育阶段中差异表达。SINE富集的基因在Zygotic genome activation(ZGA)期间被激活并且在ESC中以高水平表达。富含L1的基因则在早期胚胎发育和ESC中处于转录沉默的状态。Low-complexity重复序列富集基因则在胚胎发育开始处于沉默状态,然而在ESC分化中开始变得活跃。

该文发现重复序列可以为其宿主基因提供大量的转录因子结合位点, 从而参与调控基因的时序性表达。SINE重复序列富集参与活性转录的蛋白因子的结合位点;L1重复序列优先被异染色质蛋白和表观遗传阻遏物靶定。Low-complexity重复序列富集PRC2转录抑制复合物的组分。这些结果支持重复序列将其宿主基因连接入转录调控网络中的作用,以实现一类具有不同功能基因的阶段特异性激活或沉默。此外,该文发现B1和L1两种重复序列截然不同并且互补的细胞核内分布。这暗示着重复序列很可能参与到细胞核内染色质的组织。因此,该文开发了鉴定核仁相关结构域的高通量测序方法:Nucleolar DNA-seq并发现L1重复序列显著地富集在核仁相关结构域中(Nucleolar-associate domain,NAD)。相反地,SINE B1重复序列显著地在这两个核内结构域中缺失,而主要分布在细胞核膜和核仁之间 (nuclear interior),该区域一般认为是促进转录的结构域。

此外,该文发现L1 RNA在 ESC中广泛地与其DNA结合。 ESC中L1 RNA的敲低导致富含L1 DNA的染色体片段从非活性结构域迁移到核内部活跃区域。相应地,L1富集基因的表达得到去抑制。这些结果证明了L1 RNA可以传递并促进蕴含在L1 DNA中的基因沉默信息。综上所述,这些结果揭示了基因组重复序列已经深刻地定义,塑造和影响了我们的基因组织、功能和表达。

清华大学沈晓骅实验室的博士生卢雨阳为该论文的第一作者,博士生邵雯、李同、洪彦涛,及尹亚飞和张惠博士等参与了此工作。同时,北京大学孙育杰实验室的常蕾博士对该文中生物成像相关实验提供了有力的支持。该研究得到了国家自然科学基金委、科技部重点研发项目、生命科学联合中心等多个项目的支持。

原文链接:

https://www.cell.com/cell-reports/fulltext/S2211-1247(20)30209-6

上一条:清华大学医学院沈晓骅组在《自然》报道非编码RNA的染色质结合机制

下一条:清华大学张林琦和王新泉课题组合作解析新冠病毒受体结合区RBD与受体蛋白ACE2复合物的晶体结构

您现在的位置: 首页 > 科学研究 > 研究成果 > 正文