• 加载中...
  • 加入收藏
手机版 扫一扫
北京高校

北大生命科学学院、生命科学中间李程研究组发表基于三维基因组数据的动态染色质可接近性模型

时间:2017年03月11日 信息来源:北京大学 点击: 加入收藏 】【 字体:

2017年2月9日,北京大门生命科学学院、北大-清华生命科学联合中间、统计科学中间李程研究组在Nucleic Acids Research期刊发表了“Dynamic chromatin accessibility modeled by Markov process of randomly-moving molecules in the 3D genome”的论文。

真核细胞的染色质在细胞核中折叠成复杂的三维结构,但这些结构的形成和功能还没有被完全理解。近年来,以Hi-C为代表的染色质构象捕捉技术揭示了较邃密的染色质三维结构单元,如A、B间隔(A/B Compartments)和拓扑结构域(Topologically Associated Domains, TADs),它们在不同细胞类型、物种内都有保守性,是定量化地理解染色质三维结构形成和功能的关键性进展。三维基因组与基因表达调控具有密切的关联,例如,一个TAD内的基因每每被共同调控,但一个TAD内的加强子因为被TAD边界阻隔,不会调控另一个TAD内的基因。在疾病形成和干细胞分化过程中,表达调控、表观遗传的转变经常伴随着三维基因组的结构转变。

在此项研究中,李程研究组使用基于Hi-C数据的染色质区域间的相对空间距离,行使布朗活动描述转录因子和染色质修饰蛋白在不同染色质区域之间的动态转移过程,并以此建立了染色质区域附近分子浓度转变和趋于稳固的马尔可夫模型。模型由此推导出的平衡态分布(Steady-State Distribution, SSD)表征了分子在染色质区域之间因为随机活动达到的动态平衡的浓度,是领域内首次基于三维基因组信息的动态染色质可接近性的度量(图1A)。SSD不同于直观空间结构意义上的紧密程度,由于紧密或松散的染色质区域上都有可能出现高SSD值(图1D)。

北大生命科学学院、生命科学中间李程研究组发表基于三维基因组数据的动态染色质可接近性模型

图1:动态染色质可接近性模型和性子。A:SSD的计算流程。Hi-C矩阵经过最短路径法转换得到染色质区域的空间相互距离,再行使分子布朗活动的假设,得到马尔可夫模型的状况转移概率,最后得到分子在不同染色质区域的平衡态分布。B:最短路径算法示意图。C:SSD值在染色质不同区域的典型分布。D:GM12878细胞系1号染色体基于Hi-C数据的三维结构模型与SSD(颜色)的关系。

李程研究组进一步发现,相比传统的测量染色质可接近性的实验方法如DNase-seq和FAIRE-seq,SSD与表征染色质活跃程度的多个组蛋白修饰,以及基因表达有更强的相干性,证实了SSD作为动态可接近性度量的上风。SSD模型说明染色质修饰蛋白和转录因子的分布遵循由染色质三维结构决定的动态平衡状况,其浓度则进一步影响局部基因转录表达的水平(图2A)。此研究还发现SSD可以帮助揭示干细胞分化过程中染色质结构转变的两个阶段。在胚胎干细胞经过神经元前体细胞阶段、向神经元细胞分化的过程中,与染色质结构组织相干的基因所在区间的SSD(动态可接近性)首先升高,帮助这些基因的表达,进而促进更多神经元细胞特异基因所在区间的SSD的升高和响应基因的表达(图2B)。这说明干细胞分化过程中的一个紧张因素是时空特异地调控染色质的空间组织和结构,从而促进细胞阶段和类型特异性的基因得以表达。

北大生命科学学院、生命科学中间李程研究组发表基于三维基因组数据的动态染色质可接近性模型

图2:动态染色质可接近性的形成与在干细胞分化中作用的模式图。A:染色质三维结构通过动态染色质可接近性影响基因表达。B:干细胞分化过程中,动态染色质可接近性帮助阶段和细胞特异基因的时空表达。

该研究得到北大-清华生命科学联合中间、科技部国家重点研发计划、国家天然科学基金重点项目的资助。李程研究员为该论文的通信作者,生命科学中间2013级博士生王轶楠为该论文第一作者,生命科学学院2014级本科生范操琦是论文第二作者,生命科学中间2016级博士生郑宇轩参与了部分工作。

相干链接:

李程研究组开发的三维基因组疾病欣赏器

北京大门生物信息平台论坛

编辑:山石

 

 

文章热词:成人高考
上一篇:北京大门生命科学学院唐世明课题组实现清醒猴长时期双光子成像
下一篇:北大生科院王忆平课题组在生物固氮研究领域再次取得突破性进展
(作者:佚名 编辑:南开大学)

我有话说

新文章

门文章