The self-organizing genome: Principles of genome architecture and function
ENCODE:基因组染色质的 “自组织”体系建构特征(Self-Organization) (qq.com)
| ps:自组织其实和复杂系统之中的"涌现"有多大区别?
Architectural features of the genome
基因组的结构特征
| 染色丝质(又叫染色质纤维,chromatin fiber )由包裹在组蛋白八聚体组成的核小体周围的146bps DNA 组成。虽然染色丝质的精确性质还在广泛争论之中,但是最近从几种直接观察的方法(包括使用 EM 断层扫描在完整细胞中观察)得出的观察结果表明染色丝质在整个细胞核中的直径通常为5-24nm,并且不规则地折叠成高阶特征,如loops and domains。我们推测这些染色丝质的小直径和灵活性质是有利于基因组的动态变化,从而允许调控蛋白和 RNA 更容易进入染色质发挥功能。
| 然后染色丝质能够自我相互作用形成环(F1)。染色质环是大多数生物体中基因组的普遍特征,它们以从 kbs 到 Mbs到不同大小不等,,具有多种功能。在最小的尺度上,环介导调节元件(通常是与基因启动子的增强子)在通常10至数百 kbs 的距离上的相互作用。多个增强子可以成环形成被认为整合信号事件或冗余作用于靶基因的超级增强子簇。比较大的环,比如长度可达 Mbs 的大小,有助于基因组的3D 压缩,并且通过上游元件与单个靶基因的序列关联来用于以精确的时间和空间方式调节基因。这种类型的调节在发育调节基因中特别常见,这需要协调和准确的时间和空间的控制。虽然传统上认为环状相互作用,包括启动子-增强子配对,需要两个远距离位点的直接物理相互作用,但是一个新兴的观点是,相分离转录因子的聚集可以将基因组区域变得比较靠近,而不需要直接的染色质-染色质之间的相互作用。
| 基因组组织的下一个层次是染色质结构域chromatin domains(图1)。最早由06年左右的原位杂交实验进行了最初的形态学描述,随后通过09~12年的全基因组生物化学交联方法证实了它们的普遍的存在。自12年被发现之后,基于它们表示优先相互作用而不是与其周围序列相互作用的基因组区域的拥有属性,它们被称为拓扑关联域(TAD)。它们通常大小为数百 kbs左右,通过环挤压机制——也就是cohesin complex 通过其依赖 ATP 的分子运动活性驱动染色质环的形成。然后挤出的环折叠在自身上形成一个结构域,其边界由结构染色质蛋白 CTCF 定义。该模型得到了酵母粘附素体外环状挤出活性的最新证明的支持。关于功能,已经提出结构域边界用于限制调节元件与结构域内基因的相互作用,从而产生调节单位。
● 最近对 TAD 的精细定位揭示了广泛的内部环相互作用的发生,并支持在相同的 TAD 中经常发现局部共调节基因的观点。与此观点一致,TAD 边界的破坏可导致 TAD 内基因的失调。然而,TAD 的强有力的监管作用受到了挑战。增强子对果蝇靶基因作用的系统分析显示,染色质结构域的存在或不存在对基因调控没有强烈的影响。
● 此外,在果蝇胚胎发育过程中染色质结构的深入定位表明,调节性染色质环在 TAD 之前形成 ,并且发育上不同的细胞类型具有显着相似的 TAD 结构(Ing-Simmons 等,2020)。
● 此外,单细胞分析显示,单个细胞之间的 TAD 结构高度可变(Cattoni 等,2017; Finn 和 Misteli,2019; 长野等,2013)。
| 这些发现表明,染色质结构域不是基因功能的强决定因素,但主要为基因的准确调控提供了一个结构框架。理解染色质结构与基因组功能的相关性是该领域当前工作的主要优先事项之一。
[图片上传失败...(image-2da386-1659627799910)]
如上所述,基因组的结构特征现在已经很好地描述了。但它们是怎么来的呢?有几个一般原则,其相互作用导致基因组的主要组织特征的出现(图2)。
[图片上传失败...(image-2ebdb8-1659627799910)]
The interplay of several fundamental principles governs genome organization. (Light blue sector) Polymer-polymer interactions, mediated by chromatin binding proteins (light blue, pink, yellow), promote the formation of chromatin loops and shape the overall conformation of the chromatin fiber. (Pink sector) Chromatin undergoes local motion and chromatin-chromatin interactions are transient. Chromatin proteins (light blue, pink, yellow) undergo rapid cycles of association and dissociation with short residence times. (Purple sector) The process of phase separation involves the homotypic aggregation of proteins (arrows) and contributes to the formation and stabilization of chromatin-chromatin interactions and domains, including eu- and heterochromatin. (Orange sector) The physical interaction of chromatin with stable architectural elements of the nucleus such as the nuclear envelope limits the degree of freedom of a genome region and contributes to its non-random localization. (Green sector) the behavior of individual chromatin regions and genes (red, blue, yellow) varies stochastically in individual cells giving rise to extensive heterogeneity in genome organization and function amongst single cells in a population.
几个基本原理的相互作用支配着基因组的组织。(浅蓝色部分)由染色质结合蛋白(浅蓝色,粉红色,黄色)介导的聚合物-聚合物相互作用促进染色质环的形成并形成染色质纤维的整体构象。(粉色扇区)染色质经历局部运动,染色质-染色质相互作用是短暂的。染色质蛋白(浅蓝色、粉红色、黄色)在短暂的停留时间内经历快速的结合和解离周期。(紫色部分)相分离过程涉及蛋白质的同型聚集(箭头) ,并有助于染色质-染色质相互作用和结构域(包括 eu-和异染色质)的形成和稳定。染色质与核的稳定结构元素(如核膜)的物理相互作用限制了基因组区域的自由度,并有助于其非随机定位。(绿色部分)个体染色质区域和基因(红色,蓝色,黄色)的行为在个体细胞中随机变化,导致基因组组织和群体中单个细胞之间功能的广泛异质性。
[图片上传失败...(image-423d84-1659627799910)]
| 基因组生物学的一个中心问题是,结构特征如何与个体基因和整个基因组的功能相关联。基因组结构与功能之间的相关性比比皆是。最重要的是,异染色质的存在往往与转录抑制有关,启动子增强子环的形成与靶基因的转录激活有关。然而,大多数这些相关性是不完整的,一些观察指出了两个重要的,但仍然不被重视的概念,理解结构和功能的相互作用: 首先,基因组功能是基因组结构的驱动因素; 虽然基因组的结构特征影响其功能,基因组的局部和全球活动也通过反馈机制形成其结构(图5,6 A)。其次,结构特征不是作为二进制开关,而是作为功能调节器,这一点越来越明显(图6B)。结构和功能之间的双向反馈以及建筑基因组特征的调节作用的结合使得基因组功能成为一个整体概率过程(图6C)。
The probabilistic genome: structure-function relationship in the genome
[图片上传失败...(image-45402f-1659627799910)]
The probabilistic genome.
[图片上传失败...(image-760767-1659627799910)]
● (A)染色质结构(蓝色阴影区域)和功能(橙色阴影区域)的双向相互作用。染色质结构影响基因功能(蓝色向前箭头)。染色质结构在浓缩和开放状态之间可逆地振荡,这促进了转录因子(蓝色,黄色)的结合,导致稳定陈述和 RNA 聚合酶(红色)的结合使转录成为可能(绿色弯曲箭头)。相反,转录影响结构(红色反向箭头) ,通过维持一个开放的染色质结构。
● (B)染色质结构不作为确定性的二进制开关,而是作为功能的概率调节器。(绿色面板)在二元开关模型中,给定基因在单个细胞中的表达水平是完全开启的(绿色点)或完全关闭的(红色点) ,反映了单个细胞中基因位点的开放和闭合配置。在调节模型中,基因表达水平在单个细胞中是异质的(红色,绿色点) ,反映了开放和闭合染色质中基因活性的概率性质。可变的表达水平通常是通过实验观察到的。
● (C) 基因表达是一个多步骤的过程,本质上是概率的。激活一个基因所需的每一个步骤都代表了一个生产性事件对基因激活的平衡,而非一个具有一定概率的非生产性事件。
● 可能性1: 染色质重塑因子(蓝色)与其在细胞核内扩散时的短暂相互作用之间的稳定关联。
● 可能性2: 维持去浓缩染色质与回复到浓缩状态。
● 可能性3: 早期转录因子(浅蓝色,黄色)的关联,这促进了额外转录因子与早期转录因子解离的关联的可能性。
● 可能性4: RNA 聚合酶(红色)与活化转录因子缺失的关联。
● 可能性5: 转录激活(弯曲的绿色箭头)与 RNA 聚合酶的非生产性解离。
● 由于每个步骤的概率性质,激活过程作为一个整体是相对低效的,从而产生大多数基因观察到的随机激活模式。
[图片上传失败...(image-ba560c-1659627799910)]
Tom Misteli, Ph.D.
Tom Misteli是基因组细胞生物学领域的国际知名先驱。是美国国立卫生研究院杰出研究员
是受体生物学与基因表达实验室指导员,他在英国伦敦大学和纽约冷泉港实验室接受培训,在那里他开始使用成像方法研究活细胞中的基因组。他的实验室率先使用成像方法研究基因组和基因表达。他的实验室使用细胞生物学,分子,生物化学和成像方法来揭示基因组结构的基本原理,并将这些知识应用于癌症和衰老的新型诊断和治疗策略的开发。他因工作获得了多项奖项,担任多个国家和国际机构的顾问,并担任众多编辑委员会成员。他获得了许多奖项,包括Gian Tondury奖,查尔斯大学黄金奖章,2012 Flemming奖,Wilhem Bernhard奖章和Herman Beerman奖。
基因组组织和核结构的缺陷导致许多人类疾病,包括癌症,神经退行性疾病和肌营养不良症,并且它们与人类衰老有关。我们正在使用几种分化和疾病模型来阐明基因组组织如何促成生理过程和疾病,特别是在癌症和衰老中。他的实验室研究基因组的细胞生物学。将分子技术与活细胞显微镜结合使用,以了解基因组如何在完整细胞中组织,以及基因组的空间组织如何促进其功能。这些研究提供了对基本生物学机制的见解,并为癌症研究中的新型诊断和临床应用奠定了基础。