觉得RNA研究太普通了?来探索一下增强子吧!

Comprehensive landscape of epigenetic-dysregulated lncRNAs reveals a profound role of enhancers in carcinogenesis in BC subtypes

表观遗传失调lncRNAs的综合景观揭示了增强子在BC亚型致癌中的深刻作用

发表期刊:mol ther nucleic acids

发表日期:2021 Jan 1

影响因子:7.032

DOI:  10.1016/j.omtn.2020.12.024


一、研究背景

长非编码RNA(lncRNA)与许多人类癌症有关,包括基因异质性的乳腺癌。根据乳腺癌的基因表达、临床和预后特征,已经确定了不同的乳腺癌分子亚型(腔镜型、基底型、人表皮生长因子受体2(HER2)型和claudin-low型)。

lncRNAs在乳腺癌亚型中经常有不同的表达,lncRNAs的异常表达可能是由表观遗传学模式的改变引起的,如DNA甲基化和翻译后组蛋白修饰的改变。尽管全球表观遗传学异常已被确定为突出的癌症标志,但试图表征表观遗传学改变和lncRNAs表达之间的关系及其在乳腺癌亚型中的预后价值的尝试一直有限。


二、材料与方法 

1 数据来源

1)从ENCODE和GEO(GSE29069和GSE85158)下载乳腺癌细胞系(MCF-7、HCC1954和MDA-MB-231)的6种组蛋白修饰数据(包括H3K27ac、H3K27me3、H3K36me3、H3K4me1、H3K4me3和H3K9me3)(代表了腔内(MCF-7)、基底(HCC1954)和claudin-low(MDA-MB-231)亚型)(351个腔隙亚型样本和93个基底亚型样本)。从TCGA下载人类乳腺上皮细胞(HMECs)用作对照细胞系(n=29)。

2)RNA-seq数据:GEO(GSE37918、GSE58135、GSE72141、GSE59335、GSE68248、GSE72524、GSE80409、GSE84577、GSE85579和GSE91395)中下载,共23个claudin-low亚型样品和25个对照样品。

3)TCGA中获取了565个腔镜亚型样本、137个基底乳腺癌和34个正常组织的DNA甲基化数据。

 2 分析流程

1)表观遗传失调的lncRNAs和PCG的识别:标准为(1)lncRNAs和PCGs在乳腺癌亚型中差异表达(DESeq2);(2)它们的启动子或增强子(MACS2工具)至少与一个DHMR或DMR(R包DMRcate)重叠;(3)调控元件的组蛋白修饰和DNA甲基化改变与基因的表达变化对应。

2)鉴定lncRNA调节因子:使用pls软件包构建部分最小二乘回归模型,具有显著系数(FDR<0.05)的lncRNA被确定为lncRNA调节因子。

3)共表达网络和功能富集分析:乳腺癌亚型构建lncRNA-PCG共表达网络。基于GO注释术语进行功能富集分析(R包clusterProfiler)。

4)鉴定lncRNA生物标志物:对协变量进行多变量Cox比例危险回归分析。根据lncRNA-PCG共表达网络,使用R软件包biclique将模块识别为lncRNA相关的模块。对模块中的PCG和lncRNA进行单变量Cox回归分析,得到系数加权的表达值的线性组合。

5)细胞系处理:人乳腺癌细胞系MDA-MB-468从中国科学院细胞库(中国上海)获得(CCK-8检测、qRT-PCR、Western blot)。


三、结果展示

01 - 识别乳腺癌亚型中表观遗传失调的lncRNAs和蛋白编码基因(PCG)

作者的目标是分析乳腺癌亚型中lncRNA表达和表观遗传学改变之间的关系。使用DEseq进行差异基因分析,还系统分析了乳腺癌亚型和正常样本之间的差异组蛋白修饰区域和DNA甲基化。当至少一个DHMR或差异甲基化区域(DMR)位于差异表达的lncRNA的启动子或增强子中,并且当活性(或抑制性)表观遗传标记的失调模式有助于同一(或反向)方向的转录失调时,一个表观遗传失调的lncRNA(术语为epi-lncRNA)被识别出来(图1A)。

确定了65,553和1,197个epi-lncRNAs分别在腔内,基底和claudin-low亚型中具有不同的组蛋白修饰。在基底亚型和腔内亚型中分别有196个和36个表观-lncRNAs具有差异性的DNA甲基化。在腔内、基底和claudin-low亚型中分别发现了370个、884个和4139个epi-PCG。lncRNAs在乳腺癌中表现出的异常频率远低于PCG(图1B)。

使用Lnc2Cancer v2.0进行分析,epi-lncRNAs显著富集于已知的癌症lncRNAs。,13个,69个和96个epi-lncRNAs分别在腔内,基底和claudin-low亚型,是已知与人类癌症相关的lncRNAs(图1C)。

作者观察到LINC01016近端增强子区域的H3K27ac、H3K4me1和H3K4me3水平显著增加,从而导致LINC01016显著上调(图1D和1E)。在基底亚型的SNHG12的增强子区域观察到H3K4me3信号的显著增强,从而导致SNHG12的显著上调(图1D和1E)。这些观察表明,几种乳腺癌lncRNAs在其增强子区域受到表观遗传失调。

图1 乳腺癌亚型中表观遗传失调的lncRNAs

此外,还利用部分最小二乘回归探讨了lncRNA对lncRNA表达的调控。在腔内、基底和claudin-low亚型中分别发现了98个、25个和87个lncRNA调节子。一些lncRNA调节子是已知的癌症基因。

02 - 表观遗传学失调lncRNAs的基因组信号表征

作者比较了epi-lncRNAs和其他lncRNAs的基因、外显子、内含子和异构体的数量和长度,以表征表观遗传失调lncRNAs的基因组特征。epi-lncRNAs藏有较长的外显子、内含子和基因长度,以及更高的外显子、内含子和异构体数量(图S1A)。epi-PCG表现出与epi-lncRNAs相似的结构特征,除了外显子和内含子长度。此外,与具有不同异常表观遗传修饰的lncRNA相比,H3K4me1失调的lncRNA具有较高的外显子数和较长的内含子和基因长度(图S1B)。

图S1 表观遗传失调lncRNAs的基因组特征

epi-lncRNAs根据其与PCG的关系被分为五类:基因间、重叠、部分重叠、内含子或外显子。859个和27个表观lncRNAs分别属于基因间lncRNAs和重叠lncRNAs。结构分析显示,表观遗传失调的重叠lncRNAs具有较高的外显子、内含子和异构体数量,较长的内含子和基因长度,较短的外显子长度(图S2A)。

与所有三种乳腺癌亚型中的其他lncRNAs相比,表观遗传失调的lncRNAs显示出实质上更高的表达水平和更低的表达变异。观察到与其他PCG相比,表观遗传失调的PCG在基底型和claudin-low亚型中表现出更高的表达水平和更低的表达变异(图S2B)。

图S2 表观遗传失调lncRNAs的基因组特征

03 - 导致癌症亚型特异功能的增强子元素的表观遗传失调的lncRNAs

epi-lncRNAs的基因组分布显示,增强子内异常组蛋白修饰H3K27ac、H3K4me3和H3K4me1主要导致基底亚型lncRNAs失调。增强子区H3K27ac失调的lncRNAs和H3K4me1失调的lncRNAs都与细胞周期、免疫系统过程和细胞通讯的调控有关(图2A)。腔隙亚型中的外延lncRNAs主要与增强子元件的H3K27ac、H3K36me3和H3K4me3失调有关,主要影响参与坏死过程的ripoptosome组装(图2B)。claudin-low亚型的epi-lncRNAs主要受H3K27ac和H3K27me3在增强子元件的调控,影响了大量的基本生物学功能,包括大分子代谢、细胞大分子生物合成和细胞蛋白修饰过程(图2C)。总体而言,乳腺癌亚型中的外显性lncRNAs主要与增强子元件内的H3K27ac失调(67.16%)有关(图2D)。

根据这些lncRNAs的表达情况,利用欧氏距离对乳腺癌样本进行了无监督的分层聚类分析。发现这些lncRNAs的表达,尤其是对于H3K4me1-、H3K4me3-和H3K27me3-失调lncRNAs的表达,可以用来区分乳腺癌样本的PAM50亚型,这表明增强子元件处的表观-lncRNAs可能有助于这些亚型的独特生物学特征。然而,H3K4me1-、H3K4me3-和H3K27me3-失调的增强子元件的lncRNAs能够区分腔隙亚型和基底亚型和claudin-low亚型(图2E)。

图2 epi-lncRNAs的亚型特异功能

04 - 表观遗传失调lncRNAs的景观揭示了癌症的亚型特异性模式

作者系统地分析了不同乳腺癌亚型的表观遗传失调lncRNAs,揭示了增强子相关的表观遗传失调lncRNAs的景观。92.59%的epi-lncRNAs呈现亚型特异性模式(图3A和3B)。75.38%的表观-lncRNAs在腔内亚型中显示出亚型特异性模式;79.02%的基底亚型中的epi-lncRNAs显示出亚型特异性模式;89.81%的laudin-low亚型中的表观-lncRNAs表现出亚型特异性模式(图3C)。

图3 具有差异性组蛋白修饰的lncRNAs景观揭示了癌症亚型的高度特异性模式

此外,少量lncRNA在多种乳腺癌亚型中存在表观遗传失调,这表明这三种亚型共享一些分子机制。然而,这三种亚型中相同的lncRNA被不同类型的表观遗传学调控以亚型特异性的方式改变。基底型和Claudin-low亚型有最多的表观lncRNAs的共同点(图3A),这一结果与之前的研究一致,即 claudin-low亚型与基底样乳腺癌相似。

在本研究中,作者观察到其启动子区域的H3K27me3升高,导致其在 claudin-low亚型中显著下调(图S4A和S4B)。然而,还观察到基底亚型中其增强子区域的H3K27ac升高,H3K27me3降低,导致其上调。在另一个例子中,RP11-395G23.3、CASC8、APCDD1L-AS1和RP11-154D17.1是三种癌症亚型中常见的lncRNA。观察到腔镜亚型中启动子元件的H3K27ac和H3K36me3表达下调,H3K36me3下降,但基底亚型中增强子元件的H3K27ac、H3K4me1和H3K4me3表达上调,H3K27ac和H3K27me3增强子元件的H3K27ac下降(图S4B和S4C)。

图S4 不同乳腺癌亚型中常见的epi-lncRNAs的例子

05 - 增强子元件的表观遗传失调lncRNA与乳腺癌亚型的疾病预后相关

为了深入了解增强子元件处H3K27ac失调的潜在预后价值,使用多变量Cox回归分析分析了DNA甲基化相关lncRNAs和lncRNA调节剂。发现6个增强子相关的外显子lncRNA在基底亚型中具有不同的组蛋白修饰(LINC00393、KB-1836B5.1、CASC11、RP1-140K8.5、AC005162.1和AC020916.2),并且能够显著区分高危组和低危组患者的总生存率。

作者在LINC00393和KB-1836B5.1的增强子元件处观察到H3K27ac和H3K4me1升高,这有助于它们的上调表达(图4A-4D)。LINC00393或KB-1836B5.1的高表达组在基底亚型中的生存时间显著缩短(图4C)。在CASC11的增强子区域观察到H3K27ac、H3K4me1和H3K4me3信号的显著增强,这导致CASC11显著上调(图4B-4D)。CASC11的高表达组比低表达组的存活时间更短(图4C)。此外,还发现了3个基底亚型的生物标志物,包括保护因子RP1-140K8.5、AC005162.1和危险因子AC020916.2。在RP1-140K8.5和AC005162.1的增强子元件处观察到H3K27ac和H3K4me1升高,这有助于它们的上调(图4B-4D)。

作者进一步研究了C646(一种组蛋白乙酰转移酶CREBBP/EP300抑制剂)治疗对人乳腺癌(MDA-MB-468)细胞中6个H3K27ac失调lncRNAs表达的影响。抑制CREBBP/EP300组蛋白乙酰转移酶的活性导致活性增强子标记H3K27ac的显著损失(图4E)。实时聚合酶链反应(PCR)结果显示,与未处理的细胞相比,用20μM C646在MDA-MB-468细胞中处理24小时,显著降低了LINC00393、KB-1836B5.1、RP1-140K8.5、AC005162.1和AC020916.2的表达水平(图4F)。CREBBP/EP300敲除导致MDA-MB-468细胞的生长以剂量依赖性方式被显著抑制(图4G)。

此外,还发现了3个具有差异性DNA甲基化的epi-lncRNAs(SLC26A4-AS1、CTC-303L1.2和RP11-738B7.1),这些epi-lncRNAs可以显著影响基底亚型乳腺癌患者的生存(图4B和4C)。作者获得了42个三阴性乳腺癌临床样本和21个相邻非肿瘤组织的RNA测序(RNA-seq)数据集(GSE58135),进一步验证了独立临床样本中lncRNA的表达模式。验证了77.8%(9个中的7个)epi-lncRNA的表达变化(图S5A)。

图4 增强子元件的表观遗传失调lncRNA与基底亚型的预后相关

在腔镜亚型中,发现了一个具有差异性DNA甲基化的epi-lncRNA(LINC01983)和四个lncRNA调节因子(UCA1、RP11-221J22.2、RP11-221J22.1和RP1-212P9.3),它们显著影响了患者的生存(图5A和5B)。此外,在腔内亚型中,没有发现任何与生存相关的表层lncRNAs具有差异性组蛋白修饰。作者探索了这些epi-lncRNA相关模块的预后价值。确定了三个模块,包括epi-lncRNAs(KCNC4-AS1和APCDD1L-AS1),作为腔镜亚型的预后生物标志物。功能分析表明,这两个lncRNA通过调节STAG2、JAG2、VAMP8、HMGB1和LITAF等基因,参与炎症反应、细胞凋亡、细胞分裂、细胞通信和核因子κB(NF-κB)信号的调控(图5C)。这些模块中的每一个模块都能够显著区分高危组和低危组患者在腔镜亚型中的总体生存率(图5D)。使用GSE58135的RNA-seq数据集,以进一步验证独立临床样本中lncRNA的表达模式。检测到的66.7%(6个中的4个)的lncRNA的表达变化得到验证(图S5B)。

图5 增强子元件的表观遗传失调lncRNA与腔内亚型的预后有关
图S5 证实基底层中选定的lncRNAs的差异性表达

四、结论

总之,本研究分析了lncRNA表达和表观遗传学改变之间的关系,并探讨了它们在乳腺癌亚型患者中的预后价值。6个增强子相关的H3K27ac失调的lncRNA、4个DNA甲基化失调的lncRNA和4个lncRNA调节剂可以作为乳腺癌亚型的预后生物标志物。抑制组蛋白乙酰转移酶CREBBP和EP300后,增强子相关的H3K27ac-dysregulated lncRNAs的表达水平被下调。抑制这些lncRNA的表达有可能作为乳腺癌的长期治疗手段。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,670评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,928评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,926评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,238评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,112评论 4 356
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,138评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,545评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,232评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,496评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,596评论 2 310
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,369评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,226评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,600评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,906评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,185评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,516评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,721评论 2 335

推荐阅读更多精彩内容