Basic Information
- 英文标题: Comprehensive molecular characterization of human colon and rectal cancer
- 中文标题:人类结肠和直肠癌的综合分子特征
- 发表日期:18 July 2012
- 文章类型:Article
- 所属期刊:Nature
- 文章作者:The Cancer Genome Atlas Network
- 文章链接:https://www.nature.com/articles/nature11252
Abstract
- 为了表征结直肠癌中的体细胞变异,我们对276个样本进行了全基因组规模的分析,包括外显子序列、DNA拷贝数、启动子甲基化以及信使RNA和微RNA的表达。
- 其中一部分样本(97个)还进行了低覆盖度的全基因组测序。
- 总体而言,16%的结直肠癌被发现具有高度突变:其中四分之三的样本表现出预期的高微卫星不稳定性,通常伴有高甲基化和MLH1沉默,而剩余四分之一的样本则存在体细胞错配修复基因和聚合酶ε(POLE)突变。
- 排除高度突变的癌症后,我们发现结肠癌和直肠癌具有相当相似的基因组变异模式。
- 共有24个基因显著突变,除了预期中的APC、TP53、SMAD4、PIK3CA和KRAS突变之外,我们还发现了ARID1A、SOX9和FAM123B的频繁突变。
- 重复发生的拷贝数变异包括潜在可作为药物靶点的ERBB2扩增和新发现的IGF2扩增。
- 重复发生的染色体易位包括NAV2与WNT信号通路成员TCF7L1的融合。
- 综合分析提示了侵袭性结直肠癌的新标志物,并表明MYC指导的转录激活和抑制具有重要作用。
Main
- 癌症基因组图谱项目计划对20种不同类型的癌症进行基因组变化分析,并且迄今已发布了两种癌症的研究成果。
- 现在我们展示对人类结直肠癌(CRC)进行多维度分析的结果。
- CRC 是癌症死亡率和发病率的重要因素。
- 结肠与直肠的区别主要基于解剖学,但它对治疗管理和放射治疗均有影响,并可能影响预后。
- 大多数研究者从生物学角度将CRC分为微卫星不稳定(MSI;主要位于右半结肠,常与CpG岛甲基化表型(CIMP)和高突变率相关)和微卫星稳定但染色体不稳定的两种类型。
- 一系列丰富的研究(有关综述可参见参考文献3)揭示了几个在结直肠癌(CRC)发生和发展中至关重要的基因和途径。
- 这些包括WNT、RAS-MAPK、PI3K、TGF-β、P53和DNA错配修复途径。
- 大规模测序分析已经鉴定出许多反复突变的基因和一种反复发生的染色体易位。
- 尽管有了这些背景知识,我们尚未获得关于遗传和基因组变化及其对结直肠肿瘤发生的意义的全面综合理解。
- 对这些变化的进一步了解可能会使我们更深入地理解CRC的病理生理学,并可能确定潜在的治疗靶点。
Results
- 肿瘤和正常样本对通过不同平台进行分析。具体通过每个平台分析的样本数量见补充表1。
- 补充表1展示了通过各个平台分析的具体样本数量。
Exome-sequence analysis
外显子序列分析
- 为了定义突变谱,我们对224对肿瘤和正常样本进行了外显子捕获DNA测序(所有突变均列于补充表2中)。
- 测序实现了针对至少80%的目标外显子超过20倍的覆盖度。
- 体细胞突变率在样本间变化很大。
- 一些样本的突变率低于每106个碱基1个,而少数样本的突变率高于每106个碱基100个。
- 我们将突变率低于每106个碱基8.24个的病例(占84%)与突变率高于每106个碱基12个的病例分开,后者的平均总突变数为728,我们将其指定为高突变型(图1)。
Figure 1: Mutation frequencies in human CRC.
- 224名患者的每个肿瘤样本中的突变频率。注意高度突变和非高度突变样本的明显分离。红色表示MSI高、CIMP高或MLH1沉默;浅蓝色表示MSI低或CIMP低;黑色表示直肠;白色表示结肠;灰色表示无数据。插图显示了高度突变样本中的错配修复基因和POLE的突变。样本的顺序与主图相同。
- 高度突变和非高度突变肿瘤中显著突变的基因。蓝色条形代表通过MutSig算法识别出的基因,黑色条形代表通过手动检查序列数据识别出的基因。
- 为了评估显著不同的突变率的基础,我们评估了微卫星不稳定性(MSI7)以及DNA错配修复途径基因MLH1、MLH3、MSH2、MSH3、MSH6和PMS2中的突变8,9,10。
- 在拥有完整数据集的30个高突变肿瘤中,23个(77%)具有高水平的微卫星不稳定性(MSI-H)。
- 其中包括19个具有MLH1甲基化的肿瘤,其中17个具有CIMP。
- 相比之下,其余七个高突变肿瘤,包括六个突变率最高的肿瘤,缺乏MSI-H、CIMP或MLH1甲基化,但通常有一个或多个错配修复基因的体细胞突变或POLΕ异常,而在非高突变肿瘤中这些异常很少见(图1)。
Gene mutations
基因突变
- 总体而言,我们在高突变和非高突变癌症中鉴定了32个体细胞反复突变基因(由MutSig11和人工策展定义)(图1b)。
- 去除未表达基因后,高突变和非高突变癌症中分别剩下15和17个基因(图1b;完整列表见补充表3)。
- 在非高突变肿瘤中,突变频率最高的八个基因是APC、TP53、KRAS、PIK3CA、FBXW7、SMAD4、TCF7L2和NRAS。
- 正如预期,突变的KRAS和NRAS基因通常具有致癌的第12和13密码子或第61密码子突变,而其余基因则具有失活突变。
- CTNNB1、SMAD2、FAM123B(也称为WTX)和SOX9也被频繁突变。
- FAM123B是一个X连锁的WNT信号通路负调控因子,几乎所有的突变都是功能丧失型。
- SOX9是肠干细胞龛中细胞分化重要基因,其突变此前尚未与人类癌症相关联,但在非高突变CRC中的九个突变等位基因均为移码或无义突变。
- 抑癌基因ATM和ARID1A也有不成比例的高数量的移码或无义突变。
- 最近有关ARID1A的突变已在CRC和其他多种癌症中被报道。
- 在高突变肿瘤中,ACVR2A、APC、TGFBR2、MSH3、MSH6、SLC9A9和TCF7L2是突变的常见靶点(图1b),大部分突变为BRAF(V600E)。
- 然而,在非高突变癌症中频繁突变的两个基因,在高突变肿瘤中的突变频率显著降低:TP53(60%对比20%,P < 0.0001)和APC(81%对比51%,P = 0.0023;两者均采用费舍精确检验)。
- 其他基因,包括TGFBR2,在高突变癌症中反复发生突变,但在非高突变样本中则没有。
- 这些发现表明,高突变与非高突变肿瘤通过不同的遗传事件序列进展。
- 正如预期,具有 MLH1 基因沉默和高度微卫星不稳定性(MSI-H)的高突变肿瘤在突变特征上显示出额外的差异。
- 当我们特别检查了含有长单核苷酸重复序列的 28 个基因时,我们发现框移突变率比没有 MLH1 基因沉默的高突变肿瘤高出 3.6 倍,比非高甲基化肿瘤高出 50 倍。(补充表 2)。
Mutation rate and methylation patterns
突变率和甲基化模式
- 如上所述,结肠和直肠肿瘤患者的管理方式不同,流行病学也突显了这两者之间的差异。
- 对132例结肠和62例直肠肿瘤的微卫星不稳定性(MSI)状态、体细胞拷贝数变异(SCNAs)、CIMP状态及基因表达谱进行初步综合分析,使我们能够探究这两个部位肿瘤可能存在的生物学差异。
- 然而,在非高度突变的肿瘤中,结肠癌和直肠癌之间在拷贝数变化、CIMP、mRNA和miRNA的整体模式上并无显著区别(图2)。
- 基于这一结果,我们将两者合并进行了后续所有分析。
Figure 2: Integrative analysis of genomic changes in 195 CRCs.
- 高突变肿瘤具有近二倍体基因组,并且高度富集了高甲基化、CIMP表达表型以及BRAF(V600E)突变。
- 非高突变肿瘤来源于不同部位,根据它们的拷贝数改变模式、DNA甲基化或基因表达模式,它们彼此之间几乎无法区分。
- 22条常染色体的拷贝数变化以红色色调表示拷贝数增加,蓝色色调表示拷贝数减少。
- PowerPoint幻灯片
- 对236个结直肠肿瘤的启动子DNA甲基化谱进行无监督聚类分析,确定了四个亚组(补充图1及补充方法)。
- 其中两个聚类包含甲基化率升高的肿瘤,根据之前的描述被分类为CIMP高和CIMP低。
- 两个非CIMP聚类主要来自非高度突变且来源于不同解剖位置的肿瘤。
- mRNA表达谱将结直肠肿瘤分为三个不同的聚类(补充图2)。
- 其中一个聚类与CIMP-高肿瘤显著重叠(P = 3 × 10^-12),并且富含高度突变的肿瘤,而另外两个聚类在甲基化数据中没有对应任何一组。
- 通过无监督聚类分析miRNA表达(补充图3)未能明确区分直肠癌与非高度甲基化的结肠癌
Chromosomal and sub-chromosomal changes
染色体和亚染色体变化
- 总共使用阿法梅特里克斯 SNP 6.0 芯片对 257 个肿瘤进行了 SCNA 分析。
- 其中 97 个肿瘤还通过低深度覆盖(低通)全基因组测序进行了分析。
- 正如预期的那样,高度突变的肿瘤具有少得多的 SCNA(图 2)。
- 微卫星稳定和不稳定的高度突变肿瘤之间没有发现差异(补充图 4)。
- 我们使用 GISTIC 算法来识别焦点改变的可能基因靶点。
- 有几个之前已经明确界定的染色体臂变化,包括 1q、7p 和 q、8p 和 q、12q、13q、19q 以及 20p 和 q 的增益。
- 显著缺失的染色体臂包括含有 SMAD4 的 18p 和 q,在 66% 的肿瘤中发生。
- 另外显著缺失的染色体臂还包括含有 TP53 的 17p 和 q,在 56% 的肿瘤中发生。
- 其他显著缺失的染色体臂还包括 1p、4q、5q、8p、14q、15q、20p 和 22q。
- 我们确定了28个复发性缺失峰(补充图4和补充表4),包括位于潜在基因组脆弱位点的大基因足迹基因FHIT、RBFOX1和WWOX,存在于近二倍体高突变肿瘤中。
- 其他焦点缺失涉及肿瘤抑制基因,如SMAD4、APC、PTEN和SMAD3。
- 10p25.2的一个显著焦点缺失跨越了四个基因,其中包括TCF7L2,该基因在我们的数据集中也频繁发生突变。
- 通过一个内部缺失,在3%的CRC中发现了相邻基因VTI1A和TCF7L2之间的基因融合,并且这种易位对于携带该易位的CRC细胞的存活是必需的4。
- 存在17个显著的焦点扩增区域(补充表4)。
- 其中一些位于染色体臂的广泛获得之上,包括位于13q12.13附近的丝氨酸蛋白酶编码基因USP12附近的峰值以及距离结直肠癌候选致癌基因CDK8约500 kb的另一个峰值;
- 相邻的13q12上的一个峰值;
- 包含KLF5的13q22.1上的一个峰值;
- 以及位于HNF4A附近的20q13.12上的一个峰值。
- 8号染色体上的峰值包括含有组蛋白甲基转移酶编码基因WHSC1L1的8p12(该基因邻近FGFR1)以及含有MYC的8q24。
- 在4%的肿瘤中发现的一个17q21.1扩增子包含七个基因,其中包括酪氨酸激酶ERBB2。
- ERBB2扩增已在结肠、乳腺和食管-胃肿瘤中被描述。
- 具有这些扩增的乳腺癌和胃癌已通过抗ERBB2抗体曲妥珠单抗得到有效治疗。
- 最常见的焦点扩增之一发生在约7%的肿瘤中,即染色体臂11p15.5上一个100-150kb区域的增益。这一区域包含编码胰岛素(INS)、类胰岛素生长因子2(IGF2)和酪氨酸羟化酶(TH)的基因,以及嵌入IGF2中的miR-483(图3a)。我们发现IGF2和miR-483的表达升高,而INS和TH则没有(图3b、c)。
- 与扩增区域紧邻的是ASCL2,这是一种在确定肠干细胞命运中活跃的转录因子。尽管先前的研究认为ASCL2可能是结直肠癌中扩增的目标,但它始终位于扩增区域之外,并且其表达与拷贝数变化无关。
- 这些观察结果表明,IGF2和miR-483是11p15.5扩增可能的功能性靶点。通过印记丢失导致的IGF2过度表达已被认为与结直肠癌的发生有关。miR-483也可能在结直肠癌发病机制中发挥作用。
Figure 3: Copy-number changes and structural aberrations in CRC.
- 11p15.5 焦点放大。显示了来自单核苷酸多态性(SNP)阵列和低通全基因组测序(WGS)的分段DNA拷贝数数据。每一行代表一个患者;放大区域用红色表示。
- IGF2 和 miR-483 的表达水平与拷贝数变化的相关性。
- IGF2 放大和过度表达与 PI3K 信号相关基因的改变是互斥的。
- NAV2–TCF7L2 融合的反复出现。显示了这两个基因的结构、导致转位的断裂点位置以及带有融合的所有肿瘤的环状重排表示。红色线条代表 NAV2–TCF7L2 融合,黑色线条代表其他重排。内环代表拷贝数变化(蓝色表示丢失,粉色表示增益)。
- 一组没有 IGF2 扩增的肿瘤(15%)也表现出显著较高的 IGF2 基因表达水平(高达100倍的增加),这一效应不能归因于 IGF2 启动子处的甲基化变化。
- 为了评估 IGF2 扩增/过表达的背景,我们使用 MEMo 方法系统地寻找相互排斥的基因组事件。
- 我们发现 IGF2 过表达与已知激活 PI3K 通路的基因组事件几乎完全排他(校正后的 P 值小于 0.01),这些事件包括 PIK3CA 和 PIK3R1 的突变或 PTEN 的缺失/突变(图 3c 和补充表 5)。
- 编码连接 IGF1R(IGF2 受体)与 PI3K 的蛋白质的 IRS2 基因位于第 13 号染色体上,该染色体在结直肠癌中经常获得。
- IGF2 过表达病例与 IRS2 表达最高的病例是相互排斥的(P = 0.04),并且这些病例也没有 PI3K 通路中的突变(P = 0.0001;图 3c)。
- 这些结果强烈表明,在结直肠癌中,IGF2-IGF1R-IRS2 轴向 PI3K 发送信号,并暗示针对该通路的治疗可能在这一患者亚群中阻止 PI3K 活性。
Translocations
移位
- 为了识别新的染色体易位,我们对97个带有匹配正常样本的肿瘤进行了低通、配对末端、全基因组测序。
- 每例样本我们都达到了大约3到4倍的序列覆盖度,相应的物理覆盖度为7.5到10倍。
- 尽管基因组覆盖率较低,但我们检测到了250个候选的染色体间易位事件(范围,每个肿瘤0-10个)。
- 其中,212个事件的一个或两个断裂点位于基因间区域,而剩下的38个事件将两个基因的编码区置于假定的融合事件中,其中18个被预测为框内事件(补充表6)。
- 我们发现了三个独立案例,在这些案例中,11号染色体上的NAV2基因的前两个外显子与2号染色体上的TCF7L1的3′编码部分相连(补充图5)。
- TCF7L1编码TCF3,TCF3是与核β-连环蛋白异二聚化的TCF/LEF类转录因子家族成员之一,能够使β-连环蛋白介导的转录调控成为可能。
- 有趣的是,在所有这三个案例中,预测的NAV2-TCF7L1融合蛋白结构缺少TCF3的β-连环蛋白结合域。
- 这种易位类似于在结直肠癌中识别出的另一种复发性易位,即VTI1A的氨基端与TCF4融合,TCF4由TCF7L2编码,TCF7L2是TCF7L1的同源物,在12%的非高突变肿瘤中被删除或突变4。
- 我们还观察到了涉及位于22号染色体上的TTC28的21个易位案例(补充表6)。
- 所有这些融合事件均预测会导致TTC28失活,TTC28已被鉴定为P53的目标和肿瘤细胞生长的抑制剂30。
- 通过获得PCR产物或在某些情况下测序连接片段,验证了19个基因-基因易位中的11个(58%)(补充图5)。
Altered pathways in CRC
CRC中的改变途径
- 对195个拥有完整数据的肿瘤进行突变、拷贝数和mRNA表达变化的综合分析,加深了我们对一些明确定义的通路如何失调的理解。
- 我们将样本按高突变状态分组,并发现了WNT、MAPK、PI3K、TGF-β和p53通路中的反复改变(图4,补充图6和补充表1)。
Figure 4: Diversity and frequency of genetic changes leading to deregulation of signalling pathways in CRC.
- 具有完整数据的非高突变(nHM;n = 165)和高突变(HM;n = 30)样本被分别分析。
- 变异由体细胞突变、纯合缺失、高水平焦点扩增定义,并且在某些情况下,通过基因表达的显著上调或下调(如 IGF2、FZD10、SMAD4)来定义。
- 变异频率以所有案例的百分比形式表示。
- 红色表示激活的基因,蓝色表示失活的基因。
- 底部面板显示了每个样本中,在本图描述的五条通路中是否至少有一个基因发生变异。
- PowerPoint 幻灯片
- 我们发现93%的肿瘤中WNT信号通路发生了改变,包括APC基因的双等位基因失活(补充表7)或CTNNB1激活突变,约占80%的病例。
- 还发现了SOX9突变,以及TCF7L2中的突变和缺失,此外还有DKK家族成员、AXIN2、FBXW7(补充图7)、ARID1A和FAM123B(后者是WNT-β-连环蛋白信号传导的负调控因子,在Wilms瘤中被发现突变)的突变。
- 之前在结直肠癌中已经描述了FAM123B的一些突变。
- 有人认为SOX9在癌症中有一定作用,但在此之前尚未报道过其突变。
- WNT受体frizzled(FZD10)在约17%的样本中过度表达,有时表达水平比正常高出100倍。
- 总体而言,我们发现了16种不同的WNT通路基因改变,证实了该通路在结直肠癌中的重要性。
- 有趣的是,许多这些改变出现在携带APC突变的肿瘤中,这表明影响WNT信号通路的多个病变赋予了选择优势。
- PI3K和RAS-MAPK途径中的遗传改变在结直肠癌中很常见。
- 除了IGF2和IRS2的过度表达外,我们在非高度突变肿瘤中分别发现了2%的PIK3R1和15%的PIK3CA相互排斥的突变以及4%的PTEN缺失。
- 我们发现55%的非高度突变肿瘤中存在KRAS、NRAS或BRAF的改变,并且存在显著的相互排斥模式。
- 我们还评估了红细胞白血病病毒致癌基因同源物(ERBB)家族受体中的突变,因为这类突变具有重要的转化意义。
- 在165例非高度突变病例中有22例(13%)和30例高度突变病例中有16例(53%)存在ERBB家族四个基因之一的突变或扩增。
- 其中一些突变被列在COSMIC数据库中,表明它们具有功能性作用。
- 有趣的是,在四例非高度突变病例中发现了重复的ERBB2(V842I)突变,而在两例非高度突变病例中发现了ERBB3(V104M)突变。
- ERBB2的突变和局灶性扩增(补充图6)应当作为预测针对这些受体的药物反应的指标进行评估。
- 我们在三分之一的肿瘤中观察到RAS和PI3K途径改变的同时发生(图4;P=0.039,费希尔精确检验)。
- 这些结果表明,为了达到治疗效果可能需要同时抑制RAS和PI3K途径。
- 已知TGF-β信号传导途径在结直肠癌和其他癌症中失调34。
- 我们发现非高度突变肿瘤中有27%,高度突变肿瘤中有87%存在TGFBR1、TGFBR2、ACVR2A、ACVR1B、SMAD2、SMAD3和SMAD4的基因组改变。
- 我们也评估了p53途径,在非高度突变病例中有59%发现了TP53的改变(主要是双等位基因改变;补充表8)。
- 在7%的病例中发现ATM发生改变,ATM是一种激酶,在DNA损伤后磷酸化并激活P53。
- 这两种基因的改变显示出趋向于相互排斥的趋势(P = 0.016)(图4,补充图6和补充表1)。
- 我们利用PARADIGM软件平台整合了拷贝数、基因表达、甲基化和通路数据。
- 分析显示了CRC的一些新特征(图5a)。
- 例如,尽管这些肿瘤在解剖起源或突变水平上存在多样性,但几乎100%的肿瘤都有MYC转录靶标的改变,包括那些被MYC促进和抑制的靶标。
- 这些发现与从遗传改变中推断出的模式一致,并提示MYC在CRC中发挥重要作用。
- 分析还确定了几种在所有肿瘤样本中改变的基因网络,以及在高突变与非高突变样本中差异改变的基因网络(补充表7,癌症基因组图谱出版网页上的补充数据)。
Figure 5: Integrative analyses of multiple data sets.
- a, 通过 PARADIGM 分析推导出的结肠和直肠肿瘤中受影响的基因和通路的聚类。蓝色表示相对于正常组织低表达,红色表示相对于正常组织高表达。通过这种方法推导出的一些通路显示在右侧。NHEJ,非同源末端连接。
- b, 与肿瘤侵袭性相关的基因表达特征和结构拷贝数异常。根据选定的临床检测方法(列),与肿瘤侵袭性具有统计学显著关联的分子特征(行)以颜色显示,其中红色表示肿瘤侵袭性的标志物,蓝色表示侵袭性较小的肿瘤的标志物。
- 显著性基于加权费舍尔方法得出的综合P值,并对多重检验进行了校正。颜色强度和得分与个体临床-分子关联的强度一致,并与该关联的对数P值成比例,其中P是该关联的P值。
- 为了限制图的垂直范围,基因表达特征被限定在综合P值小于10-9,而结构拷贝数异常则限定在P值小于10-7,且仅显示在非MSI-H样本子集中同样显著的特征(分析分别在完整数据以及MSI-H和非MSI-H子组上进行)。
- 因为本研究使用的大多数肿瘤样本来自前瞻性收集,所以没有生存数据。
- 但是,可以根据手术时的肿瘤分期、淋巴结状态、远处转移和血管侵犯将肿瘤分类为侵袭性或非侵袭性。
- 我们发现了与肿瘤侵袭性相关的众多分子特征,其中一部分如图5b所示。
- 这些特征包括特定的焦点扩增和缺失,以及基因表达水平的变化,其中包括SCN5A,据报道它是结肠癌侵袭性的调节因子(参见补充表10和11获取完整列表)。
- 与肿瘤侵袭性相关的还有miRNA的表达变化和某些体细胞突变(APC、TP53、PIK3CA、BRAF和FBXW7;补充图8b)。
- FBXW7的突变(38例)和远处转移(32例)从未同时发生(P = 0.0019)。
- 有趣的是,一些基因组区域存在多个与肿瘤侵袭性相关的分子特征,表现为临床相关的基因组热点。
- 这方面的例子是20q13.12区域,它包含一个焦点扩增和多个与肿瘤侵袭性相关的基因,以及含有APOL6的22q12.3区域(补充图8和9)
Discussion
- 这项对224对结直肠肿瘤和正常样本进行的综合性整合分析为我们提供了关于CRC生物学的多个见解,并确定了潜在的治疗靶点。
- 为了识别结肠和直肠肿瘤可能存在的生物学差异,我们在非高度突变的肿瘤中发现了相同类型的拷贝数变化、表达谱、DNA甲基化和miRNA变化,无论它们的解剖起源如何。
- 超过94%的样本在一个或多个WNT信号通路成员中存在突变,主要发生在APC基因中。
- 然而,在右侧结肠和其他所有部位的肿瘤之间存在一些差异。
- 右侧结肠中的高甲基化更为常见,且三分之二的高突变样本来自同一部位,尽管并非所有样本都有MSI(图2)。
- 为什么大多数高突变样本来自右侧结肠以及为什么该部位存在两种类型的肿瘤尚不清楚。
- 结肠来源于胚胎中期和后期肠道这一事实可能提供了解释。
- 由于高MSI相关癌症患者的生存率更高,且这些癌症是高度突变的,因此突变率可能是一个更好的预后指标。
- 全外显子组测序及基因组数据的综合分析为我们进一步揭示了结直肠癌中失调的信号通路。
- 我们发现,93%的非高度突变病例和97%的高度突变病例中WNT信号通路出现了失调控。
- 新的发现包括FAM123B、ARID1A和SOX9中的反复突变以及WNT配体受体基因FZD10的极高表达水平。
- 据我们所知,SOX9此前未曾被报道为在任何人类癌症中频繁突变。
- WNT信号传导抑制SOX9的转录,并且SOX9蛋白已被证明能够促进β-连环蛋白的降解。
- ARID1A在妇科癌症中经常发生突变,并且已证实它能抑制MYC的转录。
- WNT信号传导的激活和TGF-β信号传导途径的失活已知会导致MYC的激活。
- 我们的突变分析和综合分析强调了MYC在结直肠癌中的关键作用。
- 我们还将我们的结果与其他大规模分析进行了比较,并发现了许多相似之处和少数差异,在突变基因方面(补充表3)。
- 我们的综合分析揭示了TCF/LEF编码基因多样性的变化,这表明TCF/LEF因子在结直肠癌中的作用不仅仅是作为β-连环蛋白的被动伴侣。
- ,
- 我们的数据提示了针对结直肠癌的多种治疗途径。
- 其中包括 WNT 信号通路抑制剂和小分子 β-连环蛋白抑制剂,这些药物已显示出初步的前景。
- 我们发现 RTK-RAS 和 PI3K 通路中的多个蛋白质,包括 IGF2、IGFR、ERBB2、ERBB3、MEK、AKT 和 MTOR 可能是抑制的目标。
- 我们的分析表明,非高突变型结直肠腺癌在基因组水平上并无区别。
- 然而,右侧/升结肠的肿瘤更有可能发生高甲基化并且突变率高于其他结直肠癌。
- 正如之前所认识到的那样,WNT信号通路的激活和TGF-β信号通路的失活导致MYC活性增加,在结直肠癌中几乎是普遍现象。
- 基因组异常经常靶向MAPK和PI3K途径,但较少靶向受体酪氨酸激酶。
- 总之,这里提供的数据为理解这种致命疾病以及识别针对该病的有效治疗方法提供了有用的资源。
Methods Summary
- 肿瘤和正常样本由两个生物样本核心资源之一进行处理,纯化的核酸样本分装后被送往基因组特征分析和测序中心(补充方法)。
- 生物样本核心资源分多个批次提供了样本集。
- 为了评估任何批次效应,我们使用聚类分析、增强主成分分析和方差分析的组合检查了信使核糖核酸表达、微小核糖核酸表达和脱氧核糖核酸甲基化数据集(补充方法)。
- 尽管检测到了一些批次间的差异,但我们没有通过计算方式对其进行校正,因为这些差异通常较小,而且其中一些可能反映了生物学现象(补充方法)。
- 我们使用了阿法梅特里克斯 SNP 6.0 微阵列来检测拷贝数变异。
- 一部分样本接受了低通(2–5倍)全基因组测序(illumina Hiseq),部分目的是为了检测染色体拷贝数异常和染色体易位。
- 我们利用安捷伦微阵列和 RNA-Seq 生成了基因表达谱。
- DNA 甲基化数据是通过使用 illumina Infinium(HumanMethylation27)微阵列获得的。
- 编码区域的 DNA 测序是通过外显子捕获后,在 SOLiD 或 illumina Hiseq 平台上进行测序完成的。
- 所用分析方法的详细信息在补充方法中有描述。
- 所有原始序列文件均已存入dbGap数据库,其余所有数据均存放在数据中心(DCC)供公众访问(http://cancergenome.nih.gov/)。
- 数据矩阵和支持性数据可在以下网址找到:http://tcga-data.nci.nih.gov/docs/publications/coadread_2012/。
- 数据也可通过系统生物学研究所调控组学浏览器(http://explorer.cancerregulome.org/)、下一代聚类热图(http://bioinformatics.mdanderson.org/main/TCGA/Supplements/NGCHM-CRC)和cBio癌症基因组门户(http://cbioportal.org)进行探索。
- 有关数据的描述可在此网址找到:https://wiki.nci.nih.gov/x/j5dXAg,并在补充方法部分中给出。
Accession codes
Data deposits
数据沉积
- dbGaP 登录号已在补充表 1 中提供。
本文由mdnice多平台发布