GEO挖掘实战四、TNBC相关探索

之前的分析流程为GEO数据的通用方法。此外我们还可以针对特定的研究对象挖掘相关的生物学规律。
例如TNBC, tripple negative breast cancer是三种受体呈阴性的一种乳腺癌(三阴性乳腺癌),可重点关注与之相关的基因的表达情况,见下面得到第八步。

8、marker gene

  • 三阴性乳腺癌三阴性乳腺癌(TNBC)是指雌激素受体(ER)、孕激素受体(PR)和人表皮生长因子受体(HER2)均为阴性;
  • ER、PR、HER2并不是基因的规范命名,接下来找到三者对应的symbol规范命名;
  • genecard(https://www.genecards.org/)网站搜索结果:上述三者分别对应(ESR1、ESR2)、PGR、ERBB2
rm(list = ls())
options(stringsAsFactors = F)
load(file = 'exp_group.Rdata')
exp[1:4,1:4]
library(hgu133plus2.db)
p2s <- toTable(hgu133plus2SYMBOL)
index <- p2s$symbol %in% c("ERBB2",'ESR1','ESR2','PGR')
np <- p2s[index,1] #探针名
ng <- p2s[index,2] #基因名
marker_dat <- exp[np,]
rownames(marker_dat) <- paste(ng,np,sep=':')
n=t(scale(t(marker_dat)))
n[n>2]=2; n[n< -2]= -2
n[1:4,1:4]
group_dat <- data.frame(group=group_list, row.names = colnames(exp))

library(pheatmap)
pheatmap(n, annotation_col = group_dat,
         show_colnames = F)
8-1

如上热图可以看出这些marker基因在TNBC染色体表达相对较低(三阴)。此外在多个探针对应一个基因时,通常取表达量最大的那个探针代表该基因情况。

wdata <- data.frame(v=as.numeric(marker_dat['ERBB2:210930_s_at',]))
library(ggpubr)
gghistogram(wdata, x='v',y="..density..",
            #纵轴标签有点问题,老师的图的标签为密度值。
            add_density = T,
            add = "mean",rug = T)
8-2

9、PAM50分类器

PAM50的GEP分型主要根据50个基因的表达情况可将乳腺癌分为不同的亚型,包括

  • 表达雌激素受体(ER)相关因子的亚型(管腔型,有A、B型两种);
  • 表达人类表皮生长因子受体2(HER2)相关通路因子的亚型(HER2过表达亚型);
  • 表达基底因子但不表达激素受体通路的基底样乳腺癌(BLBC)亚型。

9.1 去重

rm(list = ls())
options(stringsAsFactors = F)
load(file = 'exp_group.Rdata')
library(hgu133plus2.db)
ids <- toTable(hgu133plus2SYMBOL)
dat <- exp[ids$probe_id,]
ids$median <- apply(dat,1,median)
ids <- ids[order(ids$symbol,ids$median, decreasing = T),]
#先按symbol名字母降序排,再按对应的median值从大到小排。
#目的是将相同基因名放在一起,并按median值从大到小排
ids <- ids[!duplicated(ids$symbol),]
#去重,只保留同名的第一个,也就是median最大的那个
dat <- dat[ids$probe_id,]
rownames(dat) <- ids$symbol

9.2

ddata=t(dat)
ddata[1:4,1:4]
s=colnames(ddata);head(s)
library(org.Hs.eg.db)
s2g=toTable(org.Hs.egSYMBOL)
head(s2g)
g=s2g[match(s, s2g$symbol),1];head(g)
dannot=data.frame(probe=s,
                  Gene.Symbol=s,
                  EntrezGene.ID=g)
head(dannot)
dim(dannot)
ddata=ddata[,!is.na(dannot$EntrezGene.ID)]
dannot=dannot[!is.na(dannot$EntrezGene.ID),]
#dannot的格式要准确,包括列名
dim(dannot)
if (!require("BiocManager"))
  install.packages("BiocManager")
#BiocManager::install("genefu")
library(genefu)
s <- molecular.subtyping(sbt.model = "pam50", data=ddata,
                         annot = dannot, do.mapping = T)

table(s$subtype)
# Basal   Her2   LumB   LumA Normal 
#   134     18     46     54     13 

9.3 热图比较

pam50genes <- pam50$centroids.map[c(1,3)]
#这个包是几年前开发的,其中三个symbol已经改变,需要手动修改一下。
pam50genes[pam50genes$probe=='CDCA1', 1]="NUF2"
pam50genes[pam50genes$probe=='KNTC2', 1]="NDC80"
pam50genes[pam50genes$probe=='ORC6L', 1]="OPC6"
x=dat
x=x[pam50genes$probe[pam50genes$probe %in% rownames(x)],]
subtype <- as.character(s$subtype)
tmp <- data.frame(group=group_list,
                  subtypes=subtype)
rownames(tmp) <- colnames(x)

library(pheatmap)
pheatmap(x, show_rownames = T,
         show_colnames = F,
         annotation_col = tmp)
n=t(scale(t(x)))
n[n>2]=2; n[n< -2]= -2
n[1:4,1:4]
pheatmap(n, show_rownames = T,
         show_colnames = F,
         annotation_col = tmp)

如下图,可以看到basal类(BLBC)与TNBC重合度较高(均为恶性的乳腺癌),这也验证了TNBC许多生物学特性和基底细胞样型乳腺癌(Basal-like breast cancer)相似的结论


9.3
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,539评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,594评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,871评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,963评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,984评论 6 393
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,763评论 1 307
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,468评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,357评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,850评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,002评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,144评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,823评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,483评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,026评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,150评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,415评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,092评论 2 355

推荐阅读更多精彩内容