单基因的肿瘤细胞系表达怎么看?CCLE告诉你

泛癌的基因表达量一般可以用TCGA和GTEx实现,但是肿瘤细胞系一般用CCLE
临床生信之家是一个很好的在线工具,目前上架了CCLE的功能,出的图见下,可以实现单基因在泛癌和单病种的可视化,但是这个网址什么都好,就是有次数限制,后面使用要加钱,而且价钱不菲,学生党望而却步。。。

泛癌
膀胱癌
会R语言,当然可以省掉这笔巨款,而且可以DIY,乐趣无穷

首先去CCLE官网下载数据,目前网页更新了,功能也多了
比如TP53,访问这个网址TP53 DepMap Gene Summary就行,在CharacterizationExpression 21Q2 Public右边有个下载标志,基因单位是Log2(TPM+1),很科学
下载后的数据是: TP53 Expression 21Q2 Public.csv

image.png

把数据读进R里面

TP53_Expression_21Q2_Public <- read.csv("~/Desktop/TP53 Expression 21Q2 Public.csv")
image.png

可以看到很多有用信息,包括基因表达量、细胞系名、原发病、器官和亚型,这样我们就可以跑代码了

  • 第一步,画个泛癌的boxplot,可以用ggplot2,也可以用ggpubr的ggboxplot函数,但是最好还是ggplot2,可以按中位数排序,标上均数标准差,还可以标一下所有数值的均值
library(ggplot2)
library(ggpubr)
ggplot(TP53_Expression_21Q2_Public, 
       aes(x = reorder(`Primary Disease`,`Expression 21Q2 Public`, FUN = median),  #按中位数自动排序
           y =`Expression 21Q2 Public`,color=`Primary Disease`)) + #y也可以是Lineage
    geom_boxplot()+ #添加boxplot
    geom_point() + #添加点
    theme_classic(base_size = 12)+ #主题和字体大小
    rotate_x_text(45)+ #X轴45度倾斜一下
    theme(legend.position="none")+ #不需要显示标签
    xlab(NULL)+ylab("TP53 expression \nLog2(TPM+1)")+ #改下坐标名称
    stat_summary(fun.data = 'mean_sd', geom = "errorbar", width = 0.5,position = position_dodge(0.9))+ #自动计算均数标准差,加个误差棒
    geom_hline(yintercept = mean(TP53_Expression_21Q2_Public$`Expression 21Q2 Public`), lty = 2)
#自动计算均值,标个虚线
pancancer

当然也可以统计一下差异,再加一句+stat_compare_means(method = "anova")就行。

  • 第二步,提取单个癌症的数据画个棒棒糖图,可以用ggplot2,也可以用ggpubr的ggdotchart,不过最好还是ggplot2
    比如,你想提取肾癌的数据
data<-TP53_Expression_21Q2_Public[TP53_Expression_21Q2_Public$`Primary Disease` == 'Kidney Cancer',]

我是这样设计图片的,以点的大小代表基因表达量,按颜色表达程度,颜色从蓝到红,可以从大到小排序,也可以从小到大排列,然后用均数隔开

ggplot(data, aes(x=reorder(`Cell Line Name`,`Expression 21Q2 Public`), y=`Expression 21Q2 Public`)) + 
    geom_point(aes(size=`Expression 21Q2 Public`,color=`Expression 21Q2 Public`),stat='identity') +scale_color_continuous(low='blue' ,high='red') +
    geom_segment(aes(y = mean(data$`Expression 21Q2 Public`), 
                     x = `Cell Line Name`, 
                     yend = `Expression 21Q2 Public`, 
                     xend = `Cell Line Name`), 
                 color = "black") +
    theme_classic(base_size = 12) + 
    coord_flip() + 
    xlab(NULL)+ylab("TP53 expression")+
    geom_hline(yintercept = mean(data$`Expression 21Q2 Public`), lty = 2)
image.png

从小到大再来一次,reorder里加个-就行

ggplot(data, aes(x=reorder(`Cell Line Name`,-`Expression 21Q2 Public`), y=`Expression 21Q2 Public`)) + 
    geom_point(aes(size=`Expression 21Q2 Public`,color=`Expression 21Q2 Public`),stat='identity') +scale_color_continuous(low='blue' ,high='red') +
    geom_segment(aes(y = mean(data$`Expression 21Q2 Public`), 
                     x = `Cell Line Name`, 
                     yend = `Expression 21Q2 Public`, 
                     xend = `Cell Line Name`), 
                 color = "black") +
    theme_classic(base_size = 12) + 
    coord_flip() + 
    xlab(NULL)+ylab("TP53 expression")+
    geom_hline(yintercept = mean(data$`Expression 21Q2 Public`), lty = 2)
image.png

不要钱的,不香吗?

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,816评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,729评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,300评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,780评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,890评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,084评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,151评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,912评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,355评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,666评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,809评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,504评论 4 334
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,150评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,882评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,121评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,628评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,724评论 2 351

推荐阅读更多精彩内容

  • library(RTCGA) library(RTCGA.clinical) library(RTCGA.rnas...
    白云梦_7阅读 2,606评论 0 2
  • 最近实在太忙了,好久没有更新我们的简书了,今天抽空无论如何也要更新。 示例:查询PDCD1在各个泛癌细胞系中表达情...
    翾格格阅读 23,359评论 7 17
  • 1.## 加载R包 ## 下载数据,如果文件夹中有会直接读入 gset = getGEO('GSE32575', ...
    存存baby阅读 1,848评论 0 0
  • 表情是什么,我认为表情就是表现出来的情绪。表情可以传达很多信息。高兴了当然就笑了,难过就哭了。两者是相互影响密不可...
    Persistenc_6aea阅读 124,553评论 2 7
  • 16宿命:用概率思维提高你的胜算 以前的我是风险厌恶者,不喜欢去冒险,但是人生放弃了冒险,也就放弃了无数的可能。 ...
    yichen大刀阅读 6,041评论 0 4