部分代码见:https://www.jianshu.com/p/3553220509d7
原文名称:Identification of Key Genes and Pathways in Triple-Negative Breast Cancer by Integrated Bioinformatics Analysis
背景知识
三阴性乳腺癌是指不表达ER、PR和Her2的乳腺癌,治疗困难,预后较差。
方法
1.微芯片数据
使用GSE76275数据集,包含265个样本,其中有198个TNBC,67个non_TNBC
2.确定DEGs
使用GEO2R确定差异表达基因(FC≥1.5,p<0.01);
使用Morpheus对100个显著的DEGs作热图
3.GO和KEGG通路富集分析
使用STRING 10.5 input DEGs并output结果,p<0.05认为具有显著性;使用DAVID 6.8作KEGG分析
4.PPI网络建立和通路间的相关性分析
使用实验设置、文本挖掘、数据库、共表达、邻域、基因融合和共流框勾选建立DEGs网络;使用Cytoscape中的MCODE来screen PPI网络中的分子(显示score>3,nodes number >3的分子);使用Cytoscape中的ClueGo进行通路间富集分析(呈现p<0.05)
5.生存分析
即总体生存率Kaplan-Meier估计
使用cBioPortal数据库中的METABRIC等数据进行生存分析。以GO富集分析和ClueGO构建的相互关系网络为基础,在cBioPortal中提交基因名,进行生存分析,其中Logrank检验p <0.05的基因呈现。
结果
1.确定DEGs
基于标准找到207个DEGs,其中56 up,151 down,见火山图。top 100的基因见热图和聚类分析
2.GO和KEGG通路富集分析
上图
3.PPI网络建立和通路间的相关性分析
确定了168个nodes和108个edges
4.生存分析
参考来源:生信技能树
友情链接:
课程分享
生信技能树全球公益巡讲
(https://mp.weixin.qq.com/s/E9ykuIbc-2Ja9HOY0bn_6g)
B站公益74小时生信工程师教学视频合辑
(https://mp.weixin.qq.com/s/IyFK7l_WBAiUgqQi8O7Hxw)
招学徒:
(https://mp.weixin.qq.com/s/KgbilzXnFjbKKunuw7NVfw)
欢迎关注公众号:青岛生信菜鸟团