GEO2R差异表达分析软件

前两天我们对GEO数据库来了一个大致的介绍。我们对于目标数据集,我们做的第一个事情就是差异分析,来寻找有差异的结果。所有的表达芯片做的差异表达分析都是基于limma的算法来的。我们今天介绍的这个GEO2R也只是把这个算法更加方便使用了而已。

PS:GEO2R只是适用于表达谱芯片。对于二代测序是不适用的,我们下面说到的数据类型都是表达谱芯片来进行阐述的。

1 所谓差异分析

我们在进行科学研究的时候,同样也是需要比较才能得到结果的。通常我们研究一个疾病的时候,其实都会有一个隐藏的目标伴随着来进行研究的。例如我们要研究TP53是否和胃癌的发生相关,那我们收集的数据除了胃癌患者当中的TP53的基因表达水平,也要收集正常对照人群的表达变化,通过两者的对比来确定TP53的表达变化是否和胃癌有关。

对于表达谱芯片而言,我们会得到上万的基因的表达量变化,但是这上万的基因不一定都参与疾病的发生。我们进行差异分析的目的也是要得到和疾病相关的那些变化基因。毕竟这些基因才是符合我们研究目的的。

image.png

2 GEO2R

GEO2R就是一个基于GEO数据库来对表达谱芯片进行差异分析的一个软件。我们在每个数据集的下面都可以看到这个软件的的入口。例如:GSE79973我们就可以在数据集的下面看到这个分析入口。

image.png

软件的整体操作还是很简单的,我们需要做的就是

2.1 制定数据分组

前面提到,我们需要两组或者多组之间比较才能得到差异的结果,所以我们第一步需要做的就是来制定我们想要的分组。这里我们可以基于自己想要的分组名称来填写即可。

需要注意的是,如果是两组的话,我们要先选择对照组;再选择处理组。如果这里输入反了,就导致我们结果是反的。

image.png

2.2 选择相对应的样本

在制定好分组之后,我们需要在所有数据样本当中来符合我们分组的样本。我们可以通过点击某一个列名来进行排序。

https://vdn1.vzuu.com/SD/97a825b0-1f56-11eb-badc-9ea171c4377c.mp4?disable_local_cache=1&bu=078babd7&c=avc.0.0&f=mp4&expiration=1651204594&auth_key=1651204594-0-0-caafea7bc7ad6b3a41c0242468bbe615&v=hw&pu=078babd7

2.3 进行差异表达分析

我们把界面往下拉,有一个TOP250/Save All Results的地方。这个地方就是我们用来查看结果的地方。

image.png
  • TOP250,可以查看所有差异结果当中,前250的基因。
image.png

在这个结果当中,包括了:芯片当中探针ID号、差异分析的P值和logFC值,以及相对应的基因名。我们点击ID下面每一个探针前面的▶️,就可以看到这个数据集里面相对应的样本在不同分组的表达量变化了。

具体结果的筛选标准我们后面再说。

  • **Save All Results **则会弹出另外一个界面。这里面包括芯片当中作用的数据的差异表达结果。每一列的内容和之前的TOP250是一样的
image.png

如果我们需要保存所有的结果。那么全选—复制—打开excel—粘贴即可。

3 结果解读

通过以上的过程,我们就得到了这个数据集所有差异 表达的结果。但是所有的结果,并不是都有意义的结果,所以我们要进行一定的筛选。目前对于差异的筛选结果,其实并没有一个严格意义上的标准。但是都有一个默认的最低标准:那就是logFC的绝对值 > 1. 且 矫正P值(adj.P.Val) < 0.05

image.png

关于logFC

logFC,全称是log2 foldchange。foldchange可以代表变化倍数,如果处理组的表达均值是8;对照组的表达均值是2,那么foldchange就是4。而log2 fold change就是2。所以我们默认的logFC > 1,则代表两组之前差异在2倍以上的为有意义。

logFC的绝对值, 由于相较于对照组,基因的变化并不一定是升高的。也有降低的。所以logFC会有一个方向性,如果为 **负 **则代表,相较于对照组是低表达的,如果为 则代表是高表达。

由于表达是有方向性的,所以再次抢到在输入分组命名的时候先输入对照组的名字。不然的话,按照系统的分析方法,我们得到的结果有可能方向就完全是相反的了。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,273评论 6 515
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,349评论 3 398
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,709评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,520评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,515评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,158评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,755评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,660评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,203评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,287评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,427评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,122评论 5 349
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,801评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,272评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,393评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,808评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,440评论 2 359

推荐阅读更多精彩内容