一篇WGCNA文章复现-GSE85589-上集

想要复现一篇WGCNA文章中的原图,数据集时GSE85589,前面在下载数据时折腾了好久,原因是呢,我下载的矩阵的miRNA探针就只有2000来个,以为不对劲,于是想要去下载CEL文件,但是又碰到了一系列问题。下面是折腾的过程。其中让我泪崩的就是两个主要解决不了的报错,一个是mirna40CDF,一个是read.celfiles这两个报错,其实到最后也没解决掉,好在后来老大jimmy告诉我miRNA探针就有2000来个是正常的,我才能得以继续,不然要折腾到猴年马月呀!哈哈

下载后的截图如下。

image-20191112072858413

值得注意的是,下载后的dat非常小,dim后只有2000多个探针

image-20191112073458892

image-20191112005930693

于是我想要去去下载CEL文件,下载的代码如下

setwd('./')
library(affy)
dir_cels='GSE85589_RAW'
data <- ReadAffy(celfile.path=dir_cels)
eset <- rma(data)
calls <- mas5calls(data) # get PMA calls
calls <- exprs(calls)
absent <- rowSums(calls == 'A') # how may samples are each gene 'absent' in all samples
absent <- which (absent == ncol(calls)) # which genes are 'absent' in all samples
rmaFiltered <- eset[-absent,] #

不过出现了报错,就是这个mirna40CDF的问题,当时觉得问题不大

image-20191112074606354

既然有报错提示信息,谷歌说用read.celfiles

image-20191112073818452

上面选n没有成功,那么我下次选a

image-20191112074053533

问我do you 。。。,选yes

image-20191112074121995

然而还是有报错

image-20191112075747172

安了Biocmanager,第一遍选择了‘a’,但是加载不出,安装第二遍,选择了‘n’,依然是不行

image-20191112080058942

换个思路,还是走老大的那个

image-20191112080831816

搜索这个AffyBatch,貌似和下面这个CDF的报错是有关联的,这个batch是批次的意思,那么很有可能和表达量有关,那么再思考一下

image-20191112081140970

这个数据集的sample有下图

image-20191112081432985

后面的PC1才是我们想要的PDAC数据,文章中说总共有88个PDAC数据,我把PDAC数据集中间的省略,直接截图后面的,下面这图就是说还有ICC1啊和SC1的数据

<img src="https://tva1.sinaimg.cn/large/006y8mN6gy1g95vmqztj0j30i80widms.jpg" alt="image-20191112081705273" style="zoom:33%;" />

还有normal信息,和文章中的数量是能个对上的

<img src="https://tva1.sinaimg.cn/large/006y8mN6gy1g95vms47npj30g80ocwie.jpg" alt="image-20191112082741576" style="zoom:50%;" />

但是依然报错如下,好吧,肯定不是cel文件数量或批次的问题

<img src="https://tva1.sinaimg.cn/large/006y8mN6gy1g95vmvcpdnj313c0a0jw0.jpg" alt="image-20191112082834811" style="zoom:50%;" />

其实前面谷歌过这个miRNA-4_0的问题,如下,但是并没有人有后面的回答了

<img src="https://tva1.sinaimg.cn/large/006y8mN6gy1g95vmx7kdpj31d40oan4p.jpg" alt="image-20191112083022667" style="zoom:50%;" />

所以解决rma的关于AffyBatch的问题,谷歌同样有人问

image-20191112090455242

解答如下,意思是说

image-20191112090546364
getwd()
[1] "/Users/mengmeng/Desktop/再做-WGCNA/GSE85589_RAW"
mydata_GSE85589<-ReadAffy()
rma.data <- affy::rma(mydata_GSE85589)

报错信息如下,又回到了前面CDF和miRNA-4_0的问题,说这个包没安,虽然上面我截了一张图那个外国人说下载这个miRNA-4_0都不行,但是👇给我的报错信息就是没有安装mirna40cdf这个包

image-20191112092516016

提示让选择的时候我选择‘a’,问yes还是no的时候也选择‘yes’,但是就是不给面子

image-20191112093854092

关于搜索过程

The CDFs for these old Affymetrix arrays can be very difficult to find. A problem was that Affymetrix were purchased by ThermoFisher, and support for products was lost.

I have done a search and found these sources:

  • 第二种
#还有人这种方法
library(oligo)
dat <- read.celfiles(list.celfiles())
eset <- rma(dat)

但是我的报错如下

image-20191112075747172

针对上么解决谷歌搜索说

rma.data <- affy::rma(gse28403preset)
#但是根本没有这个gse28403preset,我进到这个cel的目录下用affy::rma下载后,就又返回提示mirna40CDF的报错了
image-20191112100828253
image-20191112101131691
image-20191112101120725

下载后解压放到和cel文件一起的文件夹里,工作目录也是此文件夹,结果报同样mirna40CDF的错。不行

<img src="https://tva1.sinaimg.cn/large/006y8mN6gy1g95vnlzqlej30m406wdgy.jpg" alt="image-20191112104438390" style="zoom:50%;" />

<img src="https://tva1.sinaimg.cn/large/006y8mN6gy1g95vnjs9v2j30vs0be43f.jpg" alt="image-20191112104749712" style="zoom:50%;" />

image-20191112101245485

这个还没试,这个回答里内容很多。不过其实一开始下载的矩阵就是对的,那就不纠结了,前面的当成是一个探索的过程吧,可以直接看下集,其实还有个中集,也是个记录过程,没耐心烦儿的直接看下集,哈哈哈。

最后友情宣传生信技能树

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,635评论 6 515
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,543评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 168,083评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,640评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,640评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,262评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,833评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,736评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,280评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,369评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,503评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,185评论 5 350
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,870评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,340评论 0 24
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,460评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,909评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,512评论 2 359

推荐阅读更多精彩内容

  • 本文转自 http://www.cnblogs.com/ZHshuang463508120/p/3593679.h...
    bioinfo2011阅读 7,080评论 1 5
  • 一.基因芯片基础知识 1.探针组 一张基因芯片包含上百万的探针(一般由25个碱基组成),它们被整齐的印刷在芯片上。...
    javaLi阅读 8,125评论 0 14
  • 背景: 阅读新闻 12C CDB模式下RMAN备份与恢复 [日期:2016-11-29] 来源:Linux社区 作...
    阳屯okyepd阅读 3,499评论 0 7
  • 使用GEOquery包 肖恩戴维斯 2014年9月21日 1GEO概述 1.1平台 1.2样品 1.3系列 1.4...
    Greatji阅读 963评论 0 1
  • 提起“三生三世”系列,耳熟能详的便是唐七的几部小说,尤以《三生三世十里桃花》为最,这显然得益于媒体的大肆传播,电视...
    孔玲外小阅读 629评论 0 6