RNA-seq中遇到的问题

大家好,现在已经据五月底的生物技能树培训过去一个多月了,不知到大家在重复上课所上内容上有没有遇到问题,遇到问题又是如何去解决的呢?但是我在这个过程中却遇到很多问题,碰到很多坑。相信大家都有过这种体验,在以前上一些数据分析课时,同样的代码复制粘贴都能报错,这也是特别绝望的。我在上课期间感觉遇到的问题远不如下来自己操作碰到的多。再次非常感谢我们生物技能树的崔青美老师,期间遇到好几个问题都是在她的帮助下解决的。以下我就正式讲述我整个遇坑找坑填平坑的经历啦。

一、在自己的新服务器上配置软件

由于之前上课期间很多文件数据和软件都是老师已经共享到我们上课所用服务器上的,所以我在上课时安装软件什么的也基本是一气呵成,并没有遇到特别多的问题,有问题也是直接当场问了厉害的李师兄,哈哈。但是自己私底下在自己租来练手的新的服务器上安装这些软件就遇到问题了。首先就是自己下载这些软件真的特别慢,只有十多kb/s的速度很是让人抓狂。后来我想的办法就是,把老师配给我们服务器上的软件先传输到自己电脑,然后在通过自己电脑上传到我新的服务器上。其实用wget -c 也能下得比较快。老师配给我们的服务器速度是100kb/s左右,和用wget -c的速度差不多,然而不加-c 直接用wget下真的贼慢,反正我电脑告诉我要下3天,或者用迅雷黄金会员下,这个很多时候速度还是很靠谱的!!!!

二、建立hg38的索引

在做mapping时,一个数据库的索引是基础。hg38这个数据有3.05G特别大,网上直接下载很慢,大家要是下载可以参考我上面的建议。
我建的是bowtie2的库,bowtie2 --help 一下我没看懂,就参考的一些博客和视频,他们写的是 bowtie2-build hg38.fa hg38。代码倒是超级简单可是我的系统一直提醒我错了!!这个建库真的折磨我,后来实在没办法了我询问了崔老师,她发了我一个链接https://www.jianshu.com/p/071c1757ded1

bowtie2-build   /home/qmcui/database/reference/hg38/hg38.fa   hg38   --threads   5  #增加自己的线程,这串建库代码总共运行了6个多小时。

然后就对了。

三、操作中遇到的零碎却致命的问题
1,弄清文件目录

要清楚上课时每串代码下面文件目录里放的什么文件,准确在分析时定位到自己的文件,随时清楚自己现在所在什么文件目录下。如果在分析过程中输入一段代码后系统提示找不到该文件,建议大家直接进入自己文件所在目录下再输入自己的代码,一般就不会错。

2,使用软件时报错逼自己读懂 软件--help
3, 每生成的新文件,最好用zcat 文件名|wc -l 查看是否有内容或者问题
四、在此分享一个我遇到问题后解决问题的过程

在做RNA-seq时,在mapping时我遇到了第一个报错:


报错1.png

问过崔老师后,她提示我在-x后记得加索引前缀,开始我没明白老师的意思,后来查了一些简书和博客才明白。也就是我们建好的索引都有自己的文件名,比如我们hisat2构建好索引后,会产生几个新的文件(如:hg38.1.bt2)索引前缀也就是hg38。以上的代码就需要改成
:-x ./database/index/hg38。
我把改后的代码运行了一次,然后还是报错:


报错2.png

崔老师说提示memory是因为资源不够,我的电脑当时提交了12个线程,电脑资源不够了。于是我关闭了另一边的运行(当时我开了另一个终端占用6个线程构建索引),结果还是报错:


报错3.png

这时老师发了一个链接给我,上课时讲的运到问题的解决过程。我发现其实自己不知不觉中也是这样去寻找自己错误的。无耐基础太薄,还是没法通过这些步骤找到自己的问题。
最后崔老师让我查看自己的对比文件字节。用 zcat 文件名|wc -l 命令
微信图片4
微信图片5

终于发现是自己在上一步过滤数据时,进行了什么不对的操作导致我的2.fq.gz没有内容。最后我重新运行了上一步的代码之后一切就正常了。

总之,在每新生成一个文件后一定要及时用ls -ltrh查看文件进程,不然上一步的问题在下一步找真的特别头痛!!
当遇到报错时不要太紧张,不要隔好几天,甚至十天半个月也不想碰代码。遇到报错,按照老师讲的自己排除错误,实在还错等一天,再来处理,有可能时网速问题,或者去咨询一下专业的朋友或者老师。一定要学懂!!下面的查错的链接附上https://www.jianshu.com/p/2aecf90bf1f3

微信图片6.png

写到最后:其实我自己开始没有用培训时老师所用的hisat2,而是bowtie2,
我忽略了前者是对比RNA,后者对比DNA。自己的数据是RNA我却用bowtie2,对比出来只有四百多点,哎!hisat2对比出来有上万呢!!所以大家一定要正确了解每个软件的用途,不要像我牛头对马嘴,哈哈哈!!
我在老师培训时的服务器上运行的是老师ppt上的,基本未改一字,也没有出现过错误,然而自己的服务器上却频频出错,眼泪流下来。
我在用数据做hisat2对比的时候其实也报错了,自己改了一下代码,做了尝试但是一直提示:


报错4.png

希望有清楚的老师提点一下。感谢!
最后再次感谢崔老师,生物技能树的所有老师,以及参加培训过程中遇到的每一个朋友,我过去是个小白,到现在还算进门;从遇到错误一筹莫展,到现在自己不仅能解决自己的问题,也能为朋友解决一些问题。我感到自己有比较大的进步。谢谢大家!!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,793评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,567评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,342评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,825评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,814评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,680评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,033评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,687评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,175评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,668评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,775评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,419评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,020评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,206评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,092评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,510评论 2 343

推荐阅读更多精彩内容