生信数据分析新手常见问题

写在前面

写一个帖子,慢慢收录一些看起来似乎很简单,确实比较常见的数据分析新手的问题。

为什么一个样品测序之后,会对应两个文件?而且两个文件大小还不同?

双端测序(PE)本身就是对一个片段的两个方向分别测一次。所有一个样品会对应两个文件,其中一个是所谓的正向(事实是,测的第一链条,即Forward),常见文件命名会带有_1或者.1;另外一个,是所谓的反向(事实是,测的第二链,即Reverse Complement),常见文件命名会带有_2或者.2
如下,其中a图会引物会引导测序,125个bp,并产生正向测序读段文件;c图中引物会引导测序,125bp,并产生反向测序读段文件

正反向都是测同样长度的读段,比如125bp,从字符数目来计算,文件似乎应该是一样大。为什么文件大小为什么会不同?比如一个是2.0G,另一个2.2G。造成这么大差别,主要原因是看到的都是.gz压缩文件,压缩的算法有很多,基本上没有一个算法是不受文本复杂度限制的。正反向记录的碱基必然是不同的,至少顺序必然是不同的,所以压缩的效果会有差异,最后文件大小会有差异。

连接服务器跑程序,电脑要关机,任务跑不完,怎么办?

你需要了解一下screen或者tmux这类程序
建议tmux

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 参考学习《R语言与Bioconductor生物信息学应用》第六章 前言 Y叔的公众号biobabble发过一篇【听...
    王诗翔阅读 13,837评论 0 49
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 174,081评论 25 709
  • 1,有关“最”喜欢 许多时候会因为当时的情境被某首歌曲感动,但不会特意去重复听。记得第一次听《平凡之路》时莫名流泪...
    赢莹_51fd阅读 98评论 0 0
  • 新上一个项目,在此记录,以备后用 申请开发者账号(99$ -- company版本) 创建应用发布 一、 ...
    普通青年阅读 262评论 0 1
  • 图文/苏末雪 摄影器材:佳能M10 喜欢 是这个季节里 你那明亮的色彩 喜欢 是经过你时 忍不住停下来多看俩眼 喜...
    苏末雪阅读 270评论 0 6