今日数据分析 - 二三小事

1. 迂回下载海外组学数据

前段时间,集群出了点状况,多少影响了数据分析进度。目前也没集群可用,于是只能用自己的电脑。人在贵阳,好在前段时间还是下血本(两个月的工资)搞了一个工作电脑,勉强可以用来跑跑小型的组学数据。然而,数据传输或者下载又是一个问题。或许是我个人错觉,也或许是现在就这样,我们要从 NCBI SRA 下载数据是比较....麻烦的,速度实在太慢。于是大体折腾了下,迂回解决这个问题:

  1. 购买香港主机,直接从香港主机下载
  2. 中间跳板(使用Piping Sever)
  3. 本地服务器接受数据(还是使用 Piping Server)

事实上,我是想用一些大文件快传软件的,不过似乎目前并没有好的实现软件。以前用的,都不行了。

2. docker build -t scauclass

Emmm,同样,是希望在本地使用以前构建的镜像。但是死活跑不起来。报错大体如下



各种搜索,找不到解决方法。不过不能build,却可以直接load已有镜像。最后还是问了下基友孙总,得到解决办法是:
直接新建一个目录,把Dockerfile 放进去,在里面build就可以了,有点意思。具体逻辑是:docker build 的时候会对工作目录中所有文件做索引进去,方便ADD或者COPY。由于我直接在E盘搞,可能有一些文件或者程序不被支持之类,所以出这个问题....

3. samtools 无法处理染色体过长的材料

在大基因组上,samtools或者bwa系列可能会有这个问题。我想,主要还是一个性能考量。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容