转录组分析——二、数据完整性检验

一、md5值检验

md5值检验需要用到的东西
1、一个txt文件(第一列为md5值,第二列为sra文件名,两列中间有两个空格,固定格式)
2、下载好的sra文件
3、txt文件和sra文件放在同一目录下

#以4、5、6三行为例
cat 'file.tsv' | awk 'NR>3&&NR<7 {print$11"  "$4}'>md5.txt
# 检验md5值完整性,md5sum函数加-c参数
md5sum -c md5.txt 
# md5检验过程较慢,可以挂后台,结果重定向到check
md5sum -c md5.txt>check &

二、如何生成md5值

命令还是md5sum,没有参数就是生成,生成的文本符合md5值检验格式(两列,第一列为md5值,第二列为sra文件名)
不加其他命令,直接打印在屏幕上,可以重定向至一个新的文件

# 生成单个文件的md5值
md5sum SRR1039510 
# 生成多个SRR开头文件的md5值,并输出到文件md5.txt,并挂载在后台
md5sum SRR*>md5.txt &

md5值如果写路径名,生成的md5结果第二列也有路径名,所以不建议写路径名,在工作目录下处理!!!!!

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容