有关基因组大小的单位换算

原先一直以为测序的bp和byte是等价的,原来对fastq来说,其实:

4 bases = 1 byte\\

利用

1 Kilo base pairs (KB) = 1,000 BP\\
1 Mega base pair (MB) = 1,000,000 BP or 1000 KB\\
1 Giga base pairs (Gb) = 1,000,000,000 BP or 1000 MB\\
1 Terra base pairs (TB) = 1000 GB\\
1 Peta base (PB) = 1000 TB\\

(公式要怎么换行啊?)

举例:

如果测序reads总量4,000,000,average read length为150bp,基因组大小是50M,估算基因组coverage/depth大小?

应该是,

总长 4,000,000x150 bp=600,000,000 bp /4=150,000,000 BT=150M

但其实fastq格式储存的数据大小要比实际的数据量虚高一些,所以实际的fastq文件要大。

coverage=测序数据大小150M/基因组大小50M = 3

结语:

熟知单位换算对预测测序结果提前估量有一定的帮助,当测序结果未达到要求时,可以合理要求测序公司对不符合的样本重新上机测序。有关问题欢迎一起来探讨啊

参考:

Base vs Byte: Estimating the storage requirement of sequencing - SEQOME

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容