HiC数据预处理后一些输出格式(整理中,欢迎补充)

Juicer的输出文件: merged_nodups.txt

  1. read1的FLAG,对应SAM的第二列,FLAG
  2. read1比对的contig,对应SAM的第三列,RNAME
  3. read1比对的contig的位置,对应SAM的第四列,POS
  4. read1排序后的位置编号
  5. read2的FLAG,对应SAM的第二列,FLAG
  6. read2比对的contig,对应SAM的第三列,RNAME
  7. read2比对的contig的位置,对应SAM的第四列,POS
  8. read1排序后的位置编号
  9. read1的比对得分,对应SAM的第五列,MAPQ
  10. read1的CIGAR,对应SAM的第六列,CIGAR
  11. read1的序列
  12. read2的比对得分,对应SAM的第五列,MAPQ
  13. read2的CIGAR,对应SAM的第六列,CIGAR
  14. read2的序列
  15. read1的ID
  16. read2的ID

Read所在链可以通过FALG计算,我统计之后发现只有0和16两个值(2048会被直接过滤掉),0表示'+',而16表示'-'。

HiC-Pro的输出文件*.allValidPairs

  • read的ID
  • read1比对的contig,对应SAM的第三列,RNAME
  • read1比对的contig的位置,对应SAM的第四列,POS
  • read1所在链
  • read2比对的contig,对应SAM的第三列,RNAME
  • read2比对的contig的位置,对应SAM的第四列,POS
  • read2所在链
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容