用真实样本构建NGS模拟数据

  1. 真实bam文件,截取目标区域的reads
  2. 多个样本的不同区域reads 合并
  3. 合并的fastq1 /fastq2 ,提交分析
    在bwa 过程中提示: read1/read2 不匹配, 同一个位置的read name 不同。 可以统计read 数目, grep 看看
    修复read1/read2 ,BBmaps

BBMap :github clone
百度到的cmd:
~/BBMap/sh/repair.sh in=merged_1.fq in2=merged_2.fq out=merged.repaired_1.fq out2=merged.repaired_2.fq
但是执行过程中会提示无法找到 Java 类 : jgi.SplitPairsAndSingles


image.png

因为SplitPairsAndSingles.java没有编译
对~/BBMap/sh/current/jgi/SplitPairsAndSingles.java 进行编译
javac javac jgi/SplitPairsAndSingles.java
不懂java,编译后jgi目录下变成这样:


image.png

原始只有java文件,从新生成的文件上看肯定有问题。
但是看到SplitPairsAndSingles.class 已经生成,就试运行了一下,没有报错。
cmd:
java -ea -Xmx209866m -cp ~/BBMap/sh/current/ jgi.SplitPairsAndSingles rp in=merged_1.fq in2=merged_2.fq out=merged.repaired_1.fq out2=merged.repaired_2.fq
输出log:
image.png

修复后的reads 重新提交分析,bam文件正常生成。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容