捣鼓两天才搞明白的bug:
bug1表现形式:
1 clip-seq数据突变比率严重下讲
2 缺失substitution和deletion类型的突变,仅存在少量的insertion(正常情况下,这种突变类型最低)
bug1 原因:
PIPE-CLIP需要sam文件中具有表示该read突变数量的tag NM,
如 NM:i:2 ,表示该read有两个mismatch
但 STAR的默认输出tag中仅包括四个tag,如图:。 导致PIPE-CLIP不能识别突变read,从而降低了read利用率,导致结果异常
bug1 解决办法:
在STAR的比对中,增加参数 --outSAMattributes All
其他比对参数可参考:
文章:https://www.sciencedirect.com/science/article/pii/S1046202318304948
以及:https://psb.stanford.edu/psb-online/proceedings/psb16/kassuhn.pdf