图片.png
图片.png
Bowite 对参考基因组建立索引的方法是 Burrows-Wheeler transform (BWT) 和 FM index
挺神奇的,通过简单的建矩阵-排序就能还原原序列
BWT算法的特点
1、非常少的内存占用。与输入相同(或更少)
不需要整个矩阵,或字符串,只是指针
编码:简单地排序指针。解码:遵循指针
2、原始(传统)应用:字符串压缩(bZip2)
运行的相同字母压缩成1个字母
3、生物信息学应用:子字符串搜索
实现类似的运行时间作为哈希表,后缀树
但:非常节省内存→实际速度增益
4、比对100,000个reads:只需转换一次
预处理一次;转换空间中的读计数。
反向变换一次,比对到基因组坐标
IDR
Chip-seq
ChIP指染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP),seq 指的是二代测序,那么ChIP-seq实际上也就是染色质免疫共沉淀+二代测序的一个过程。
参考资料:
https://blog.csdn.net/weixin_34039159/article/details/112763207