2023-01-13-L8_Epigenomics

图片.png
图片.png

Bowite 对参考基因组建立索引的方法是 Burrows-Wheeler transform (BWT) 和 FM index


挺神奇的,通过简单的建矩阵-排序就能还原原序列

BWT算法的特点

1、非常少的内存占用。与输入相同(或更少)

不需要整个矩阵,或字符串,只是指针
编码:简单地排序指针。解码:遵循指针

2、原始(传统)应用:字符串压缩(bZip2)

运行的相同字母压缩成1个字母

3、生物信息学应用:子字符串搜索

实现类似的运行时间作为哈希表,后缀树
但:非常节省内存→实际速度增益

4、比对100,000个reads:只需转换一次

预处理一次;转换空间中的读计数。
反向变换一次,比对到基因组坐标

IDR

Chip-seq

ChIP指染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP),seq 指的是二代测序,那么ChIP-seq实际上也就是染色质免疫共沉淀+二代测序的一个过程。

参考资料:

https://blog.csdn.net/weixin_34039159/article/details/112763207

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容