原理:基于不同建立经过纳米孔时,电流信号的差异
典型应用:
- 读长比较长,利于拼接
- 解决动植物多倍体高重复、高杂合的特性
- 也适用于细菌拼接
- 对RNA直接测序,无需反转录,直接识别RNA的碱基修饰
- 适合检测大片段结构变异
- 测序长度越长对定相分析越有利
测序设备
设备名称 | 特点 |
---|---|
minION | 入门选择,手持式,数据量30Gb |
GridION | 相当于5张芯片外加一台服务器 |
PromethION | 24或48个测序芯片,数据量达到Tb级别 |
MinION Mk1C | 可连接蓝牙或者Sim卡 |
Flongle | MinION和GridION的转换器 |
MinIT | 预装Linux系统 |
VolTRAX | 自动化文库制备 |
建库测序
对待测DNA的一些处理,是一个模板过程。
- DNA提取
评估核酸质量和完整性
可以使用Nanodrop仪器进行检验。
DNA :A260/A280 = ~1.8 ,A260/A230=~2.0-2.2
RNA : A260/A280 = ~2.0 ,A260/A230=~2.0-2.2
评估片段大小
使用Agilent Bioanalyzer/Tapestation,PFGE,fragment analyzer,FEMTO pulse
nanopore建库
给待测DNA两侧先加上A碱基,使平末端变成粘性末端,然后再加上Y接头以及马达蛋白。
测序错误
碱基识别的非准确性,每秒读数也不恒定。信号读取的频率无法做到一个碱基读一个,而是多个碱基一起读一个信号,相当于一个分类器。
nanopore测序文件可以生成fast5文件和fastq文件
fast5文件: 大而全,耗存储大,适合做碱基校正和表观遗传学分析。记录着设备运行时全部的信息,包括捕获的电信号值,设备运行时间,电压,温度等等信息。
- 可以使用HDFView 查看Fast5文件格式。https://www.hdfgroup.org/downloads/hdfview/
- 可以使用ont_fast5_api软件对fast5文件进行拆分与合并
fastq文件:常用,厂商一般给的,包含碱基和碱基质量
流程
Basecalling:将原始测序文件转换为碱基序列的过程
,如guppy工具主要包括三大功能:
1、碱基识别
这是它的主要功能,Guppy使用神经网络算法(RNN)将电信号数据解读为DNA或RNA的五个标准碱基,即腺嘌呤,鸟嘌呤,胞咳淀,胸腺咳淀和尿密淀。
2、拆分条码数据
如果建库时添加了barcode条形码,那么在序列开端和尾端均有Oxford Nanopore Technologies提供的条形码序列,Guppy数据拆分功能基于识别出的碱基序列。这个原理类似于illumina basecalling中的index拆分。
3、比对
将测序数据与参考序列进行比对,其实这个是调用minimap2做的,而且选项参数都是内置的,无法调整,所以,这个功能还是不要使用了,一个软件还是把自己该做的事情做好。
4、甲基化修饰位点检测
如果某个碱基发生了甲基化修饰,那么在碱基识别过程中就会表现出一些异常信息,这些离群信息有可能就是潜在的甲基化修饰位点,guppy目前也可以进行碱基修饰的检测,不过这个需要学习集,不同物种需要单独的学习集,目前只试验了大肠杆菌,人等模式生物,如果有需要可以尝试进行检测。
下载和安装参考官网
使用minion_qc来进行统计绘图
常用软件
以上内容整理至知乎https://zhuanlan.zhihu.com/p/102392867
原作者 公众号 基因学苑