使用cas-offinder V2.4.1来预测脱靶位点
直接从cas-offinder github下载二进制文件即可。
运行命令如下:
cas-offinder input.txt G0,1 geneid.output.txt
- 参数1:input.txt 即配置文件
输入配置input.txt文件格式如下:- 第1行使你存放参考基因组的路径,注意路径内只能有参考基因组文件,不要有其他fa文件
- 第2行pam序列,前面的NNNNN只是为了匹配和下面的tracer相同的长度,最后的NGG才是代表分析使用的pam序列,N代表任意碱基
- 第3行 第1列是tracer序列,是载体上确定基因组上编辑位点的序列,最后的NNN同样是为了匹配长度。第2列是编辑的碱基数量 可以再最后加一个第三列表示该tracer的名称
如果你的载体上有多个gRNA,则在第3行之后,按照第3行的格式增加新的行,每一行是一个tracer序列。 后面的数字表示突变的位点数量
- 参数2:G0,1, 分析使用cpu还是GPU,
G0,1
表示使用第1个和第2个gpu进行分析
G0
表示使用第1个gpu进行分析
C
表示使用cpu进行分析 - 参数3:geneid.output.txt 输出文件夹名称
运行 cas-offinder -h
命令会出现下面的内容
Cas-OFFinder v2.4.1 (Jan 23 2021)
Copyright (c) 2013 Jeongbin Park and Sangsu Bae
Website: http://github.com/snugel/cas-offinder
Usage: cas-offinder {input_filename|-} {C|G|A}[device_id(s)] {output_filename|-}
(C: using CPUs, G: using GPUs, A: using accelerators)
Example input file:
/var/chromosomes/human_hg19
NNNNNNNNNNNNNNNNNNNNNRG
GGCCGACCTGTCGCTGACGCNNN 5
CGCCAGCGTCAGCGACAGGTNNN 5
ACGGCGCCAGCGTCAGCGACNNN 5
GTCGCTGACGCTGGCGCCGTNNN 5
Available device list:
Type: GPU, ID: 0, <NVIDIA GeForce RTX 4090> on <NVIDIA CUDA>
Type: GPU, ID: 1, <NVIDIA GeForce RTX 4090> on <NVIDIA CUDA>
输出最下面即是你的显卡信息,如果没有显卡则不会显示。
最终输出结果格式解析:
注意此处的位置(例如下面的82252642 ,实际IGV中是82252643),下标是从0开始。所以后续分析时需要注意这个差别。
原始序列 | 染色体 | 位置 | 突变后的序列 | 序列的方向 | 错配碱基数量 | 对应的tracer名称 |
---|---|---|---|---|---|---|
GGGAACCCCTGAGGCCCCCGNNN | chr01 | 82252642 | GaGAACCCCgGAGGaCCCCGGGG | + | 3 | chr05_0322_T1 |
GGGAACCCCTGAGGCCCCCGNNN | chr03 | 7932303 | GGaAACCCCTaAGGCCCCCGtGG | + | 3 | chr05_0322_T1 |
突变后的碱基序列中小写字母的位置即为突变的位置
一般情况下,错配0-3个碱基为大概率事件,错配4-5个位中概率事件,错配>=6的属于低概率事件,一般不用考虑,但是仍需要实验验证。