cas-offinder预测Crisp-cas9编辑脱靶位点

使用cas-offinder V2.4.1来预测脱靶位点

直接从cas-offinder github下载二进制文件即可。
运行命令如下:
cas-offinder input.txt G0,1 geneid.output.txt

  • 参数1:input.txt 即配置文件
    输入配置input.txt文件格式如下:
    • 第1行使你存放参考基因组的路径,注意路径内只能有参考基因组文件,不要有其他fa文件
    • 第2行pam序列,前面的NNNNN只是为了匹配和下面的tracer相同的长度,最后的NGG才是代表分析使用的pam序列,N代表任意碱基
    • 第3行 第1列是tracer序列,是载体上确定基因组上编辑位点的序列,最后的NNN同样是为了匹配长度。第2列是编辑的碱基数量 可以再最后加一个第三列表示该tracer的名称

如果你的载体上有多个gRNA,则在第3行之后,按照第3行的格式增加新的行,每一行是一个tracer序列。 后面的数字表示突变的位点数量

  • 参数2:G0,1, 分析使用cpu还是GPU,
    G0,1表示使用第1个和第2个gpu进行分析
    G0表示使用第1个gpu进行分析
    C 表示使用cpu进行分析
  • 参数3:geneid.output.txt 输出文件夹名称

运行 cas-offinder -h命令会出现下面的内容

Cas-OFFinder v2.4.1 (Jan 23 2021)
Copyright (c) 2013 Jeongbin Park and Sangsu Bae
Website: http://github.com/snugel/cas-offinder
Usage: cas-offinder {input_filename|-} {C|G|A}[device_id(s)] {output_filename|-}
(C: using CPUs, G: using GPUs, A: using accelerators)
Example input file:
/var/chromosomes/human_hg19
NNNNNNNNNNNNNNNNNNNNNRG
GGCCGACCTGTCGCTGACGCNNN 5
CGCCAGCGTCAGCGACAGGTNNN 5
ACGGCGCCAGCGTCAGCGACNNN 5
GTCGCTGACGCTGGCGCCGTNNN 5
Available device list:
Type: GPU, ID: 0, <NVIDIA GeForce RTX 4090> on <NVIDIA CUDA>
Type: GPU, ID: 1, <NVIDIA GeForce RTX 4090> on <NVIDIA CUDA>

输出最下面即是你的显卡信息,如果没有显卡则不会显示。

最终输出结果格式解析:
注意此处的位置(例如下面的82252642 ,实际IGV中是82252643),下标是从0开始。所以后续分析时需要注意这个差别。

原始序列 染色体 位置 突变后的序列 序列的方向 错配碱基数量 对应的tracer名称
GGGAACCCCTGAGGCCCCCGNNN chr01 82252642 GaGAACCCCgGAGGaCCCCGGGG + 3 chr05_0322_T1
GGGAACCCCTGAGGCCCCCGNNN chr03 7932303 GGaAACCCCTaAGGCCCCCGtGG + 3 chr05_0322_T1

突变后的碱基序列中小写字母的位置即为突变的位置
一般情况下,错配0-3个碱基为大概率事件,错配4-5个位中概率事件,错配>=6的属于低概率事件,一般不用考虑,但是仍需要实验验证。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容