mtscATAC-seq 使用 mgatk 鉴定高质量变异

mgtak 共有 3 种主要模式:callbcalltenx 每种模式输出相同的文件,根据输入数据的来源和格式以及计算资源,选择合适的模式;和 2 种支持模式:checksupport 辅助更好地使用 mgtak。

  • 每个样本一个 .bam文件,则使用 call 模式;
  • 来自 10x Genomics 文库的数据,使用 tenx 模式;
  • 拥有单细胞数据或多个样本在一个 .bam文件中,但有非常规的条形码,或者是未知的条形码,使用 bcall 模式;

mgtak tenx 的使用:

输入文件为 cellranger-atac 输出文件

mgtak tenx -i $bamfile \  # cellranger-atac 输出的 bam 文件: pbmc_10k/out/possorted_bam.bam (该目录下需含有其 .bam.bi 文件)
    -b $barcodefile \  # cellranger-atac 输出 barcode 文件:pbmc_10k/out/filtered_feature_bc_matrix/barcodes.tsv
    -bt CB \  # 读取标签(一般为两个字母)以分离单个细胞;仅在' bcall '模式下有效且必需。
    -n $name \  # project name
    -o $outdir \  # outdir 
    -c 12  # 并行运行主作业的核数

-bt CB 表示 CB SAM 标签表示每个单细胞的 barcodes, 默认为 10X .bam 文件

输入文件为 cellranger 的输出:

mgatk tenx \
  -i ${outdir}/outs/possorted_bam.bam \
  -n CRR_test1 \
  -o CRR_test1_mgatk \
  -c 12 \
  -ub UB \ # 读取标签(通常是两个字母),以指定在删除重复基因分型时的UMI标签。
  -bt CB \
  -b ${outdir}/outs/filtered_feature_bc_matrix/barcodes.tsv

mgatk 的模式介绍

call

call 模式输入 .bam 文件目录,识别所有 .bam 文件,并将每个文件视为单独的样本。该模式适用于 1) Fluidigm C1, Smart-seq2 和其他基于平板的检测;2) 批量基因组学样本。要运行此模式,只需指定文件路径并添加所需的任何其他用户选项。

mgatk call -i folder_of_bam_files ...

bcall

bcall 模式利用用户指定的 cell barcode 来识别不同的细胞,可以是已知的条形码列表 (-b FILE),也可以是通过识别大于X 个 mtDNA reads 的条形码 (-mb X)。将主.bam 文件拆分为数千个单细胞 bam,然后依次处理它们。打开数千个 tile 会对文件系统造成压力,可使用 -ns 来减少一次打开的文件数量。

使用 bcall,指定包含 mtDNA reads 的有效的 .bam 文件,并使用 -b 或 -mb 选项:

mgatk bcall -i path_to_bam_file ...

tenx

tenx 模式利用 10x Genomics .bam 文件。16bp 条形码和可选的 UMI 用于实现更智能的处理,从而避免将原始的 bam 文件拆分为数千个单独的文件。运行时间也更快。例如,输入文件是 CellRanger 或 CellRanger- atac 的输出)。

基本输入需要一个 bam文件和一个用于分析的已知 HQ 条形码,例如由 CellRanger knee call 产生的条形码:

mgatk tenx -i path_to_bam_file -b known_barcodes_file ...

check

check 模式检查上述的输入。减少不正确的文件路径,错误的参考基因组规格,或缺少依赖项等问题影响分析。

support

support 模式显示可用的内置配置。

鉴定信息的变体

使用 Seurat/Signac R 包分析 mtscATAC-seq 的 mtDNA变异

适合多种形式

  • ReadMGATK 从 mgatk 输出中导入文件,并将它们存储在Seurat对象中;
  • IdentifyVariant 利用 mtscATAC-seq 库上的链一致性和 VMR 统计来鉴定高质量的亚克隆变异;
  • FindClonotypes 从前面的函数中获取高置信度的变体,然后通过异质空间中的细胞-细胞邻居图构建来推断克隆;
  • AlleleFreq 计算每个细胞/变体的等位基因频率;

使用 mgatk 自动鉴定

不适用于液滴的 scRNA-seq ,因为只有一条链被测序。

stand correlation 和 variance-mean ratio 的图是识别 mtDNA 变异信息量最大的图,默认输出在 ".vmr_strand_plot.png"。x轴代表了一个变体在细胞中的正向和反向链读取计数之间的 Pearson 相关性。该指标基于链间异质性的总体一致性,有效地分离了低质量变异和高质量变异。总的来说,是确定一种突变模式,其中一些变异比其他变异更常见(转换比颠换更常见)。此图可以在 mgatk 输出的 ".variant_stats.tsv.gz" 和 "refallee .txt" 文件中快速生成。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,132评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,802评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,566评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,858评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,867评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,695评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,064评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,705评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,915评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,677评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,796评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,432评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,041评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,992评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,223评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,185评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,535评论 2 343

推荐阅读更多精彩内容