TCR

TRUST

1、 概述

TRUST,是从RNA-seq原始数据组装到TCR CDR3的软件,专门为RNA-seq数据设计的工具[Ref1]。

它是这样评价先前的工具的:[Ref2]

However,these studies adopted computational methods not specifically designed for unselected RNA-seqdata14–16, resulting in poor detection of CDR3 sequences and limited power in downstream characterization of the tumor-infiltrating T cell repertoires of the cohorts.

2、 工作流程

比对RNA-seq数据,把那些没有比对到基因组的reads从头组装出候选CDR3序列,最后用IMGT数据库的数据注释这些序列,保留能注释到的作为最终组装到的CDR3序列。

原理示意图:


3、 TRUST的使用

一、输入准备:

输入文件需要bam和与之对应的索引文件bai

第一步:比对RNA-seq数据,获得bam文件,并且将未比对上的reads和比对上的reads合并到一个bam文件里,作为TRUST输入。

第二步:为输入文件bam构建索引,注意bam文件和对应的索引文件bai要在同一个路径下。

二、开始组装:

运行TRUST,组装CDR3

例子:以及tophat做比对软件为例

一、输入准备:

#比对RNA-seq数据

#注意使用tophat的-o参数,将每个样本比对结果单独写进自己单独的文件夹,因为tophat结果文件没有样本标签

tophat2 -o /pub6/temp/cmj/Bam2/sample  hg19  sample_1.fastq sample_2.fastq

#比对结果文件如下,如果不单独建立一个文件夹,后一个样本结果可能覆盖前一个样本

#合并比对上和未比对上的bam文件,输出为sample.unsorted.bam

samtools merge sample.unsorted.bam accepted_hits.bam unmapped.bam      

#构建sample.unsorted.bam文件的索引

samtools sort --threads 8 -o sample.sort.bam sample.unsorted.bam

samtools index sample.sort.bam

二、开始组装:

#组装CDR3序列

trust  -f  sample.sort.bam -g  hg19  -c

4、 参数介绍

trust  -f  sample.sort.bam -g  hg19  -c

##必须参数

-f      是你需要组装的RNA-seq比对的结果文件,里边需要含有未比对到基因组上的reads

-F     处理给定文件名list下所有的文件(在一个txt文档里)

-d     处理给定文件夹下所有的bam文件

#以上是三选一

-g     你要使用的索引,可选hg19或者hg38

##可选参数

-c    输出文件里,包含TCR基因的coverage文件

-B   组装BCR的序列(我未使用过)

-B  -L      组装BCR的轻链(我未使用过)

-o 输出结果所在的文件夹

更详细的情况请参考:

https://bitbucket.org/liulab/trust/

或者在该链接下对应的论坛交流

5、 结果文件

主要有三个文件:


其中.fa文件结果如下:

## Information line contains the following fields:

# File name

# Normalized read count, or relative expression

# Contig sequence length

# Total TCR reads count

# TRUST annotated variable gene

# TRUST annotated joining gene (and constant gene in the case of B cell heavy chain)

# Aligner reported gene (PE mode only)

# CDR3 amino acid sequence

# -log(E value), QC measure for mapping CDR3 contig to IMGT reference

# CDR3 DNA sequence

#其中第三个是每个基因覆盖度

#txt文件和fa文件基本一样,fa文件是经过过滤掉一些短的CDR3 aa(来源于该软件论坛)

Ref1: Ultrasensitive detection of TCR hypervariable-region sequences insolid-tissue RNA–seq data,Nat Genetics,30 March 2017.27

Ref2: Landscapeof tumor-infiltrating T cell repertoire of human cancers, Nat Genetics, 2016,27


©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,110评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,443评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,474评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,881评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,902评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,698评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,418评论 3 419
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,332评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,796评论 1 316
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,968评论 3 337
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,110评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,792评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,455评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,003评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,130评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,348评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,047评论 2 355

推荐阅读更多精彩内容