全基因组测序数据的评估

2021/03/02

Evaluation of Whole Genome Sequencing Data

       Whole genome sequencing (WGS) can provide comprehensive insights into the genetic makeup oflymphomas.

一、比对

    1、选择参考基因组

        GRCh37 (hg19) and GRCh38

        Unlocalized sequences:已被定为到某条染色体上,但方向或具体位置仍未确定,以_random结尾

        Unplaced sequences:尚未被定位到某条染色体,以chrUn_开头

        EBV & decoy sequences:不属于人类基因组,但是高通量测序时会被测到的序列,标注为chrEBV及以_decoy结尾的序列

        Alternate loci:不同的单倍体型,一般以_alt结尾,也包括HLA序列

    2、预处理

         trimmomatic:remove sequencing barcodes

         *BWA-backtrack 如果使用需要在全长中映射读取的方法,测序读取的低质量部分的修剪提高了对齐质量。

         *BWA-MEM 局部比对,不需要修剪

    3、比对算法

         BWA (BWA-backtrack 、BWA-SW and BWA-MEM),Bowtie 2,and GEM

    4、BAM file 处理

         samtools,Picard,biobambam,and sambamba

        协调reads数据的排序、合并数据(如果样本已在多个lane上测序)、标记或删除PCR重复

二、不同遗传变异类型的鉴定

    1、variant calling

        SNV(single-nucleotide-variant): GATK HaplotypeCaller and Platypus  、 Mutect2 、  FreeBayes and Strelka2(适用于生殖、体细胞变异)

        Indel(insertions and deletions): Mutect2,Strelka2,Platypus

        SV(structural variant):插入、删除、重复、反转和易位( insertions, deletions, duplications, inversions, and translocations) Manta ,novoBreak and SvABA,DELLY  and LUMPY

        Copy number aberrations (CNAs) are also a class of structural variants.

        GC bias/coverage bias

    2、质量控制

        * FASTQC :  at the level of FASTQ fifiles

        * SAMTOOL: during BAM file postprocessing and at BAM file level

        * different variant calling methods themselves provide valuable QC information

    3、变异注释

        the variants need to be annotated with functional information.

        * gene annotation to identify whether the variant affects, e.g., the protein-coding sequence of a gene;

        * variant database information to disclose if a variant is, e.g., a known SNP or a known

somatic cancer mutation;

        *  potentially other information tracks, e.g., about sequence conservation (序列保守性) or regulatory elements.

        Tool: ANNOVAR, SnpEff, variant effect predictor, and Rbbt

三、驱动突变的鉴定     driver mutations

    1、比预期更高突变率:MuSiC,MutsigCV

    2、突变偏高的功能影响:Oncodrive-fm

    3、蛋白质某些部分突变的聚类:OncodriveCLUST

    4、常用检测基因组非编码区域driver mutation:LARVA、OncodriveFML

四、突变信号的鉴定    mutation signatures

         癌症基因组中的一组突变(包括driver和passenger突变)是多个突变过程活动的印记。 一些突变过程对引起的突变有特定的偏好。

    1、突变信号的无监督分析

        突变目录包含SNV在每个样本的三核苷酸上下文中的频率。

        非负矩阵因式分解( nonnegative matrix factorization,NMF):将突变目录分解为突变信号矩阵(mutational signature matrix)和曝光矩阵(exposure matrix,其中包含每个基因组中每个identified signature的活性)

        COSMIC, the Catalogue Of Somatic Mutations In Cancer, is the world's largest and most comprehensive resource for exploring the impact of somatic mutations in human cancer.(https://cancer.sanger.ac.uk/cosmic/)

        可能检测到新的信号,要求大量样本的可用性。

    2、突变信号的监督分析

        Tool: R packages deconstructSigs or YAPSA

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,444评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,421评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,363评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,460评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,502评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,511评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,280评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,736评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,014评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,190评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,848评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,531评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,159评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,411评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,067评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,078评论 2 352

推荐阅读更多精彩内容