RNAseq教程(2.3)

目录

1.Module 1 - Introduction to RNA sequencing

  1. Installation
  2. Reference Genomes
  3. Annotations
  4. Indexing
  5. RNA-seq Data
  6. Pre-Alignment QC

2.Module 2 - RNA-seq Alignment and Visualization

  1. Adapter Trim
  2. Alignment
  3. IGV
  4. Alignment Visualization
  5. Alignment QC

3.Module 3 - Expression and Differential Expression

  1. Expression
  2. Differential Expression
  3. DE Visualization
  4. Kallisto for Reference-Free Abundance Estimation

4.Module 4 - Isoform Discovery and Alternative Expression

  1. Reference Guided Transcript Assembly
  2. de novo Transcript Assembly
  3. Transcript Assembly Merge
  4. Differential Splicing
  5. Splicing Visualization

5.Module 5 - De novo transcript reconstruction

  1. De novo RNA-Seq Assembly and Analysis Using Trinity

6.Module 6 - Functional Annotation of Transcripts

  1. Functional Annotation of Assembled Transcripts Using Trinotate

2.3 IGV

1.introduction

Description of the lab

高通量测序最受欢迎的工具-IGV(Integrative Genomics Viewer)

伴随本教程的文件

完成本次教程可实现以下工作

  • 可视化各种基因组数据

  • 快速导航基因组

  • 可视化reads比对情况

  • 肉眼验证SNP/SNV

Requirements

  • Integrative Genomics Viewer

  • Ability to run Java

  • Note that while most tutorials in this course are performed on the cloud, IGV will always be run on your local machine

Compatibility

本教程是为IGV v2.3准备的,可以在IGV下载页面上找到。强烈建议使用这个版本。

Data Set for IGV

使用公开的来自HCC1143细胞系的Illumina序列数据。HCC1143细胞系是从一名患有乳腺癌的52岁白人妇女体内产生的。这个细胞系的附加信息可以在这里找到:HCC1143(tumor, TNM stage IIA, grade 3, primary ductal carcinoma)以及HCC1143/BL(matched normal EBV transformed lymphoblast cell line).

2. Getting familiar with IGV

Get familiar with the interface

载入一个基因组:

默认情况下,IGV加载Human hg19。如果你研究的是另一个版本的人类基因组,或者另一种物种,你可以通过点击左上角的下拉菜单来改变基因组。在这个教程中,我们将使用人类hg19。

也可以采用以下方式(File -> Load from Server...):

  • Ensembl genes (or your favourite source of gene annotations)
  • GC Percentage
  • dbSNP 1.3.1 or 1.3.7

Navigation:

在这个参考基因组中可以看到染色体列表,选择1号染色体。

location字段(在界面的左上角)中输入,导航到chr1:10 000- 11000,然后单击Go。这显示了1号染色体的窗口宽1000个碱基对,从10000号位置开始。

IGV以颜色序列的形式显示基因组中的碱基序列(例如A=绿色,C =蓝色,等等)。这使得重复序列,比如在这个区域开始处发现的那些序列,很容易识别。放大一点使用+按钮看到参考基因组序列的单个碱基。

你可以在基因组坐标所在的框中输入你感兴趣的基因,然后按Enter/Return键。试试你最喜欢的基因,或者BRCA1。

基因用线和框表示。线代表内含子区域,框代表外显子区域。箭头表示该基因的转录方向/链。当一个外显子框变窄,这表示一个UTR。

Region Lists

有时,保存当前位置或加载感兴趣的区域真的很有用。为此,IGV中有一个区域导航器。要访问它,单击Regions > Region Navigator。在浏览基因组时,可以随时按Add按钮保存一些书签。

Loading Read Alignments

我们将使用乳腺癌细胞系HCC1143来可视化比对结果。在速度方面,只有一小部分chr21将装载(19M:20M)。

HCC1143 Alignments to hg19:

复制文件到你的本地,并在IGV中选择File > Load from File...,选择bam文件,并单击OK。注意,为了让IGV正确地加载它们,bam文件和索引文件必须在同一个目录中。

Visualizing read alignments

选择染色体位点:chr21:19,480,041-19,480,386

To start our exploration, right click on the track-name, and select the following options:

  • Sort alignments by start location
  • Group alignments by pair orientation

通过右键点击比对界面和切换选项来试验各种设置。想想哪一种方法最适合特定的任务(例如,质量控制、SNP调用、CNV查找)。

3.Inspecting SNPs, SNVs, and SVs

Two neighbouring SNPs

  • Navigate to region chr21:19,479,237-19,479,814
  • Note two heterozygous variants, one corresponds to a known dbSNP (G/T on the right) the other does not (C/T on the left)
  • Zoom in and center on the C/T SNV on the left, sort by base (window chr21:19,479,321 is the SNV position)
  • Sort alignments by base
  • Color alignments by read strand

Homopolymer region with indel

Navigate to position chr21:19,518,412-19,518,497

Coverage by GC

Navigate to position chr21:19,611,925-19,631,555. Note that the range contains areas where coverage drops to zero in a few places.

**Example **

  • Use Collapsed view
  • Use Color alignments by -> insert size and pair orientation
  • Load GC track
  • See concordance of coverage with GC content

Heterozygous SNPs on different alleles

Navigate to region chr21:19,666,833-19,667,007

**Example **

  • Sort by base (at position chr21:19,666,901)

对于这两个snp,等位基因之间没有联系,因为两个snp的reads都只包含一个或另一个

4.Automating Tasks in IGV

我们可以使用Tools菜单调用运行批处理脚本。IGV网站描述了批处理脚本:

下载数据集的批处理脚本和属性文件:

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,242评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,769评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,484评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,133评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,007评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,080评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,496评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,190评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,464评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,549评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,330评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,205评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,567评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,889评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,160评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,475评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,650评论 2 335

推荐阅读更多精彩内容