Q:功能基因组学?

功能基因组学(Functional genomics)是对基因组中基因与基因间区域如何参与不同生物学过程的研究。在实际过程中,我们经常从“全基因组”角度(即包含所有或多个基因/区域)出发,希望将其范围缩小到要分析的候选基因或区域列表。
简言之,功能基因组学就是研究基因产物在特定情况下(如特定发育阶段或疾病)的动态表达,并尝试将开发将我们了解的基因型(功能)与表型联系起来的模型。
根据愤懑关注的重点,可以分为以下几种特定的方法:

  • DNA水平(基因组学和表观基因组学)
  • RNA水平(转录组学)
  • 蛋白质水平(蛋白质组学)
  • 代谢物水平(代谢组学)
功能基因组学

下面着重学习下功能基因组学常见的分析方法:

1.Microarray

微阵列芯片(Microarray)是DNA探针的集合,探针通常是“喷墨印刷”在载玻片(Agilent)上或原位合成(Affymetrix)的挂衣核苷酸链(oligo)。来自目标样品的标记单链DNA或反义RNA片段在特定调节下与DNA微阵列杂交,随后检测特定探针的杂交量。杂交量与样品中的核酸片段数量成正比。
Microarray可分为:单色和双色。


单色和双色芯片

双色芯片可以在一定程度上抵消偏色效应


双色芯片

技术重复和生物学重复

重复

整理分析流程

芯片分析流程

1.1 特征提取(Feature extration)

特征提取就是将扫描的到信号转为gene IDs,样品名称和其他可用信息的过程。

特征提取

此过程通常用芯片制造上提供的软件进行操作,生成原始文件(raw data: unprocessed)这些数据通常是binary或text格式。可以用oligoaffy, limmalumi进行分析。
原始数据文件格式

1.2 质量控制(Quality Control)

在Expression Atlas中,使用ArrayQualityMEtricsR包进行。只要关注芯片信号强度,PCA聚类和密度估计等信息。

质量控制

1.3 标准化(Standardization)

芯片的标准化主要用于控制技术差异,同时保留生物学差异。
标准化的流程是基于:

实验组中大多数基因相对于对照组不会差异表达

常见的标准化方法:

  • Expression Atlas(Affymetrix)→ oligo::rma()
  • Agilent单色芯片: limma::normalizeQuantiles()

1.4 差异分析

差异分析是为了鉴定不同条件下表达不同的基因,此时应进行多次测试的校正。(因为对少量样品进行数千次比较时,会导致假阳性的增加)
常见的是应用limm包进行差异分析

options(digits = 4) #保留4位下数
library(limma)
group_list <- c(rep("normal",101), rep("tumor",101))
group_list <- factor(group_list, levels=c("nromal", "tumor")
design <- model.matrix(~factor(group_list)) #分组信息
fit <- lmFit(data,design)
fit <- eBayes(fit)
deg <- topTable(fit,coef = 2,adjust="BH",number = Inf) %>%
  arrange(logFC) %>%
  rownames_to_column("id")

2. RNA-seq

RNA测序是高通量测序技术对cDNA分子的应用,通过从RNA反转录获得。


RNA-seq流程

2.1 建库(library)

cDNA文库的构建取决于所用RNA的类型,使用总RNA可以检测ncRNA和mRNA,但是可能进行相应处理(如消耗核糖体RNA)以检测低丰度的转录本。PolyA+ RNA富集适合真核生物的mRNA纯化。


配对末端测序和比对

另一个考虑因素是是否生成保留原始RNA转录方向的链特异性文库,这对于鉴定翻译或非编码RNA非常重要。

2.2 测序(sequencing)

从扩增的文库中获得核酸序列,以高通量的方式对每个分子进行测序,从一端(单端测序)或两端(成对端测序)获得数百万个短读序列+相关的质量评分(如FASTQ文件)。这个通常由核心机构或外部公司完成。


FASTQ文件

2.3 质量控制

  • 去接头
  • 去除低质量reads
  • uncalled bases
  • 过滤污染物(不是源生物产生的序列)。重要的是要检查所有样本的序列质量是否相近,并丢弃异常值。
    常用软件:
  • FastQC:质量评估
  • Trimmomatic:去除PCR引物,衔接子序列,修剪得分较低的碱基和低质量的N碱基。

2.4 比对和排序

比对和排序

2.5 Quantification

用GTF(gene transfer format)作为参照,获取RPKM/FPKM/HTSea-count文件。

2.5 差异分析

常用DESeq2、edgeR差异分析。

RNA-seq数据分析

参考链接:
Functional genomics II Common technologies and data analysis methods

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,635评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,628评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,971评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,986评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,006评论 6 394
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,784评论 1 307
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,475评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,364评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,860评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,008评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,152评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,829评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,490评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,035评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,156评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,428评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,127评论 2 356

推荐阅读更多精彩内容