长链非编码RNA(long non-coding RNA,lncRNA)是一类存在于真核生物中,长度大于200个核苷酸,同时不表现出任何蛋白质编码潜能的非编码RNA。
最初它们被认为是RNA聚合酶Ⅱ转录的副产物,没有生物学功能。但是随着研究的深入,人们发现:虽然lncRNAs本身不编码蛋白质,却在真核生物的基因表达调控中起着非常重要的作用,它以RNA的形式参与了生物体基因组印记、染色质修饰,转录激活、转录干扰,核内运输等多种重要的调控过程,从而发挥其生物学功能。lncRNAs的长度通常在200nt~100000nt之间,结构类似于mRNAs,经过剪接,具有poly(A)尾巴和启动子结构。由于lncRNAs与mRNAs存在一定的相似性,且lncRNAs与mRNAs均存在生物学功能,因此对lncRNAs与mRNAs的鉴定及区分工作尤为重要。
lncRNA在生物体内含量相当丰富,约占RNA的4-9%(mRNA约占1-2%)。lncRNA的组织特异性及特定的细胞定位,显示lncRNA受到高度严谨的调控,目前已知其与发育、干细胞维持、癌症及一些疾病相关。虽然近年来随着基因芯片及第二代高通量测序技术的广泛运用,lncRNA不断被发现,但此类转录本的确切功能还未知。目前市场上的lncRNA芯片通常将lncRNA与mRNA设计在一起,RNASeq数据中也包含lncRNA, mRNA序列,因此可以通过分析lncRNA与mRNA表达相关性对lncRNA进行功能注释。
可以分析的内容:
①计算LncRNA与mRNA表达相关性,根据设定的域值筛选lncRNA与mRNA关系对,构建lncRNA与mRNA共表达网络
②基于lncRNA与mRNA表达相关性以及lncRNA与mRNA基因组位置近邻关系,得到lncRNA的潜在靶标基因,对差异表达的lncRNA靶标基因进行功能注释以及功能富集分析
③研究lncRNA与mRNA的共表达网络的拓扑学特性,基于度筛选网络拓扑上重要的lncRNA,这些lncRNA极有可能是与研究背景相关的lncRNA
④客户提供研究背景相关一组基因,根据表达相关性可以找出与这组基因相关的lncRNA,从而构建出感兴趣的共表达网络。通过构建的共表达网络能进一步找到感兴趣的 hub lncRNA
lncRNA深度挖掘分析
1 差异lncRNA靶基因预测
lncRNA的靶基因较为复杂,主要分为正式和反式两种作用机制.lncRNA作用机制与miRNA类似,均可以通过调控相应的mRNA来行使功能,所以靶基因的预测在科学研究中都显得非常必要。
2 靶基因Gene Ontology分析
我们将靶基因向gene ontology数据库的各节点映射,计算每个节点的基因数目.
3 靶基因Pathway分析
信号通路分析需要完备的注释信息支持,通过整合KEGG、Biocarta、Reactome等多个数据库的信息可以精确检验来进行Pathway的显著性分析。
4 lncRNA与调控基因的表达机制
通过整合lncRNA的信息和靶基因之间的关系,我们可以得到一个lncRNA与靶基因之间的调控网络图.
5 转录因子结合位点预测
对于差异表达lncRNA,提取转录起始位点上下游序列,使用预测程序对其转录因子结合位点进行预测.
6 基因关联分析
现在市面上的lncRNA芯片均含有mRNA的表达探针,通过将lncRNA的靶基因分析结果与芯片上mRNA的表达结果做关联分析,可以更进一步的分析lncRNA的功能。
7 信号通路调控网络构建:
实验中基因同时参与了很多Pathway,通过构建信号通路调控网络,从宏观层面看到Pathway之间的信号传递关系,在多个显著性Pathway中发现受实验影响的核心Pathway,以及实验影响的信号通路之间的调控机理。
8 lncRNA的功能分析
根据lncRNA最新的功能数据库,利用生物信息学工具,做出Function-Tar-Net图表,从而得出lncRNA与功能的关系