第六部分暂时发现一点问题,改天补充~
基因家族流程:基因家族分析(一)
基因家族流程:基因家族分析(二)
基因家族流程:基因家族分析(三)
基因家族流程:基因家族分析(四)
基因家族流程:基因家族分析(五)
==================================================================
顺式作用元件分析(Cis-regulatory elements analysis)
1.顺式作用元件:
顺式作用元件(cis-acting element)存在于基因旁侧序列中能影响基因表达的序列。顺式作用元件包括启动子、增强子、调控序列和可诱导元件等,它们的作用是参与基因表达的调控。顺式作用元件本身不编码任何蛋白质,仅仅提供一个作用位点,要与反式作用因子相互作用而起作用。
2.数据准备:
- 启动子区域:gene或者ATG上游-2000bp序列之内,有人用1000bp。
- 转录起始点(TSS)在5'-UTR上游,实际位置不确定。
- 获取方法:
1.有些数据库可直接下载(upstream)
2.TBtools(第4点有详细链接)
3.bedtools
选择正负链前后1000bp处作为筛选promoter区域,chr.At为染色体长度文件,genefamily.bed参看之前的内容
bedtools flank -i genefamily.bed -g chr.At -l 1000 -r 0 -s >genefamily.1kb.promoter.bed
getfasta 提前序列
bedtools getfasta -name -fi At_v1.genome -bed genefamily.1kb.promoter.bed
3.在线工具:
PlantCARE, a database of plant promoters and their cis-acting regulatory elements:
http://bioinformatics.psb.ugent.be/webtools/plantcare/html/
使用方法:Search for CARE —sequences—search
邮箱查收,excel整理tab文件
- 注意:有时候N多上传不了,重复几次,一次序列长度2000没问题
4.分析结果可视化:
具体参看CJ大神的文章:植物启动子-顺势作用元件-批量提取-预测-可视化分析
推荐TBtools的Simple BioSequence Viewer功能绘图。
-
结果统计:
1.统计两条链的顺式元件结果(也有统计单链的,看实际情况统计双链,以下图片仅为基因锁在链结果)
2.筛选逆境相关元件结果,位置,正负链
3.画图嘛,有点坑(单链推荐IBS软件,不过也很坑)
转录组数据分析
1.下载ncbi公共数据分析,提取家族基因表达量。
2.家族足够大,GO和KEGG分析。
最后
基因家族分析全部更新完~如果有问题可以联系我。