circos基因共线性分析

共线性分析是指研究基因组或染色体中的基因之间的演化关系和相关性的方法。它可以帮助揭示基因重复事件、基因家族、基因重排和基因功能保留等不同生物过程中的重要信息。
在共线性分析中,通常使用序列比对和比较的方法来识别基因组中的共线性区域。这些方法可以检测到同源基因、重复序列、倒转片段和基因重排等结构变化,并提供了解基因组进化和功能保留的线索。
共线性分析的结果可以用来构建基因组图谱、揭示基因家族的演化、预测基因功能和进化等。这对于研究物种的遗传演化、基因功能和基因组结构具有重要意义,并且在农业、医学和生物技术等领域中也有广泛的应用。

MCScanX有两个主要的功能, 一是, 方便使用者发现共线性(collinearity)和同线性(synteny)关系并且可以从共线性区块中看到清晰多重比对; 二是, 通过其中众多的辅助脚本, 更形象的分析同线性和共线性的数据
下面就从零开始共线性的分析吧~
注: 稍微解释一下synteny and collinearity的关系, 假设有A B C三个基因, 在species1中的排列为ACB, 而在species2中排列为CAB, 则这两个区段称为synteny; 如果在species3中排列为ABC, 在species4中排列也为ABC, 则这两个区段称为collinearity

进行 Circos 基因共线性分析,需要以下步骤:
  1. 准备数据:获取基因组序列文件、基因注释文件和基因共线性结果文件。确保数据格式符合要求。
  2. 配置 Circos:创建 Circos 的配置文件,通常命名为 circos.conf。在配置文件中,指定基因组数据的位置、样式、颜色、图像大小等信息。
  3. 处理共线性数据:将基因共线性结果文件转换为 Circos 可识别的格式。可以使用 MCScanX 或其他共线性分析工具生成的结果,然后通过脚本或自定义代码将其转换为 Circos 的输入格式。
第1列:染色体ID,指连线起始的染色体
第2列:连线起始的染色体的起始位置
第3列:连线起始的染色体的终止位置
第4列:染色体ID,指连线的终止染色体
第5列:连线终止的染色体的起始位置
第6列:连线终止的染色体的终止位置
第7列:连线颜色,这一列可以省略
chr01   23224373    23226605    chr01   29960694    29963049    color=142,212,202
chr01   23247278    23250623    chr01   29987911    29994075    color=142,212,202
chr01   23316218    23322871    chr01   29995196    29999996    color=142,212,202
chr01   23324460    23325125    chr01   30003535    30005888    color=142,212,202

安装MCScanX

wget https://codeload.github.com/wyp1125/MCScanX/zip/refs/heads/master
unzip master.zip
cd MCScanX-master
make
# 测试安装是否成功(能打印出来help信息则表示成功)
./MCScanX -h
# 成功则添加到环境变量
echo 'export PATH=$PATH:'"$(pwd)" >> ~/.bashrc
source ~/.bashrc

共线性分析

pep= Oryza_sativa.IRGSP-1.0.pep.all.fa
gff3=Oryza_sativa.IRGSP-1.0.48.gff3
mkdir blastresult
makeblastdb -in ${pep} -dbtype prot -out Os  
blastp -query ${pep} -db Os -out ./blastresult/Os.blast -evalue 1e-10 -num_threads 10 -outfmt 6 -num_alignments 5
# 格式化gff3文件,后面用的gff3都是格式化好的,千万注意
awk -vFS="\t" -vOFS="\t" '{if($3=="mRNA"){match($9,/ID=([^;]+)/,a);sub(/ID=/,"",a[0]);print $1,a[0],$4,$5}}' ${gff3} > ./blastresult/Os.gff
cd blastresult
MCScanX Os
cd ./blastresult
grep -v "#" tair10.collinearity | cut -f2,3 | \
awk -vFS="\t" -vOFS="\t" 'NR==FNR{arr[$2]=$2;brr[$2]=$1"\t"$3"\t"$4}NR!=FNR{if(arr[$1]==$1)print brr[$1],$2}' Os.gff - | \
awk -vFS="\t" -vOFS="\t" 'NR==FNR{arr[$2]=$2;brr[$2]=$1"\t"$3"\t"$4}NR!=FNR{if(arr[$4]==$4)print $1,$2,$3,brr[$4]}' Os.gff - > ../circos.link.txt
link文件格式
###circos.conf 文件加上这些
<links>

<link>
file          = num/link
radius        = 0.44r
color         = blue_a4
ribbon = yes
</link>

</links>
最终的连线
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,634评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,951评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,427评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,770评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,835评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,799评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,768评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,544评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,979评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,271评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,427评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,121评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,756评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,375评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,579评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,410评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,315评论 2 352

推荐阅读更多精彩内容