circos可以说是基因组文章必备的主图了。现在也有好多教程,先分别探讨下个人喜好点。
- circos的软件。看官网的图,是不是非常酷炫。但是真正用好,研究明白会很痛苦。因为他的运行命令就只有
circos circos.conf
(忘了具体是啥 反正八九不离十),你要改图,你就要在conf文件里修改,改完了也不是即时生成,从vim编辑器里面出来再运行命令,但是实际上一个够用的基因组圈图根本用不上那么多功能。除了让你头痛....
2.Tbtools的circos。优点是有教程,可以在windows系统操作,新手友好,缺点是,准备所有圈的文件比较复杂,比如窗口,基因密度,重复序列密度。共线性确实能画,但是上色比较麻烦,linux命令确实是比在excel里面操作方便非常多。 - R语言版本的circos。能画circos图的R包,目前我已知的有两个,一个是
RCircos
,另一个是circlize
。据师兄说,前者比较旧,其他的应该没啥太大区别。我用的后者,基因密度,重复序列计数之类的基本不需要提,有个gff文件就搞定。
所以,现在是service time!!!
library(circlize)
library(RColorBrewer)
library(ComplexHeatmap)
coul <- colorRampPalette(brewer.pal(9, "Set3"))(12)
genome <- read.table('genome.txt')
colnames(genome) <- c("chr","start","end")
circos.par(start.degree = 90 , gap.degree = 3 )
circos.genomicInitialize(genome) ###生成最外圈的刻度
# gc
GC <- read.table('GC.txt')
colnames(GC) <- c("chr","start","end","value")
circos.genomicTrackPlotRegion(GC,track.height = 0.08, bg.border = NA,panel.fun = function(region, value, ...){
circos.genomicLines(region, value, type = "l",col='#9370DB',...)})
# gene
gene <- read.table('gene.pos')[,c(1,2,3)]
colnames(gene) <- c("chr","start","end")
circos.genomicDensity(gene,col = c("#67a9cf80"), track.height = 0.08,border = NA)
#repeat
rep <- read.table('EDTA.repeat.bed')
circos.genomicDensity(rep,col = c("#7fc97f"), track.height = 0.08,border = NA)
#pseudochromosome
circos.track(ylim = c(0, 1), bg.col =coul ,bg.border = NA, track.height = 0.05)
#co-line
###result of jcvi
bed<-read.table('anchor.loc.txt')
bed$diff <- bed$V3 - bed$V2
condition <- bed$diff > 1000000
filtered_bed <- bed1[condition, ]
bed1 <- filtered_bed[, c("V1", "V2", "V3")]
bed2 <- filtered_bed[, c("V4", "V5", "V6")]
#bed1<-read.table('bed1')
#bed2<-read.table('bed2')
#bed1$color <- factor(bed1$V1, levels = unique(bed1$V1), labels = coul)
circos.genomicLink(bed1, bed2, border = NA,col = rand_color(nrow(bed1), transparency = 0.5))
#end
circos.clear()
dev.off()
##文件夹里面的Rplot.pdf就是圈图的结果
看到了么,只需要提供scaffold号,起始位置,终止位置,你就可以得到密度数据,真的绝。
他是从最外圈往最内圈画的。track.height 就是每一圈的厚度。请把你们的颜色改成和我不一样的,谢谢。
我知道我知道,光给你代码是不够的,要告诉你输入文件长什么样。
> head(genome)
chr start end
1 Hb_chr1 1 46819076
2 Hb_chr2 1 44587488
3 Hb_chr3 1 41112232
4 Hb_chr4 1 39704978
5 Hb_chr5 1 39509855
6 Hb_chr6 1 37849917
> head(GC)
chr start end value
1 Hb_chr1 0 100000 0.38155
2 Hb_chr1 100000 200000 0.39211
3 Hb_chr1 200000 300000 0.38441
4 Hb_chr1 300000 400000 0.42246
5 Hb_chr1 400000 500000 0.39622
6 Hb_chr1 500000 600000 0.38849
> head(gene)
chr start end
1 Hb_chr1 20876 21295
2 Hb_chr1 21412 21561
3 Hb_chr1 24046 30936
4 Hb_chr1 40594 40995
5 Hb_chr1 2049 2582
6 Hb_chr1 14162 14959
> head(rep)
V1 V2 V3
1 Hb_chr1 10851 10934
2 Hb_chr1 18742 19717
3 Hb_chr1 19897 20390
4 Hb_chr1 19978 20483
5 Hb_chr1 20567 21012
6 Hb_chr1 21934 23671
> head(bed)
V1 V2 V3 V4 V5 V6 diff
1 Hb_chr1 650547 1097241 Hb_chr1 40863110 41088941 446694
2 Hb_chr1 1843619 2150420 Hb_chr1 42629387 42953008 306801
3 Hb_chr1 2376475 2751376 Hb_chr1 18273955 19048666 374901
4 Hb_chr1 10209948 11765425 Hb_chr1 37476684 37791036 1555477
5 Hb_chr1 10676780 12179670 Hb_chr1 45830252 46061452 1502890
6 Hb_chr1 16253223 18786887 Hb_chr1 39243966 40042787 2533664
有人不知道bed文件怎么来的。好吧,就是jcvi生成的anchor,具体怎么做,看我下一篇文章吧。。。
推荐一个配色网站:
https://colorbrewer2.org/#type=qualitative&scheme=Pastel1&n=6
个人感悟:最开始学的是linux命令,喜欢写 shell脚本,年纪大了,学完一种语言之后,就不想学新的语言了,对R语言就比较抵触,想着有gpt,不会也没关系。当时想的是,要不我把软件版的circos学会了,得多厉害,以后专门帮别人画圈图,一张五十,饭钱就来了。但是....真的好难。circlize包真的太简单了。两天足够你从入门到精通(基因组)。以后再有图要画也不慌了。R也是好东西啊哈哈哈哈哈。