我以为我自己的数据是别人直接塞到手里的,也没跟我解释哪个是干嘛的,不是很友好,但是还好问了老师给了回复。已经用tbtools做了一个基因密度图,接下来可以做基因密度和重复序列密度。但是有的scaffold没对应到染色体,虽然无伤大雅,但是还是想知道这种没匹配上的是不是图里不需要展示了?GC含量还不知道怎么写脚本。看了一下睡莲基因组的文章他们是以100kb为slidingwindow做的统计。
其实真正难的是NCBI下载下来的基因组数据库。我目前还不知道怎么处理,我们做了HIC,所以能匹配假染色体,如果想要做两个共线性的基因组圈图,另一半应该也是染色体形式,我按照同样方式运行染色体长度就出问题了,都是差不多一样长度的scaffold。但是我觉得共线性应该一样能做,做成那种长条的,只不过不怎么好看而已。
绘制GC含量和测序深度(GC-Depth)分布图评估基因组质量 (qq.com)。这个公众号干货很多。基因组
GC含量的事已经可以处理了,bedtools。
但是用Tbtools画出来的基础图很丑。没有人家circos画的那么有高级感。然后就是外圈里圈能不能翻转一下。#Circos-1#有手就行!TBtools教你打造炫酷circos图_哔哩哔哩_bilibili这个是TBtools的教程。这个就是上手快,会让你在很快的时间内就有一些成就感。但是你发现这个软件竟然有这么多功能,发现自己还是个菜鸡之后你会很失落
从零开始学CIRCOS绘制圈图(三) - 简书 (jianshu.com)这个是circos的教程。写的比较详细了。之前还有一个总结性的网站Circos教程(二):基础使用 | 寂寞先生 (starsyi.github.io)。好像还有另一个 找不到了。。
而且我自己的染色体也有问题,有的scaffold没有对应到染色体上。问了老师说画共线性的时候不用对上。
如果共线性线条很多,我个人理解是你需要把你自己着重研究的基因提出来标一下。
然后我的基因测序是没有参考基因组的,所以一些质检和有参的不一样。我导说你现在手头有啥你就接着做,先不用管他怎么来的,先把这些数据处理好。
表面上看起来一直在忙,但是也不知道自己在忙些啥