关键词:叶绿体基因组、质体基因组、NCBI、blast
1. 利用注释信息可视化截取+blast比对
建议使用Geneious软件,可视化截取目标区域。最后将截取的区域再次Blast比对裁去两端多余序列。
缺点:需要手动,适合于样品量不多的数据处理
GenBank格式是NCBI中Genbank数据库储存的主要格式。gb格式它较为全面地记录了简要的序列描述、学名、物种来源分类、参考文献和具有生物学意义的特征信息,如编码区、蛋白翻译、转录单元、重复区域、变异和修饰位点等。
2. 直接blast
若是样本数目多,基因组数据一般长度较长,数据庞大blast过程非常耗时。
缺点:只适合单个或者少数样品的blast截取。
3.利用软件先自动提取基因组中指定注释信息的序列
参考: 叶绿体组装工具GetOrganelle网站——How to assemble custom loci?
FAQ · Kinggerm/GetOrganelle Wiki · GitHub
相关软件比较少,多见于部分人写的程序,需要对编程语言熟悉。限于进阶型用户使用。
优点在于可以批量化提取基因,效率高。