1. 学习一下生物数据库
出处:https://zhuanlan.zhihu.com/p/303247762
- INSD:国际核酸序列数据库(International Nucleotide Sequence Databank)。由日本的DDBJ、欧洲的EMBL和美国的GenBank三家各自建立和共同维护。
- EMBL库:欧洲分子生物学实验室的DNA和RNA 序列库。Ensembl数据库网站开始于一个真核生物基因组注释项目,其侧重于脊椎动物的基因组数据,但也包含了其他生物,如线虫,酵母,拟南芥和水稻等。随着时间推移,越来越多的基因组数据已经被添加到了Ensembl,同时Ensembl可用数据的范围也扩展到了比较基因组学、变异,以及调控数据
- GenBank :美国国家生物技术信息中心 (NCBI)所维护的供公众自由读取的、带注释的DNA序列的总数据库。
- DDBJ :日本核酸数据库。
- GSDB:美国国家基因组资源中心(NCGR)维护的DNA序列关系数据库(Genome Sequence DataBase)
Entrez Gene比genebank更加全面和先进。
GenBank:
GenBank是美国国家生物技术信息中心(National Center for Biotechnology Information ,NCBI)建立的DNA序列数据库,从公共资源中获取序列数据,主要是科研人员直接提供或来源于大规模基因组测序计划( Benson等, 1998)。GenBank是一个有来自于70,000多种生物的核苷酸序列的数据库,每条纪录都有编码区(CDS)特征的注释,还包括氨基酸的翻译,主要是科研人员直接提供或来源于大规模基因组测序计划。为保证数据尽可能的完全,GenBank与EMBL、DDBJ建立了相互交换数据的合作关系。
Entrez:
Entrez 是美国国家生物技术信息中心所提供的在线资源检索器。该资源将GenBank序列与其原始文献出处链接在一起。 Entrez 是由NCBI主持的一个数据库检索系统。
它包括核酸,蛋白以及Medline文摘数据库,在这三个数据库中建立了非常完善的联系。因此,可以从一个DNA序列查询到蛋白产物以及相关文献,而且,每个条目均有一个类邻(neighboring)信息,给出与查询条目接近的信息。
代谢途径和细胞调控数据库
2.KEGG数据库:
来源:https://blog.csdn.net/weixin_43569478/article/details/108079696