生物学必知三大数据库之一-NCBI
美国国家生物技术信息中心
摘自:https://wenku.baidu.com/view/f86d817165ce0508763213df.html
它的使命包括四项任务:
1 建立关于分子生物学,生物化学,和遗传学知识的存储和分析的自动系统
2 实行关于用于分析生物学重要分子和复合物的结构和功能的基于计算机的信息处理的,先进方法的研究
3 加速生物技术研究者和医药治疗人员对数据库和软件的使用
4 全世界范围内的生物技术信息收集的合作努力
1 Literature 文献
books(书库)
不断收集生物医学方面的书籍MeSH(医学主题词表)
是NLM美国国家医学图书馆为PubMed用于索引文章。NLM Catalog
为藏书超过130万册的美国国立卫生图书馆(NLM)记录设立目录信息,包括杂志、图书、手稿、计算机软件、录音文件和其它电子资源。Pubmed
一个免费的搜寻引擎,提供生物医学方面的论文搜寻以及摘要。Pubmed Central
美国国家医学图书馆目录PubMed 公共医学中心。
2 Genes(基因)
-
ETS
EST数据库收录了GenBank EST中的所有数据和没有生物学注释信息的“单分子识别首次通过(first-pass single-read)”的cDNA序列。EST是从一个随机选择的cDNA 克隆进行5’端和3’端单一次测序获得的短的cDNA 部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20 到7000bp 不等,平均长度为360 ±120bp。EST 来源于一定环境下一个组织总mRNA 所构建的cDNA 文库,因此EST也能说明该组织中各基因的表达水平。
-
Gene
数据库为用户提供基因序列注释和检索服务,还会链接到NCBI的Map Viewer、Evidence Viewer、Model Maker、BLAST Link (Blink)、protein domains from the Conserved Domain Database(CDD)等数据库资源以及其它与基因相基因Gene 关的资源。Entrez Gene数据库收录了来自5300_多个物种的430万条基因记录。
GEO DataSets(基因表达文库数据集)
Gene Expression OmnibusDataSetsGEO DataSets 储存由Gene Expression Omnibus (GEO) repository(资源库)中得来的基因表达以及分子丰富性的数据。GEO profiles(基因表达文库概况)
数据库(它负责收录一个基因在一次试验中的定量基因表达数据)HomoloGene
是一个在20种完全测序的真核生物基因组中自动检索同源基因的系统,包括直系同源与旁系同源。HomoloGene的结果报告包括基因同源性和来自OMIM、小鼠基因组信息学(Mouse Genome Informatics, MGI)、斑马鱼信息网络(Zebrafish Information Network, ZFIN)、酵母基因组数据库(Saccharomyces Genome Database, SGD)、直系同源基因簇(Clusters of Orthologous Groups,COG)和果蝇数据库(FlyBase)的基因表型信息。HomoloGene下载功能能下载HomoloGene中的转录体、蛋白质和基因组序_列信息,还能下载基因组中特定基因的上游和下游序列。PopSet
既包含核酸序列数据又包含蛋白质序列数据。unigene
意为广泛通用的基因数据库,通过电脑对相同基因座(Locus)的收集整理集合形成一个非冗余的基因数据库。
3 Health
ClinVar
整合这些分散的数据、将变异、临床表型、实证数据以及功能注解与分析等四个方面的信息,通过专家评审,逐步形成一个标准的、可信的、稳定的遗传变异临床表型相关的数据库dbGaP(基因型和表型数据库)
归档、精选、发布由调查基因型和表型间相互作用的研究所产生的信息的数据分库GTR(基因检测注册表)
MedGen
组织与人类医学遗传学相关的信息OMIM(孟德尔人类遗传病)
持续更新关于人类基因和遗传紊乱的数据库