https://academic.oup.com/nar/issue
- sanger 英
- broad institue 美
- UCSC 美
1. 核酸数据库
- DNA数据库
- 基因组数据库
- 基因变异数据库
- 基因表达数据库
- RNA数据库
- 病毒数据库
INSDC(DDBJ、NCBI、ENA):http://www.insdc.org/
HGP人类基因组计划 1990-2003 约三亿个碱基对
2.基因组注释 即基因组注释数据库
2.1 基因组注释
- 基因组数据由原始的测序序列,通过jiangreads组装成scaffolds乃至完成的染色体的基因组序列
- 识别其中的基因序列,分析其产物的功能和结构,寻找不同族群间的变异和规律(群体基因组比较)
2.2 数据库
- Ensembl 人 →脊椎模式生物的基因组注释数据库
- Ensembl Genomes 非脊椎
3.癌症基因组数据库
TCGA 美国癌症基因组图谱 2006开始
基因组、表观基因组、转录组、蛋白组、影像组
介绍网站:https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga
数据门户:https://portal.gdc.cancer.gov/ICGC 国际癌症基因组联盟
4.基因变异数据库
4.1 基因变异
- 单碱基置换
- 微缺失、微插入
- 缺失/插入 indels 、重复序列扩增、基因损伤(缺失、插入、倍增)
- 复杂基因的重组
4.2 数据库
- HGMD 人类基因突变数据库 与人类遗传病相关的
- ClinVar 与人类健康相关的 临床的
- COSMIC (最大最完整的)癌症体细胞突变数据库
- dbSNP 单核苷酸多态性数据:插入、删除、微型卫星、非多态性变异
5.RNA数据库
-
RNA家族数据库 Rfam
Rfam家族分为三大类:非编码RNA基因、结构化cis调控元素、自拼接RNA
http://rfam.xfam.org/
http://xfam.org/
非编码RNA数据库 NONCODE(此不包括tRNA、rRNA数据)
miRNA 数据库 miBase
-
RNACentral 整合收集了来自多物种的所有非编码RNA类型的非编码RNA序列
包含了NONCODE、Rfam等
https://rnacentral.org/
6.基因表达数据库
定性、定量基因的表达,来研究基因调控的作用和结果
- GEO 功能基因组公共数据库
MIAME标准的数据
表达的点阵数据array data 和 测序数据NGS data
-Expression Atlas 基因RNA和蛋白表达数据
7.微生物组学数据库
- 美国 人类微生物组计划 Human Microbiome Project
- 欧EBI 微生物宏基因组数据库 MGnify 不仅是人体中的
微生物组:关注微生物本身
宏基因组:更关注环境中微生物群落整体 微生物与其周围的环境、宿主的关系
8.病毒数据库
- 病毒病原体数据库 ViPR
- NCBI病毒数据资源
- 新冠
GISAID 数据库(原是禽流感病毒的全球倡议数据库)https://www.gisaid.org/
中国国家生物信息中心的新冠病毒数据库 - 中国国家微生物科学数据中心(微生物组学,从宏观到微观)
9.蛋白质数据库
- UniProt 全球蛋白质序列数据库
- Pfam 蛋白质家族数据库 识别蛋白域
- InterPro 蛋白质家族分类数据库 InterProScan
- PDB 结构
- CATH/Gene3D 结构