简介
该数据库包含针对SNP(人类)的两类注释内容:
基于位置关系,给出该SNP位于基因哪个区域(如intronic, intergeni, etc)。如果该SNP与某基因的变异之间存在LD,则该位于intergenic的SNP也会被注释到该基因。
MD:已报道的多个SNP位点之间的LD,利用TUNA计算,数据来自HapMap。功能注释:该SNP是否影响基因表达(i.e eQTLs)
eQTL:SNP与表达量直接的关系,数据来源于HapMap CEU(Caucasians from
Utah, USA)和YRI(Yoruba people from Ibadan, Nigeria) 样本(细胞系),其中表达量通过芯片获得。将来会增加来自其他人类组织的数据。
该数据库可用于GWAS的后续分析,根据与疾病的相关性将SNP进行排序后,利用该数据库进行评估。比较直观的功能是输入一个基因,可以知道其eQTL有哪些;输入一个SNP,可以知道该SNP可以影响哪些基因的表达。
数据来源于HapMap (release 23a), NCBI (dbSNP 129), 以及从公开数据库下载的数据整理后的数据。
可直接下载的数据:
使用
操作手册:http://www.scandb.org/newinterface/SCANTutorial.pdf 实际按照手册中搜索基因CAPN10,但是General information里没有手册中展示的信息。
数据库在queries
有5种搜索模式。
下方output
可以选择输出格式,有网页格式HTML table,还有TAB和逗号分隔的格式(这种情况下会直接生成结果文件)。
-
Gene:输入基因名称(如
CAPN10
),可以查询到该基因的MD及在不同群体和平台的MD、该基因上有哪些突变位点、eQTLs。这里将eQTLs限定在和CAPN10同一染色体。expression_SNPs
中SNP后的数值为关联的p-value.
-
SNP:输入rs编号,可以查询到这些SNP所在基因、左侧和右侧的相邻基因、表达水平受该SNP影响的基因
-
region: 输入region (chr:start:end),可以查询到该区域包含的SNP位点、基因、左侧和右侧的相邻基因、所包含的SNPs影响哪些基因的表达。
-
CNV:输入CNV编号,可以查询该CNV的位置信息、拷贝数变异、所在基因、相邻基因及表达受影响的基因。
-
LD annotation: 输入rs编号列表,可以查询到与该SNP有连锁不平衡的基因。