SAR是NIH高通量测序数据的主要档案,是国际核苷酸序列数据库协作INSDC的一部分,包括NCBI序列阅读档案SAR。
特点:存档来自各种高通量测序平台的原始测序数据和比对信息,如Illumina。
数据:接受各种测序项目的数据,包括涉及人类受试者或宏基因组的临床重要研究。包括4个类型:
研究课题(EPR/SPR),一个课题可能包含多个实验
实验设计SRX,一个实验可能包含多个测序结果集(run)
测序结果集SRR
样品信息SRS
runs表示测序仪运行所产生的reads
搜索:在GEO数据库中输入GSE号,通过Linux下载,在NCBI中搜索,得到研究基本信息。