我们在使用TCGA数据库的时候往往会下载很多个样本数据,他们都有一个特定的sample id,通常是TCGA-AA-BBBB-CC格式。

从TCGA官网查询得到:

我们一般只会有sample及sample前的标识,所以在此只介绍前四个标识的意思,需要其他标识的具体含义可以查询官网。
以TCGA-DD-A115-01为例:
-
TCGA: 项目名称(Project),也可能存在GTEX或者其他项目的名字 -
DD:组织及来源研究(Tissue source site),Mayo Clinic - Rochester研究的Liver hepatocellular carcinoma部位样本,是任意字母和数字的两位组合。 -
A115:参与研究的患者ID,可以是任意字母和数字的组合。 -
01:样本类型(Sample type),01表示原发性实体肿瘤,一般是两位数字。
如果还需要更详细的信息,可查询:
TCGA Resources
TCGA Barcode