任务:
文本中Gene Tagging抽取出大量的Gene Mention(e.g. GS1, groEL, OsSUT1, fructose-6-p
hosphate 1-phosphotransferase),其中可能存在非水稻基因。需要将这些Gene mention进行标准化到 The Rice Annotation Project (RAP)
或者 Rice Genome Annotation Project (RGAP7,MSU)。
RAP格式为“Os-Chr-g-number”,MSU格式为“LOC_Os-Chr-g-number”。
待尝试方法:
PlantGSEA 提供了非常方便的在线ID转换工具。
Mapping file 对应。
2.1 RAP-2018.
2.2 Oryzabase Download - Rice ID.