那些年被Excel软件改了名字的基因

我们在做生信分析时经常和序列、基因和蛋白打交道,基因在各个生信公共数据库中有唯一识别编号(GeneID,通常是数字编码,如Entrze ID),也有各自独特的别名(GeneName or Gene Symbol)。我们谈谈:那些年被Excel软件改了名字的基因。据研究发现:现已经发表的很多科研报道中有很多基因名称都变成了日期格式的名字,这种改变是因为Excel软件的自作聪明(自动把符合预期的字符进行格式转换,看到SEPT3,它以为你说的是3-Sep;看到MART2,它以为你说的是2-Mar;看到DECR1,它以为你说的是1-Dec,这样的例子有很多,大多数是基因名称开头中含月份英文简写,然后被Excel自动识别和改名的)和人的疏忽(一般研究人员如果不涉及这些含月份简写的基因名称时是不会注意到的,打开含基因名称的数据,然后再保存文件,这个过程错误已经留在了里面)造成的,只要你的研究涉及基因和蛋白,而你又用Excel软件打开进行数据的查看和整理、分析,都可能受影响。

下面是我整理的物种人Human(Homo sapies)中含有月份简写的基因列表,希望对生信分析人员有帮助(当然,这个表格可以自己整理)。

一、月份中英文及简写对照表


二、基因列表


©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容