import re
gene_dict = {}
f1 = open('human.gtf')
f2 = open('mRNAmatrix.txt')
f3 = open('sym.txt','w')
for lines in f1:
if lines.startswith('#'):
continue
line = lines.strip().split('\t')
#print(line[2])
if line[2] == "gene":
gene_id = re.search(r'gene_id "([^;]+)";',line[8]).group(1)
#print(geneid)
gene_name = re.search(r' gene_name "([^;]+)";',line[8]).group(1)
#print(gene_name)
gene_dict[gene_id] = gene_name
for lines in f2:
lines = lines.strip()
if lines.startswith('id'):
print(lines,file = f3)
continue
line = lines.split('\t')
gene_inf = line[0][:15]
if gene_inf in gene_dict:
print(gene_dict[gene_inf]+"\t"+'\t'.join(line[1:]),file = f3 )
ID转换,把ensbl_id换成gene_name
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- ----前不久拿到公司给的转录组测序结果,Gene ID是以ENMUST开头,查了一下,ENST为EMBL 核酸数...
- 在实际应用中,我们经常需要在gene name和gene ID之间进行转换。当需要处理的基因数量很少时,我们可以直...
- 在线版本 线上数据库做注释和ID转换ensembl ID转成gene symbol name ensembl的bi...