在NCBI下载的一些基因组中,尝尝蛋白一个编号,转录本一个编号,基因一个编号,需要合并。
在Excel里可以进行合并,现在我们有组数据,一组左边是基因,蛋白和转录本数据,
一组是用蛋白进行注释的数据,要对蛋白注释的信息加上基因ID

QQ_1762821884880.png
因为蛋白序列里有很多| . _等字符,我们使用如下公式,可以一次搞定
=VLOOKUP("*"&TRIM(CLEAN(I6))&"*",$A:C,2,FALSE)
这里VLOOKUP放在你想要添加数据最左一列,CLEAN(I6),就是你想要查询的当前单元格名称,$A:C是指被查询数据所在列,2,表示返回被查询数据第2列的值,这里是基因,FALSE是指完美匹配
如果只是查找一列 序列
=VLOOKUP(A2, $C$2:$C$50, 1, FALSE)
即为在C列第2至第50个单元格查找A2格里值,并返回C列查到的值