人鼠基因名同源转换

首先可以直接大小写转换:

dog <- "The quick brown dog"
str_to_upper(dog)
str_to_lower(dog)
str_to_title(dog)
str_to_sentence("the quick brown dog")
image.png

但是这样还是存在很多例如 TP53 和 小鼠的Trp53直接转换后不对应的问题。
于是考虑到要同源转换。但是看了很多教程,看完了还是干着急不能用。
自己根据之前的经验结合一个小的文件,

参考官网
mouse_human_genes = read.csv("http://www.informatics.jax.org/downloads/reports/HOM_MouseHumanSequence.rpt",sep="\t")
这个链接应该是我在使用biomat的时候报错,根据报错地址获取的,然后就直接下载了这个文件,保存下来自己用。
下载这个文件后,
下载到其人鼠同源基因文件。内容如下:

image.png

所做处理:
提取人鼠的同源基因名,根据第一列进行匹配,随后inner_join,得到一个人鼠均有的同源基因文件,如下:


image.png

放在了代码里了无套路自取,请给本文点个赞
内有鼠对人一对多,和人对鼠一对多的情况出现。请注意筛选。
使用方法如下:

输入数据是你的gene  向量
Reference <- read.csv('https://picgo-yxy.oss-cn-guangzhou.aliyuncs.com/img/mouse_human_gene_match.csv')
human→mouse
hmtran <- function(tmpdat){
  tmpdat = data.frame(gene = tmpdat)
  tmpdat$new <- Reference$Symbol[match(tmpdat$gene,Reference$SYMBOL)]
  tmpdat <- na.omit(tmpdat)
  return(tmpdat)
}
tmpgene = 你的基因向量
tmpgene = hmtran(tmpgene)

mouse→human
mhtran <- function(tmpdat){
  tmpdat = data.frame(gene = tmpdat)
  tmpdat$new <- Reference$SYMBOL[match(tmpdat$gene,Reference$Symbol)]
  tmpdat <- na.omit(tmpdat)
  return(tmpdat)
}
——————————————————————————————————————
2.0版本
Reference <- read.csv('https://picgo-yxy.oss-cn-guangzhou.aliyuncs.com/img/mouse_human_gene_match.csv')
hmtran <- function(tmpdat){
  tmpdat1 = tmpdat
  tmpdat = data.frame(gene = tmpdat)
  tmpdat$new <- Reference$Symbol[match(tmpdat$gene,Reference$SYMBOL)]
  tmpdat <- na.omit(tmpdat)
  n = length(setdiff(tmpdat1,tmpdat$gene))
  a = signif(n/length(tmpdat1),3)
  tmp = paste(c(setdiff(tmpdat1,tmpdat$gene)),collapse = ' ')
  print(paste0('There are ',a,'% genes fail to trans. They are |||',tmp))
  return(tmpdat)
}
会显示有多少基因没被转换到,心里有个数吧算是。

阿里云好像是根据流量收费的,我不想交钱,苦逼硕士没有钱,所以大家可以从下面下载,其实从上面的代码直接读进R里面也可,但是还是计流量,诶,我这估计也不会有很多人看,应该不用很贵。
文件这里也有一份,以前写的一份教程。
https://www.yuque.com/wuwuyuyu/kb/opzg6n?singleDoc# 《人鼠基因名转化——同源转化》
之前写的很多都在里面,但是垃圾yvque,现在不让免费公开了,烦死了。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容