如何拿到 KEGG数据库的 hsa04650 Natural killer cell mediated cytotoxicity这个通路的所有基因名字

  • KEGG 是了解高级功能和生物系统(如细胞、 生物和生态系统),从分子水平信息,尤其是大型分子数据集生成的基因组测序和其他高通量实验技术的实用程序数据库资源, 由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立。是国际最常用的生物信息数据库之一,以“理解生物系统的高级功能和实用程序资源库”著称。

  • 小练习:如何拿到 KEGG数据库的 hsa04650 Natural killer cell mediated cytotoxicity(自然杀伤细胞介导的细胞毒性)这个通路的所有基因名字。(hsa04650:Homo sapiens智人)

两种办法,第一谷歌,通过网页方式浏览得到,第二种办法,使用R包和代码来做。


第一种办法:网页浏览


1、谷歌直接搜索:hsa04650

image.png

2、点开此条网址(https://www.genome.jp/dbget-bin/www_bget?hsa04650
image.png

3、直接翻到gene这个条目下即可看到答案。
image.png


第二种方法:使用R包和代码:


思路:看一下网页答案可知,我们的目标是得到Gene条目形成的一个矩阵,并提取出第二列的基因(缩写)


image.png

参考文章: http://www.bio-info-trainee.com/3533.html
看一下这篇文章:

library(clusterProfiler)   #加载这个包,这个包有什么用呢?
# https://www.kegg.jp/dbget-bin/www_bget?pathway+hsa05169
# library(KEGG.db) library(KEGGREST)  #这两个包有什么用呢?
​
kg=download_KEGG('hsa')     #直接提取,并未提示用哪个命令获得。
head(kg[[1]])
head(kg[[2]])
ps=c('hsa04660','hsa04659',
     'hsa04658','hsa04657','hsa04662',
     'hsa04650')
  • clusterProfiler :This package implements methods to analyze and visualize functional profiles (GO and KEGG) of gene and gene clusters.(该软件包是实现了分析和可视化基因和基因簇的功能谱(GO和KEGG)的方法。)
  • KEGGREST :A package that provides a client interface to the KEGG REST server. (一个为KEGG REST服务器提供客户端接口的包。)

确定方向,先安装包:


老规矩三部曲(安装bioconductor内的包):
1、source("http://bioconductor.org/biocLite.R")安装BiocInstaller

2、options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/") 切换镜像

3、BiocInstaller::biocLite('KEGGREST')安装bioconductor内的包(KEGGREST就是bioconductor的包)

> source("http://bioconductor.org/biocLite.R")
Bioconductor version 3.7 (BiocInstaller 1.30.0), ?biocLite for help
A newer version of Bioconductor is available for this version of R, ?BiocUpgrade for
  help
> options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/") 
> BiocInstaller::biocLite('KEGGREST')
BioC_mirror: http://mirrors.ustc.edu.cn/bioc/
Using Bioconductor 3.7 (BiocInstaller 1.30.0), R 3.5.2 (2018-12-20).
Installing package(s) ‘KEGGREST’
also installing the dependency ‘png’

trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.5/png_0.1-7.zip'
Content type 'application/zip' length 292639 bytes (285 KB)
downloaded 285 KB

trying URL 'http://mirrors.ustc.edu.cn/bioc//packages/3.7/bioc/bin/windows/contrib/3.5/KEGGREST_1.20.2.zip'
Content type 'application/zip' length 124626 bytes (121 KB)
downloaded 121 KB

package ‘png’ successfully unpacked and MD5 sums checked
package ‘KEGGREST’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\300S\AppData\Local\Temp\Rtmp4wKPRV\downloaded_packages
Old packages: 'gplots', 'purrr'
Update all/some/none? [a/s/n]: 
a
trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.5/gplots_3.0.1.1.zip'
Content type 'application/zip' length 657011 bytes (641 KB)
downloaded 641 KB

trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.5/purrr_0.3.0.zip'
Content type 'application/zip' length 413820 bytes (404 KB)
downloaded 404 KB

package ‘gplots’ successfully unpacked and MD5 sums checked
package ‘purrr’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\300S\AppData\Local\Temp\Rtmp4wKPRV\downloaded_packages

了解包的使用:


命令:

> ?KEGGREST
No documentation for ‘KEGGREST’ in specified packages and libraries:
you could try ‘??KEGGREST’
> ??KEGGREST
image.png

点击查看,了解基本命令:

  • KEGG exposes a number of databases. To get an idea of what is available, run listDatabases() 显示KEGGREST所包含的数据内容
  • You can obtain the list of organisms available in KEGG with the keggList()function 得到可用的生物列表

> gs<-keggGet('hsa04650')
> View(gs)
image.png

网页部分截图:
image.png

目录和网页一样,但是可以明显看出gs目前不是矩阵。把其变成矩阵再提取出来即可。

image.png

光标放在目录旁,发现一个图标,点击出现一行代码,enter运行,得到该目录内容。


image.png

与网页对比正确:


image.png
  • strsplit(x, split, fixed = FALSE, perl= FALSE, useBytes = FALSE)

参数x是要处理的字符串,
参数split是分割点。
参数fixed为TRUE时采用精确查找;
参数perl为TRUE时采用Perl正则表达式;
参数fixed和perl都为FALSE时,使用POSIX1003.2扩展正则表达式;
参数useBytes为TRUE时,匹配过程是逐字节进行的;

  • lapply(X, FUN, ...)
    lapply的返回值是和一个和X有相同的长度的list对象,这个list对象中的每个元素是将函数FUN应用到X的每一个元素。其中X为List对象(该list的每个元素都是一个向量),其他类型的对象会被R通过函数as.list()自动转换为list类型。

  • unlist就是把里面不同的类型的数据分解出来,在此将数字与字符分隔开。unlist(x)生成一个包含x所有元素的向量,作用是展平数据列表。

> lapply(a,function(x) strsplit(x,';'))
[[1]]
[[1]][[1]]
[1] "3105"


[[2]]
[[2]][[1]]
[1] "HLA-A"                                                    
[2] " major histocompatibility complex, class I, A [KO:K06751]"
...
> unlist(lapply(a,function(x) strsplit(x,';')[[1]][1]))
  [1] "3105"        "HLA-A"       "3106"        "HLA-B"       "3107"        "HLA-C"      
  [7] "3135"        "HLA-G"       "3133"        "HLA-E"       "3812"        "KIR3DL2"    
 [13] "3811"        "KIR3DL1"     "3803"        "KIR2DL2"     "3802"        "KIR2DL1"    

> b<- unlist(lapply(a,function(x) strsplit(x,';')[[1]][1]))
> b[1:length(b)%%2 ==0]  #length(b)为基因所在位置,取出位置为偶数的字符即基因名
  [1] "HLA-A"       "HLA-B"       "HLA-C"       "HLA-G"       "HLA-E"       "KIR3DL2"    
  [7] "KIR3DL1"     "KIR2DL2"     "KIR2DL1"     "KIR2DL3"     "KIR2DL4"     "KIR2DL5A"   
 [13] "KLRC1"       "KLRC2"       "KLRC3"       "KLRD1"       "PTPN6"       "PTPN11"     
 [19] "ICAM1"       "ICAM2"       "ITGAL"       "ITGB2"       "PTK2B"       "VAV3"       
 [25] "VAV1"        "VAV2"        "RAC1"        "RAC2"        "RAC3"        "PAK1"       
 [31] "MAP2K1"      "MAP2K2"      "MAPK1"       "MAPK3"       "TNF"         "CSF2"       
 [37] "IFNG"        "KIR2DS1"     "KIR2DS3"     "KIR2DS4"     "KIR2DS5"     "KIR2DS2"    
 [43] "NCR2"        "TYROBP"      "LCK"         "IGH"         "FCGR3A"      "FCGR3B"     
 [49] "NCR1"        "NCR3"        "FCER1G"      "CD247"       "ZAP70"       "SYK"        
 [55] "LCP2"        "LAT"         "PLCG1"       "PLCG2"       "SH3BP2"      "PIK3CA"     
 [61] "PIK3CD"      "PIK3CB"      "PIK3R1"      "PIK3R2"      "PIK3R3"      "FYN"        
 [67] "SHC1"        "SHC2"        "SHC3"        "SHC4"        "GRB2"        "SOS1"       
 [73] "SOS2"        "HRAS"        "KRAS"        "NRAS"        "ARAF"        "BRAF"       
 [79] "RAF1"        "MICB"        "MICA"        "ULBP1"       "ULBP2"       "ULBP3"      
 [85] "RAET1G"      "RAET1L"      "RAET1E"      "KLRK1"       "KLRC4-KLRK1" "HCST"       
 [91] "CD48"        "CD244"       "PPP3CA"      "PPP3CB"      "PPP3CC"      "PPP3R1"     
 [97] "PPP3R2"      "NFATC1"      "NFATC2"      "PRKCA"       "PRKCB"       "PRKCG"      
[103] "SH2D1B"      "SH2D1A"      "IFNGR1"      "IFNGR2"      "IFNA1"       "IFNA2"      
[109] "IFNA4"       "IFNA5"       "IFNA6"       "IFNA7"       "IFNA8"       "IFNA10"     
[115] "IFNA13"      "IFNA14"      "IFNA16"      "IFNA17"      "IFNA21"      "IFNB1"      
[121] "IFNAR1"      "IFNAR2"      "TNFSF10"     "TNFRSF10A"   "TNFRSF10B"   "FASLG"      
[127] "FAS"         "GZMB"        "PRF1"        "CASP3"       "BID"  

友情阅读推荐:

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,406评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,732评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,711评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,380评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,432评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,301评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,145评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,008评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,443评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,649评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,795评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,501评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,119评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,731评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,865评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,899评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,724评论 2 354