尝试做一篇单基因的文献复现:
https://cloud.tencent.com/developer/article/1425575
在学习这篇教程中遇到一些问题:
一.问题1
1.1 解决方案
仍旧报错,继续修改:
1.2 教程
https://github.com/ramnathv/slidify/issues/505)
知识点(一):
install.packages()
installed.packages()
二.问题2
知识点(二):Rscript在保存的时候需要加后缀.R才能再次运行
三.问题3
继续运行,不明白这一部分作用,盲猜是测试集,请教大佬后发现是基因组注释文件,需要下载。
a.下载GTF格式的基因注释文件:
相关参考链接:
1.基因组注释文件(GFF,GTF)下载的四种方法https://zhuanlan.zhihu.com/p/79631226
选用的是Ensembl中的下载方式:
(1).FTP 地址:ftp://ftp.ensembl.org/pub/current_gtf
找到homo_sapiens/,下载下图这个文件
b.无需解压,用下述代码读入R语言:
BiocManager::install("rtracklayer")
library("rtracklayer")
gtf1 <- rtracklayer::import('Homo_sapiens.GRCh38.102.gtf')
gtf_df=as.data.frame(gtf1)
test <- gtf_df[1:5,]
View(test)
2.R语言提取GTF文件信息http://vlambda.com/wz_wR7drRQtry.html
有两篇教程是用Xshell读入GTF文件的,没看懂。
教程下载注释文件时候还搜到了生信技能树的两篇笔记需要Mark一下:
https://mp.weixin.qq.com/s/Z4fK6RObUEfjEyY_2VS4Nw
https://mp.weixin.qq.com/s/pBVXMqddYPH2COjXKUYQnA
知识点(三):理解基因注释文件and注释文件的使用
问题4
遇到管道操作时候报错:
4.1 解决方案:
加载dplyr这个包,修订代码:
library("dplyr")
expr <- expr %>% tibble::rownames_to_column("gene_id")
4.2 教程https://statisticsglobe.com/convert-row-names-into-column-of-data-frame-in-r