代码学习之单基因分析

尝试做一篇单基因的文献复现:
https://cloud.tencent.com/developer/article/1425575
在学习这篇教程中遇到一些问题:
一.问题1

image.png

1.1 解决方案
image.png

仍旧报错,继续修改:
image.png

1.2 教程
https://github.com/ramnathv/slidify/issues/505

知识点(一):
install.packages()
installed.packages()

二.问题2

知识点(二):Rscript在保存的时候需要加后缀.R才能再次运行

三.问题3
继续运行,不明白这一部分作用,盲猜是测试集,请教大佬后发现是基因组注释文件,需要下载。

image.png

a.下载GTF格式的基因注释文件:

相关参考链接:
1.基因组注释文件(GFF,GTF)下载的四种方法https://zhuanlan.zhihu.com/p/79631226
选用的是Ensembl中的下载方式:
(1).FTP 地址:ftp://ftp.ensembl.org/pub/current_gtf

image.png

找到homo_sapiens/,下载下图这个文件
image.png

b.无需解压,用下述代码读入R语言:
BiocManager::install("rtracklayer")
library("rtracklayer")
gtf1 <- rtracklayer::import('Homo_sapiens.GRCh38.102.gtf')
gtf_df=as.data.frame(gtf1)
test <- gtf_df[1:5,]
View(test)

2.R语言提取GTF文件信息http://vlambda.com/wz_wR7drRQtry.html
有两篇教程是用Xshell读入GTF文件的,没看懂。
教程下载注释文件时候还搜到了生信技能树的两篇笔记需要Mark一下:
https://mp.weixin.qq.com/s/Z4fK6RObUEfjEyY_2VS4Nw
https://mp.weixin.qq.com/s/pBVXMqddYPH2COjXKUYQnA

知识点(三):理解基因注释文件and注释文件的使用

问题4
遇到管道操作时候报错:

image.png

4.1 解决方案:
加载dplyr这个包,修订代码:
library("dplyr")
expr <- expr %>% tibble::rownames_to_column("gene_id")
4.2 教程https://statisticsglobe.com/convert-row-names-into-column-of-data-frame-in-r

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容