数据整理 因为这个是我学生的真实数据,所以就不方便放出来给大家做示例文件了,可以只看代码,或者拿自己的数据练练手。 975个基因做不出GO富集,我的第一反应是孩子学艺不精,然...
关于单因素方差分析,网上有很多方法,比如使用R语言进行单因素方差分析以及结果可视化[https://mp.weixin.qq.com/s/PDbuql_ANZVu14Sk6V...
一、安装miniconda3 1. miniconda3 下载并安装 换到安装位置(一般为主目录~), 从中科大镜像下载最新的miniconda3,bash启动安装,一直en...
最近在使用AnnotationHub下载Orgdb数据时遇到了一个问题,使用模块更新数据后发现日期停留在了2018年,数据没有更新。现在很多分析依赖数据库数据,如果不更新,分...
GWAS工具GAPIT最新版 本篇笔记主要内容是GWAS分析软件GAPIT最新版的安装和使用教程,包括常见的报错以及解决方案,主要出错位置在LDheatmap、stringi...
1.一般性规则 (1)避免使用attach。(2)写函数时尽量少的使用stop()。(3)定义S3和S4的对象不要混在一起使用。 2.文件命名 (1)文件名应以.R结尾,文件...
为什么要做LDSC 通过GWAS分析可以识别到与表型相关的SNP位点,然而严格来讲,这个结果并不一定真实客观的描述遗传因素对表型的效应,因为其结果是由以下两个因素共同构成的:...
在进行差异基因表达分析时,得到显著差异基因后,接下来就需要分析这些基因参与了哪些功能,常见的就是GO功能注释和KEGG通路富集分析,今天为大家介绍在线分析工具的使用——DAV...
在进行富集分析绘图的时候,有的时候一次需要绘制多张GO和KEGG图片,可以通过简单的脚本实现批量绘制。 1. 所需R包(1)ggplot2(2)clusterProfiler...
写在前面从NCBI下载的注释文件通常是gbff格式的,而我们平时做上游分析用到的大多数为gff或gtf文件,那么这两种格式之间怎么进行转换呢。一番搜索后得到如下perl脚本。...
gbff是NCBI基因组数据库常见的基因组genebank格式文件,在实际分析中,常常需要gff格式或者gtf格式,所以就存在gbff转换gff格式的需求image.png ...
GWAS分析中,找到显著性SNP,需要注释,才能找到候选的基因。 什么是注释呢?我们知道,GWAS的依据是snp与控制性状的基因处于LD状态,所以,我们才能推断显著性的SNP...
提取位点,要确定显著SNP上下游多长,来查找基因,这就需要计算LD衰减距离:LD衰减图绘制,然后根据上下游去和gff文件合并,把区间内的基因找到,这就找到目标基因了。 下面,...
当有多个年份和多个地点的表型值之后,基因型只有一套,这时如果用来做GWAS的时候,就需要对表型值进行重新计算。多年多点的表型值用于GWAS分析前,一般有以下三种方式供预处理表...
stringr字符处理 - 简书 (jianshu.com)[https://www.jianshu.com/p/2e5063407d83]dplyr表格操作 - 简书 (j...
字符匹配实列: 过滤
R语言 -- 交并补:intersect、union、setdiff、Reduce多重操作