参考: 生信:2:sam格式文件解读[https://blog.csdn.net/genome_denovo/article/details/78712972]FastQ S...
![240](https://cdn2.jianshu.io/assets/default_avatar/8-a356878e44b45ab268a3b0bbaaadeeb7.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
参考: 生信:2:sam格式文件解读[https://blog.csdn.net/genome_denovo/article/details/78712972]FastQ S...
### 一般从测序公司拿到的下级数据有raw data,或者经过质控之后的clean data,格式为fq。参考基因组及注释文件gff从网上下载。分析流程如尾图所示。 分析软...
对于PE数据,fastp通过-m/--merge选项实现拼接模式。-m, --mergefor paired-end input, merge each pair of re...
该系列主要介绍了 MUMmer 软件下核苷酸序列比对程序 nucmer 的使用,计算操作见前两篇推文; 序列比对软件 MUMmer 快速上手(一)[https://www.j...
MAKER配置文件详解 本文翻译自http://weatherby.genetics.utah.edu/MAKER/wiki/index.php/The_MAKER_cont...
samtools sort [options] input.bam 仅可对bam文件进行排序默认对最左侧坐标进行排序处理后会在header中加入相应的行默认输出格式是bam,...
作为生命科学的从事者,不论是老师或者学生都应该用过NCBI((National Center for Biotechnology Information Search d...
今天学习到一个名词,无偏估计。如何理解“不论总体服从什么分布,样本均值是总体均值的无偏估计量”这句话,什么是无偏估计呢? 均值的无偏估计 比如我们想知道一个群体的平均身高,但...
E:\ > cd e:E:E:\ > cd plink-1E:\plink-1>plink –file test Map 更新Plink --goat --file data...
z-score计算方法为:Z =(x-μ)/ σμ为均值,σ为标准差。 以下是R中将z-score转为p.value的方法: pnorm(q, mean = 0, sd = ...
基本概念 基因渗入(introgression): 是在遗传学中,指两个基因库间的基因流动,通常是经过种间杂交产生。基因渗入是一个长期的过程,它可能需要许多代杂交才能产生回交...
一、vcf文件格式转换 转换成plink格式 注意:plink2treemix.py[http://plink2treemix.py]从https://bitbucket.o...
基本概念: 基因流(也称基因迁移) 是指从一个物种的一个种群向另一个种群引入新的遗传物质,从而改变群体“基因库”的组成。通过基因交流向群体中引入新的等位基因,是遗传变异一个非...
在做基因富集时,有些通路特别长,以至于使图片的大小不好控制,这种情况可以用stringr包的str_wrap来完成文本自动换行。如使用clusterProfiler的barp...
在clusterProfiler进行富集分析时,发现目前只支持19个物种,如果要对这些物种之外的物种进行富集分析则需要自己构建orgDb物种包。 1.首先安装eggnog-m...