IP属地:山西
二项分布和泊松分布都描述的是事件成功次数的分布,泊松分布是二项分布的极限分布,其适用条件是n很大,p很小的情况。生物学中一些过程可以使用二项分布...
数据分析时我们经常会遇到多组treatment和control,多个细胞系,多种组学数据类型的情况,用ggplot或者matplotlib作图时...
R语言中绘制热图heatmap的包(package)有很多,除了许多炫酷的第三方包外,系统自带的image函数使用起来也十分方便灵活。 1.主要...
RegulomeDB和HaploReg数据库提供了将大量基因组学数据与非编码突变整合的思路。 1.背景 GWAS研究产生了大量的SNP,大部分在...
本篇主要内容 本篇主要介绍两种方法,搜索并批量下载ENCODE数据。 方法一:在页面中搜索并获取下载地址 进入ENCODE portal主页:h...
本系列主要内容 介绍ENCODE的数据概况,在data portal上查询数据,使用REST API批量下载数据,参照ENCODE官方数据处理流...
奋斗在人类组学数据分析的一线,要随时跟上最新的研究进展。大型的研究项目会有全面的数据集和可视化工具,也有专门从各个数据源收集数据整合而成的数据库...
作为一名生物信息“工程师”,日常的工作环境是基于Unix的计算机集群,因此最常用的就是shell脚本。它可以简单的处理数据,再加上迷你语言sed...