二项分布和泊松分布都描述的是事件成功次数的分布,泊松分布是二项分布的极限分布,其适用条件是n很大,p很小的情况。生物学中一些过程可以使用二项分布或者泊松分布来模拟。 1. 使...
二项分布和泊松分布都描述的是事件成功次数的分布,泊松分布是二项分布的极限分布,其适用条件是n很大,p很小的情况。生物学中一些过程可以使用二项分布或者泊松分布来模拟。 1. 使...
数据分析时我们经常会遇到多组treatment和control,多个细胞系,多种组学数据类型的情况,用ggplot或者matplotlib作图时就要头疼选颜色的问题,这里有一...
R语言中绘制热图heatmap的包(package)有很多,除了许多炫酷的第三方包外,系统自带的image函数使用起来也十分方便灵活。 1.主要绘制参数 2.绘制常规heat...
RegulomeDB和HaploReg数据库提供了将大量基因组学数据与非编码突变整合的思路。 1.背景 GWAS研究产生了大量的SNP,大部分在非编码基因组 这些SNP其实是...
本篇主要内容 本篇主要介绍两种方法,搜索并批量下载ENCODE数据。 方法一:在页面中搜索并获取下载地址 进入ENCODE portal主页:https://www.enco...
2333
玩转ENCODE项目的数据资源(一)本系列主要内容 介绍ENCODE的数据概况,在data portal上查询数据,使用REST API批量下载数据,参照ENCODE官方数据处理流程构建自己的pipeline。...
本系列主要内容 介绍ENCODE的数据概况,在data portal上查询数据,使用REST API批量下载数据,参照ENCODE官方数据处理流程构建自己的pipeline。...
哈哈 谢谢!一起进步
基因组学数据分析常用的在线资源奋斗在人类组学数据分析的一线,要随时跟上最新的研究进展。大型的研究项目会有全面的数据集和可视化工具,也有专门从各个数据源收集数据整合而成的数据库。手头备几个,方便查阅。 Ge...
奋斗在人类组学数据分析的一线,要随时跟上最新的研究进展。大型的研究项目会有全面的数据集和可视化工具,也有专门从各个数据源收集数据整合而成的数据库。手头备几个,方便查阅。 Ge...
作为一名生物信息“工程师”,日常的工作环境是基于Unix的计算机集群,因此最常用的就是shell脚本。它可以简单的处理数据,再加上迷你语言sed和awk,也能满足日常需求了。...