《Modern Statistics for Modern Biology》Chapter 一: 离散数据模型的预测(1.1 - 1.3)
《Modern Statistics for Modern Biology》Chapter 一: 离散数据模型的预测(1.4 - 1.5)
《Modern Statistics for Modern Biology》Chapter 二: 统计建模(2.1-2.3)
《Modern Statistics for Modern Biology》Chapter 二: 统计建模(2.4-2.5)
《Modern Statistics for Modern Biology》Chapter 二 统计建模(2.6 - 2.7)
《Modern Statistics for Modern Biology》Chapter 二 统计建模(2.8 - 2.9)
《Modern Statistics for Modern Biology》Chapter 二 统计建模(2.10 完结)
《Modern Statistics for Modern Biology》Chapter 三:R语言中的高质量图形(3.1-3.4)
《Modern Statistics for Modern Biology》Chapter 三:R语言中的高质量图形(3.5-3.6)
《Modern Statistics for Modern Biology》Chapter 三:R语言中的高质量图形(完结)
从这章开始最开始记录一些markdown等小知识
$\hat{p}=\frac{1}{12}$
:
掌握R语言中的apply函数族
卡方检验
Hardy-Weinberg equilibrium( 哈迪-温伯格平衡 )
带你理解beta分布
简单介绍一下R中的几种统计分布及常用模型
- 统计分布每一种分布有四个函数:
d――density(密度函数),p――分布函数,q――分位数函数,r――随机数函数
。比如,正态分布的这四个函数为dnorm,pnorm,qnorm,rnorm
。下面我们列出各分布后缀,前面加前缀d、p、q或r就构成函数名:norm:正态
,t:t分布
,f:F分布
,chisq:卡方
(包括非中心)unif:均匀
,exp:指数
,weibull:威布尔,gamma:伽玛
,beta:贝塔
lnorm:对数正态,logis:逻辑分布,cauchy:柯西
,binom:二项分布
,geom:几何分布
,hyper:超几何
,nbinom:负二项
,pois:泊松
signrank:符号秩,wilcox:秩和
,tukey:学生化极差
如何预测一条序列是否含有CpG岛
图片输出尽量保存为矢量图
结合setNames
函数与scale_fill_manual
函数来指定ggplot2
的填充颜色(Figure 3.13)
要善于用stat_summary
来自定义函数结合ggplot2
进行绘图
4. 混合模型
- 这一章能学到什么?
- 有两个正态总体组成的分布生成我们自己的混合模型数据
- 了解期望最大值(EM)算法,并允许我们对数据集中的基础混合物进行“逆向工程”。
- 对于像
ChIP-seq
这中含有许多0的使用一种叫做零膨胀的混合模型 - 发现
经验累积分布
:一个我们可以建立从观测数据的特殊的混合物。这将使我们能够看到如何使用bootstrap来模拟我们估计的可变性。 - 建立拉普拉斯分布作为一个实例的无限混合模型-有许多组成部分。我们将用它来模拟启动子的长度和微阵列的强度。
- 这是我们第一次遇到
γ-Poisson分布
,这是一个对RNA-Seq数据有用的分层模型。我们将看到它自然地来自于混合不同的泊松分布的源。 - 了解混合模型如何使我们能够选择数据转换。