吴思涵老师推荐
- 干货分享 实用生物统计手册以及配套的R代码
好多统计学书都写得难啃,不光堆砌公式,连例子都不好好举。Handbook of Biological Statistics是我目前看着觉得最棒的一本生物统计学指南。虽然是英文的,但句子都写得很简单,一点都不拽文。公式推导能省则省(反正生物狗又不看),而且举的例子都是非常切合科研实际的。原作者免费公开全文在这个网站上:
Introduction - Handbook of Biological Statistics
书里的计算主要基于SAS,但是又有另外的大神,将里面几乎所有的实例,都用R来实现了。地址在这里:
R Handbook: Purpose of this Book
书里会介绍很多国内统计学课堂比较少涉及的好方法,比如Permutation test,可以通吃大多数非参检验,甚至在很多情况下,可以取代不够敏感的秩和检验(再也不怕秩和出来后P>0.05了😂)。不过很遗憾的是,貌似没有专门的章节,来介绍大数据比如基因组学中会用到的Kolmogorov-Smirnov test,Monte Carlo方法等。不过,这些google一下就有了。
李程老师推荐
-
【进阶篇】Elements of Statistical Learning, Trevor Hastie等著,第二版PDF下载,纸版
如果只精读一本应用统计书,就是它了。可以先读第3、4、7、13、14、18章,再自选其他章阅读。读的时候,如果需要的话复习线性代数、随机变量、期望、条件概率等知识,要熟悉随机变量向量的求期望、求导等。深化所学理论的的方法:做每章后的能看懂的练习、结合理论和例子分析自己项目中的数据。
统计学R网站
-
CHOOSING THE CORRECT STATISTICAL TEST IN SAS, STATA, SPSS AND R
-
WHAT STATISTICAL ANALYSIS SHOULD I USE? STATISTICAL ANALYSES USING R
-
PH525x series - Biomedical Data Science
-
29 Statistical Concepts Explained in Simple English - Part 1
-
Learning statistics with R:A tutorial for psychology students and other beginners(Version 0.6)
R语言统计入门课程推荐——生物科学中的数据分析 Data Analysis for the Life Sciences ,Rafael A Irizarry是哈佛大学公共卫生学院丹娜法伯癌症研究院的生物统计和计算生物学教授,有17年分析基因组数据的经验。
Michael I Love是北卡教堂山大学生统与遗传系助理教授。研究方向为利用统计模型发现基因组数据中的生物为规律,并开发了Bioconductor中开源统计软件。
课程源代码:https://github.com/genomicsclass/labs 包括课程所有源代码、测试数据和结果
网页版教程: https://genomicsclass.github.io/book/ ,包括课程的Rmd运行结果网页教程,和Rmd源代码的每节导航和下载链接。
电子书:https://leanpub.com/dataanalysisforthelifesciences/ 方便下载各版本在移动端阅读
-
任爷爷说统计学特别重要,大家努力学好统计学吧。这是斯坦福大学教授Russell A.Poldrack为学生准备的本科教材,他本人说并未接受过统计学家培训,却有着出神入化的统计处理技巧。本书涉及数据处理,假设检验,统计建模的R语言应用,容我占坑,到时拜读完来个读书笔记
-
An Introduction to Statistical and Data Sciences via R
-
上面的更新版: Statistical Inference via Data Science A moderndive into R and the tidyverse
A Language, not a Letter: Learning Statistics in R
20200301-Statistical Rethinking with brms, ggplot2, and the tidyverse version 1.1.0
Rmarkdown 链接:https://zenodo.org/record/3693202#.Xl4n9KgzZhE
统计可视化书籍,图特别漂亮。
Nature 下的 Statistics for Biologists
2021-Statistics With RSolving Problems Using Real-World Data