生态学(Ecology)是研究有机体及其周围环境相互关系的科学。
2018年7月12日开始读赖江山翻译的《数量生态学——R语言的应用》,英文版见Numerical Ecology with R(网址提供书中用到的数据以及演示代码)。在简书做个笔记。我本身是学植物营养学的,往大了说也算生态学的一种。阅读本书很大原因是出于工作的原因,我工作的小组叫生态组。具体地:
- 生态学数据的生态学意义
- 新工具R的应用
书中的知识点在后期我会慢慢为各位呈上,我也希望您也买一本书和我一块学习。特别是当您是环境大类的朋友或者农学大类的朋友,我愿与您奇文共欣赏疑义相与析。
本节绪论主要是一些基础的介绍,但是这些准备结果必不可少。如果的电脑还没有装R(不管是哪个版本的),如果不知道数据集的结构后面的描述都是无法完成。R的安装倒是容易的,R包的安装也不是难事,学R要常用浏览器去搜索。记住你并不孤单,你遇到的问题别人也是遇到过的。另一个主要的就是数据集的结构,其实很多数据的处理都是在整理数据结构,结构整好了,统计和可视化都是很简单的。
所以这两点,希望各位同仁注意。
需要加粗提醒的是:实操,实操,实操。
实践是检验真理的标准,书中的代码一定要亲自过一遍。眼高手低当然要比下马观花容易得多,当然获得东西也比较少。当然以下几类朋友可大致看看就行:
- 看书就为打发时间
- 挺新鲜的,我就看看
- 以后可能用得着吧,看看留个印象
- 已经看过,当知识字典用,用到的时候查查
- 就算过一遍代码又有何用?!
下面介绍一下本书用到的主要的数据集
rm(list=ls())
setwd("D:\\Users\\Administrator\\Desktop\\RStudio\\数量生态学\\Run")
#导入物种多度数据
spe<-read.csv("../DATA/DoubsSpe.csv",row.names = 1)
View(spe)
#导入环境数据
env<-read.csv("../DATA/DoubsEnv.csv",row.names = 1)
View(env)
#导入空间坐标数据
spa<-read.csv("../DATA/DoubsSpa.csv",row.names = 1)
View(spa)
Verneaux在其博士论文中建议使用鱼的种类划分欧洲河流的生态区,他认为鱼类群落对水体质量有很好的生物指示作用。本书所用的Doubs数据集是Verneaux的研究中中所收集数据的一部分,来自沿法国和瑞士边境的Jura山脉的Doubs河30个取样点(样方)的数据。该数据集有3个矩阵组成。
-
27种鱼类在每个样方的多度。
-
包括11个与河流水文地形和水体化合物相关的环境变量
-
样方的地理坐标(笛卡尔坐标系,x和y)
甲螨数据集
- 35个形态多度数据
- 5个基质和微地形数据
- 70个取样点的笛卡尔坐标数据
在我们的工作中总是与各种表打交道,那么我们看看以上这三个表,发现了吗?它们病平时用的表有什么区别呢?这里要区别两种表,一种叫数据表,一种叫报表。对于数据分析来讲应用最多的是像面的表叫数据表:单表头;无合并单元格;每列是独立的属性,每行是平行的。举一个简单的数据表。
报表就是由数据表整理过来的,它形式多样,文章中出现的三线表是典型的报表,一种和数据表类似的报表是这样的:
如何处理表是一个基本功,R的数据是基于向量的,这种数据的结构更适用数据表。数据表结构简单可塑性强。那么请问文章中Doubs数据集的3个矩阵哪个属于数据表,哪个属于报表呢?都是报表,我们回过头来看看这三张报表,他们是通过哪个数据联系到一起的呢?一个是每个样方的名字,而报表中并未给出。这样的话应该是表的行顺序把它们联系到一起的,让我们想想在我们进行多表操作的时候(关联分析),这是一件多么危险的事。