在动物调查中,有一种方法最常见、最简单、最容易操作、成本也最低,这种方法就是访问调查。要想在短时间内对某个地区的物种有个较为可靠的了解,比如要求在一个月内搞清楚XX县分布的大型哺乳动物都有什么,无疑访问调查是最理想的手段。访问的对象就是当地居住的人,我们在调查时喜欢寻找当地的老猎人,通常都是年轻时经常打猎,对当地的动物构成都很了解的人;尤其是那种家里几代人打猎。打猎也有祖传的技术,这种人的信息量最大,也最有价值。对于动物调查来说,这种就叫做“地方性生态知识”(local ecological knowledge, LEK)。这种方式最大的优势就是成本低,不需要很复杂的设备仪器,也不需要在某个地方待很长时间,特别是对于那些通过样线、样点调查很难获得的物种(如猫科动物、夜行性动物等)来说,这种信息意义非凡。
地方性生态知识主要通过两种方式获得,一种是访问调查;另一种是问卷调查。不管哪种方式,都是以获得四方面信息为主要目的:受访者的背景,识别能力,利用信息,态度。基于此目的,设计出结构性或半结构性的调查问卷;为了获得随机性的数据,在调查区域广泛传播,匿名填写。
例如,我们设计一个关于调查雪豹的简单问卷,根据目的设计出以下问题:
一、背景 |
---|
1. 受访者的年龄,在本地居住的时间 |
2. 性别 |
3. 民族 |
4. 职业 |
二、识别 可以给出照片 |
---|
5. 你知道这个动物么?是如何知道的? |
6. 是否听过,具体信息,上一次时间、地点等 |
7. 是否见过,具体描述,上一次时间、地点、种群或是脚印、毛发等 |
三、利用 |
---|
8. 你知道雪豹是打猎的目标么? |
9. 你知道关于雪豹的任何故事么? |
10. 你知道是否有什么人会怎么利用捕获的雪豹么? |
四、态度 |
---|
11. 你认为这个动物现在的状态如何,很多、很少、常见、没有了等? |
12. 你知道哪些动物原来存在,但现在不存在了,能否说出什么原因造成的? |
13. 你认为雪豹目前的是否受到充分的保护,为什么? |
当然具体问题具体分析,这种问券可以设计的很复杂,围绕某个问题可以多设计几个问题,以便于我们判断回答的有效性。也可以多引入几个物种以提高调查的模糊性,防止受访者对于某些问题过于敏感,而降低填写数据的有效性。
但是我们对这种信息的态度要保守一下,毕竟这种数据没有办法考证,无法完全令人信服。因此,我们还需要一定的可靠数据和分析来进行比对,以最小化这些信息的可能误差或偏差。
那么我们分发了1000份问卷,回收了900份,有效份数870份。接下来就是如何面对这些数据的问题了。基本的描述是必须的,比如受访者的背景分布,年龄分布、工作种类的分布等。大多数情况下,男性上山遇见野生动物的比例肯定要超过女性(例外很少);然后是物种信息,哪里有雪豹,可能性有的地方高,有的地方低,哪些地方的人有的月份见了好几次,有的月份只能见到一次。如果要选出优先调查区域的话,这些信息已经给出了我们充分的信息。但这不够科学,所以还欠缺的是用统计去包装,去进一步分析。我想这个问题是很普遍的问题,据本人的多年调查经验,很多情况下调查问卷的数据往往只是做了简单描述,没有进行严谨的数据分析,因此造成了大量浪费(这点估计和野生动物保护专业的人没有相关的统计分析背景有关)。
不绕弯子,先说点干货
在所有问题中,我们最关注的就是最后一次见到的时间,比如"我记得最后一次见到是在1980年。"分析的主要对象就是调查中每年最后一次见到的累计次数,然而在大多数情况下,这些数据都是模糊的,其中最明显的就是时间信息,经常获得的是如下这些
大概十多年前吧,……
或者是
在80年代,……
又或者
好像是2003年,又好像是2004年,……
这些时间非常模糊,有的尺度又非常大。这种数据我们要经过处理,尽可能做到标准化。对于我们的案例,或者对时间尺度进行粗分类,比如1980-1985年,5年一个节点。要是还不行,就再粗一点,1980-1990年,10年一个节点。要还是不行呢?20年一个节点?万一调查尺度就20年呢,粗划分肯定不行了。用统计的方法包装一下,把上面的例子放下来看,
大概十多年前吧,……
那就算到十年前,近年2016年,十年前2006年。"大概十多"我给他多5年,那么区间就是2001年到2006年,在这几年搞个概率分布,我让他均匀分布,那么2001-2006年每年见到的概率均等,在这个概率下随机选择一年。同理,80年代,我就在10年搞均匀分布,选择一年。好像2003又好像2004年,我就一年0.5的概率选择一年。这样子,数据由模糊变到具体,虽然有一定的误差,但也足够建立一个时间序列。为了避免歧义,我引用一个学术文章里面的专业描述,文章发表于2012年的Plos One,作者是Turvey等。
many informants also reported last-sighting dates in alternative formats: paired consecutive calendar years (e.g. ‘1986/1987’), decadal or other ranges (e.g. ‘1980s’, ‘late 1980s’), or decades/half-decades before 2008 (e.g. ‘20 years ago’, ‘25 years ago’). More recent sighting dates were more likely to be reported as direct calendar years because informants had more accurate recall over shorter time intervals, but to avoid excluding large amounts of additional sighting data from further analysis, dates reported in alternative formats were randomized to direct calendar years as follows: paired calendar years were given an equal probability of being assigned to either consecutive year; decadal or other specific ranges were given an equal probability of being assigned to any calendar year within this range; and dates rounded to a given number of decades or half-decades before 2008 were given an equal probability of being assigned to any calendar year ±5 the given value (e.g. ‘20 years ago’ represents a potential date range from 1983–1993).
有了这个序列,然后就比较,严谨地对比,科学地对比。不同地点之间的对比,不同物种之间的对比。几乎可以肯定的是,对于濒危物种来说,可以肯定的是“最后一次见到的频率”在时间尺度上是下降的,有的甚至是灭绝。从这里我们需要比的是什么,看图说话。
图中的数据是长江4种鱼类的最后一次见到的累计分布时间序列,可以直观的看出,1980-2010年,前三种鱼类动物的种群都剧烈下降。并且第三种鲱鱼下降的速度要更快,斜率更小(因为是负值)。这个是我们最关注的问题之一,如果我们同时调查了几种动物,下降最快的那种就是受外界影响最大的,在给定的环境下,这种动物也就最易濒危。
再分析原因,结合其他的数据(如栖息地数据、气候变化、人类活动等)做广义模型,从本人经验来看,斜率要比参数系数给出的感觉更直观,所以在这方面的统计分析上,并不推荐复杂的非线性模型,越简单的线性模型越能直观的表达分析。这种分析结果就可以显示出栖息地丧失影响最大,污染或干扰影响其次,之类的结论。
地方性生态知识虽然不能完全令人信服,但可以给我们下一步工作提供参考依据,并在进一步的工作中进行检验。合理的运用这种信息将给艰难的野外工作提供最强有力的支持。