下雨天能够多大程度上浇灭一个学生去图书馆的热情?我们都知道,如果下雨,并且足够大的话(当然也不至于把整个学校淹没),会有很大一批学生选择窝在寝室里学习,即使他本来会去图书馆的话,兴许还会点个外卖。在南大这个具体案例中,图书馆和教室是同等意义的存在,因为在距离上差不多,如果一个学生不愿意去图书馆,那他也不会乐意跑到教室。所以这里选择图书馆作为考察区域。
那么,这种阻挠到底达到什么程度呢,是否可以有一个定量的数据?假如我们直接去做个问卷调查,问有多少人本来会去图书馆而因此没有去。这是个没有发生的事情,也就是说在回答的时候会受到极大的主观心理干扰,这种测算肯定是不准确的。
由此,我们选择另一种方法,即假设没有下雨,那么会有多少学生来图书馆,再与实际情况相减,就可以算得多少学生本来会来而下雨没有来。考试周是一个特殊的情况,与平常波动较大的图书馆到访人次不同的是,考试周的学生生活比较单一,影响去不去图书馆的因素主要就是有没有考试,至于有多少人会选择图书馆而不是教室,这个系数也是稳定的,本身不影响数据,这几个人不去图书馆那总有另几个人,而且图书馆本身的接待容量也超过峰值水平,不必担心存在图书馆满员的情况。也就是说,图书馆的到访人次,只和需要考试的本科生学生数量有关(硕博生来图书馆的数量长期稳定,可以忽略)。假如把图书馆到访人数看作一个学生储蓄,而它的自然衰减(考试没有了,不来图书馆了)看作一种收益(当然是负收益),那么有这个收益率我们就可以推算若干天后图书馆到访人次还有多少人。这个收益函数可以看作考试安排对于学生学习人数的影响,那么根据教务系统,考试的安排相对而言偏一个线性函数(也就是每天安排的考试数量差不多),我们只需要知道每个学生最后一场考试是什么时候(也就是每天完成最后一场考试的学生数),就可以推导这个线性函数,这个的话可以根据平均必修总学分的平均学期分配来计算,也就是每个学生平均会有多少考试周的考试,然后根据这个考试数在考试周的13天做一个随机概率计算,就可以得到前面 要的数据,推算这个线性函数。从而算出今天这个大雨天,收益达到多少,而根据收益率算出的收益是多少,得出雨天对于这个收益的贡献率,也就是得到这个阻挠指数,下雨天会阻挠百分之多少本来会去图书馆的学生。相对的,教室的计算也是这样,不过教学楼的开放性质使得这个人流量数据获得比较困难。
这个只是一个简单的模型构建,对于这个收益函数完全可以有进一步的修饰,比如说,按照现在流行的大数据的提法,就得用全数据,把所有学生的考试安排都算进去而不是算平均“考试”下的情况,当然这个数据我是拿不到。当然这是一个很无聊也没有什么意义的反事实度量法的应用,不过这个方法也非常有趣(如果能够足够准确和精确的话),那就是它可以模拟出我们平时自己经常开玩笑如果什么没有发生会怎么样下的情况,比如这个理论方法的最初就是罗伯特·福格尔在1964年计算19世纪铁路对美国经济拉动作用时候提出的,他计算了在1890年如果没有铁路,会对美国的GNP带来多少影响。当然结果很惊人也有很多争议啦。
今天也是这位经济史大家,1993年诺贝尔经济学家获得者的90岁诞辰,谨以此文纪念罗伯特·福格尔。