Chapter 3 Making a Story Sticky
A sticky idea is an idea that is more likely to make a difference.
— Chip Heath and Dan Heath
一个不争的事实是,没有任何科学论文或著作可以像荷马史诗或者《诗经》《楚辞》一样被永久传颂。退一步讲,一个残酷的事实是绝大多数论文的命运是看后即忘。如果让一个科研工作者回忆一下脑子里有哪些可以脱口而出的工作,只怕很多人都会立马语塞。
我们已经知道,科学写作成败的关键在于能否讲好一个故事(2021-12-10科学写作的成败在于能否讲好一个故事 - 简书 (jianshu.com))。那么,如何才能够讲好一个故事呢?作者根据Made to Stick (by Chip and Dan Heath,2007)一书的总结,列出以下6点,首字母可以缩写为SUCCES:
简洁(S: Simple)
意外(U: Unexpect)
具体(C: Concrete)
可信(C: Credible)
情绪感染力(E: Emotional)
故事性(S: Stories)
一 简洁
人们是无法记住复杂的故事的。所以一篇论文如果无法用简单的一两句话概括其要点,那么它可能也无法被轻易的接受和广泛的传播。
但是,简洁不代表简单。简洁是用简单的语言清晰地浓缩出最核心的要点,而简单只是粗浅的传递出表面的信息。一个想法,一个故事越简洁,那么它的影响力就会越广泛深远。比如进化论的核心是适者生存,这一点任何心智正常的一般人都能够理解,所以其影响极其深远。
如何才能够使表达变得简洁呢?策略就是使用适当的Schema(可以理解为框架,模型),也就是一般所说的“行话”。一个优秀的科学写作者需要根据目标听众使用不同的语言框架。比如,对于同行,可以使用专业的术语,但是对于非同行,或者一般的读者,则应该使用能够被对方接受的语言表达方式。
类似的,针对专业的杂志(如Neuron, Nature neuroscience)和面向大众的杂志(Nature, Science),所使用的词汇,表达方式,组织结构和理论框架,可能是迥异的。如果以面向专业杂志的语言表达体系向Nature, Science投稿,投中率只怕会大打折扣。所以,简洁不代表非要用行话,需要根据目标读者和杂志的风格调整行文的方式。
二 意外
如果一个科学发现或科学论文无法给读者带来任何意外,那么应该是免不了看后即忘的命运的。
那么如何才能够“制造”意外呢?
第一重要的是,要深入到数据里面去,让数据直接说话:Few data sets don’t provide the opportunity to develop new insights. Conversely, few data sets are so imbued with novelty that you can’t use them to tell a boring and uninsightful story. Your job is to find what is novel and highlight the unexpected elements. Frame new questions and look for new insights. Make them clear in your writing. 我太喜欢这一段话了,所以直接收录了。让数据说话,意味着科研人员需要做一个敏锐的观察者,努力从数据当中发掘那些不是从一开始就可以预料得到的“意外”发现,也就是创新点。
粗略而言,数据挖掘可分为两种策略:1. 假说驱动的数据挖掘 (Hypothesis-driven data mining);2. 探索性数据挖掘 (Exploratory data mining)。这两种策略各有利弊。前者目标明确,快速高效,对于快速完成一个假说驱动的科学研究极具成效。但容易让研究者带上有色眼镜,忽略掉那些可能更为重要但是与原有问题没那么相关的“意外”发现。后者使研究者以更开放的心态去看待数据,不局限于预先设定的假说,因此更有可能做出一些重大的科学发现。科学史上那些令人神往的重大发现往往是基于这种策略。这个方法的坏处是,因为没有明确的目标,研究者需要尝试更多的数据组织方式,数理统计手段。而现有的数学工具又那么丰富,意味着这种开放式的数据挖掘很可能是没有止境。加之处于当今这个大数据的时代,每换一种方法都意味着令人望而生畏的工作量,故而单凭这种策略只怕也是不现实的。
所以,我认为最高效且最富有成果的数据挖掘策略应该是这两者的适时适量的组合。所谓“适时”,是指在早期阶段应该以“假说驱动的数据挖掘”为主导,以期最高效地组织出一个大致完整的故事框架;之后,再以“探索性数据挖掘”为主导,以期发掘那些预想不到的“意外”发现。一旦觉察到了一点“意外”的发现,又应该转以“假说驱动的数据挖掘”为主导,以期最快地组织出一个自洽的故事框架。所谓“适量”,是指不论用哪一种策略,都应该以是否足以组织出一个大概完整的故事框架为标准,而不能一味地沉浸于数据本身,反而忽略了包装故事的根本目标。很显然,最富成效的数据挖掘不可能一遍就能够完成的,反复的拆解,拼接,组织是必需的步骤。就好比一本好书,要想真正发掘并吸收其中的价值,反复阅读和拆解也是必需的。
第二是要发掘认知空白,并用数据去填补认知空白。In science, the key to highlighting the unexpected is through the knowledge gap theory of curiosity described by Heath and Heath. There is undoubtedly an enormous mass of knowledge on your overall topic, but your work should identify the unknown within that mass. By highlighting that unknown, identifying ignorance in the midst of knowledge, you create unexpectedness and engage a reader’s curiosity. 所以,是否填补了一项认知空白是衡量一项科学工作之意义的最重要指标。填补了一个小的认知空白,就是一个小创新;填补一项大的认知空白,就是一项大创新。You frame a knowledge gap by using what is known to identify the boundaries of that knowledge. It’s like framing a window — build the structure to support the area you will fill in. Identifying a knowledge gap creates curiosity. Filling that gap creates novelty。
需要提出的是,科学的发展是渐进的。每一项研究都只是在前人的基础上迈出一小步。尽管只是一小步,只要它确实填补了某一点空白,那就是创新。
未完待续!