嗯,川普要上台了,在奥黑farewell address明里暗里黑完川普之后,火箭君对新一任美国总统的就职演说风格充满了好奇——这不,有人的好奇劲比火箭君更足,竟然定量分析了历年美国总统的就职演说稿,想要了解演说风格的影响因素——火箭君今天决定把这篇论文翻出来和大家一起看一看~!
论文说了点啥?
整篇论文分析了过去200多年来总计57篇美国总统的就职演说
从乔治华盛顿到巴拉克奥巴马,所有的就职演说词都被用文体测定索引(stylometry indices)的方法进行分析。整个分析希望能够发现政治和历史特点(比如战争、金融危机、意识形态等特点)是不是会影响美国总统就职演说的风格。
为了定量分析出就职演说的特征,学者Miroslav Kubát提出了3个重要指标:
演说中使用词汇的丰富程度(人话:是不是词汇贫乏)
演说主题的集中程度(人话:是不是乱开无轨电车)
描述性用词的多少(人话:是不是干货够多)
#火箭君结论先行,但是看到最后总是有彩蛋的#
学霸通过追溯两个多世纪一来的总统演说,发现:
总统的就职演说没有明显受到任何政治和历史的特点影响,反倒是非常取决于每个总统自身的性格
战争也好、经济萧条也罢可能会在某些方面影响演说的用词,但是,总统就职的时候要怎么说话,主要还得看总统的喜好~
分析维度说明
A. 演说中使用词汇的丰富程度(是不是用词贫乏)
为了知道一篇演说的用词丰富程度,我们使用MATTR(Moving Average Type-Token Ratio)的办法分析演说的用词丰富程度。这种办法通过滑动平均的方法测算一篇文章的词汇丰富度
例如:
如果有一篇7个短语(N=7)组成的文章:a,b,c,a,a,d,f。设定观察窗口为3个词(L=3)
首先找出文章中的词汇窗口,分别是a,b,c | b,c,a | c,a,a | a,a,d | a,d,f,一共5个
这篇文章的词汇丰富度 = (每个窗口中不重复的词汇之和) / L(N-L+1)
在这个例子中,这篇文章的用词丰富度就等于0.87
B.测算演说主题的集中程度(是不是无轨电车乱开)
文章用Secondary thematic concentration (STC)这个指标来表达演说主题集中程度。STC指标可以表现出演说者的演说有多关注于一个(或者多个)特定主题
譬如有些领导的风格是一说起话来就无轨电车乱开,这个指标就会很低……
具体算法太复杂了,火箭君懒得看更懒得写了……
C. 测算描述性用词的多少
这个计算火箭君举个例子大家就明白了:
林肯的就职演说(1865年)中,一共使用了102个动词,36个形容词
行动力指标(Q)= 102/(102+36) = 0.74
代表这是一篇对行动力要求非常高的就职演说
历年总统的就职演说
嗯,所以,历年美国总统的就职演说的各项指标就这么可以列出来啦!!!!
奥黑成为了100年来最能开无轨电车的总统
最后彩蛋,历年总统就职演说KPI~可以打开收藏哦~