facebook关停AI语音事件,这些由冰冷的人工智能自己创造出来的,仅供AI圈子的内部交流使用。人工智能运算法则能够对大量的社交媒体数据进行筛选。
每年数十亿用户借助社交媒体发布数以千亿计的微博和帖子,社交媒体为社会科学带来了大数据。心理学家马丁·塞利格曼(Martin Seligman)认识到:社交媒体提供了一个前所未有的机会——利用人工智能来查清大众沟通的意义。在宾夕法尼亚大学积极心理学研究中心,塞利格曼和二十多位心理学家、医生和计算机科学家投身于世界福祉项目,利用机器学习和自然语言从大量数据中进行筛选,来判断公众的情绪和身体健康状况。
从传统上来讲,这些都是利用调查来进行的。然而,塞利格曼说:“社交媒体数据并不引人瞩目,非常廉价,而且得到的数据在数量级上要大得多。”社交媒体上的数据也是凌乱的,但是人工智能可以提供一个高效的方法,来揭示其中的模式。
在最近的一项研究中,塞利格曼及同事审视了29,000名用户在脸谱网上更新的内容,此前这些用户对于是否患有抑郁症进行了自我评估。研究人员利用其中28,000名用户的数据资料,通过机器学习运算法则,发现他们更新内容中的用词和抑郁程度存在关联。然后,仅仅根据更新的内容,这种运算法则就可以成功地判定其余用户患有抑郁症了。
在另外一项研究中,研究小组通过分析1.48亿篇微博,预测出县级心脏病患者的死亡率。结果证明,跟愤怒和消极关系有关的话语成为危险因素。与根据吸烟、糖尿病等10个主要的危险因素所进行的预测相比,通过社交媒体进行的预测跟实际死亡率更加接近。研究人员还利用社交媒体来预测人的性格、收入和政治思想意识,来研究医院护理、神秘经历和刻板印象等情况。通过推特网的数据,研究人员甚至创建了一张地图,用不同的颜色描绘了美国每个县居民的幸福感、抑郁度、信任度和五种人格特质。
得克萨斯大学奥斯汀分校的社会心理学家詹姆斯·宾巴克(James Pennebaker)说:“在语言分析与心理学的联系方面,正在发生一场革命。”宾巴克注重的不是内容,而是风格。例如,他发现:可以根据大学招生考试的文章中所使用的功能词来预测成绩。冠词和介词的使用说明考生具有分析思维能力,可以预测其成绩会较高;代词和副词的使用表示考生具备叙事思维能力,可以预测其成绩会较低。此外,宾巴克发现的证据表明:1728年的剧本《将错就错》(Double Falsehood)中的大部分内容可能是由威廉·莎士比亚撰写的,根据认知复杂性和罕见词等因素,机器学习运算法则认定该剧本与莎士比亚的其他作品一致。宾巴克称:“现在,我们可以分析一个人曾经撰写过的、发布过的所有内容,并且逐渐地也可以对你和他人的谈话方式进行分析。结果就是,我们可以越来越详细地描绘大家到底都是什么样的人了。”