综述:方面级情感分析(一)Aspect Based Sentiment Analysis

        随着信息技术快速发展,在互联网上发表评论已成为人们表达观点传递经验的重要途径。与此同时,互联网评论文本也成为人们寻找决策参考信息的重要来源。然而,信息爆炸式增长使得从中获取有用信息的难度加大。对评论文本所表达的观点进行自动获取的情感分析技术,通过对文本中的观点、情感、评价和态度进行计算,实现自动化情感识别,为用户获取观点信息带来便利。

       文本情感分析,也称为观点挖掘(Opinion Mining),是针对人们对实体(包括产品、服务、组织、个人、议题、事件、话题及他们的属性等)表达的观点、评价、态度和情感进行计算的研究[2-4]。它涉及了很多细分方向,名称很多,例如观点提取、情感挖掘、主观性分析,情感计算、情绪分析和评论挖掘等。虽然这些任务略有不同,但都属于情感分析的范畴。自2000年初以来,情感分析逐渐成了自然语言处理(Natural Language Processing,NLP)领域的一个重要研究方向。

       国际语义评测(International Workshop on Semantic Evaluation,SemEval)和国际自然语言处理与中文计算会议(International conference on Natural Language Processing and Chinese Computing,NLPCC)分别自2007和2012年起多次组织情感分析的评测任务,发布了一系列基准数据集,吸引大量研究机构和学者参与(统计情况如下表所示)。

        文本情感分析可以按分析粒度分为篇章级情感分析、句子级情感分析和方面级情感分析[4]。早期阶段,篇章级和句子级情感分析任务是研究的重点。它们假设一段文本只有一种情感,并对给定文本进行分析并判断其整体的情感极性是正面、负面或者中性等。篇章级和句子级情感分析的方法仅仅是处理对象文本的长度的差异。目前,针对文本整体进行情感分析的研究技术已经相对成熟,达到了较好的性能。然而,对文本进行整体情感分析会掩盖其细节,且整体情感并不能反映人们对意见目标的、细粒度的情感表达。如果只关注整体情感而忽略具体细节,可能会在推荐系统、问答系统等现实应用中计算出有误的结果。因此,为了进行更完整的情感分析,系统需要发现文本评论的各个方面对象,并确定文本针对每个方面所表达的情感信息,这就是方面级情感分析技术。

       与篇章级和句子级情感分析相比,方面级情感分析研究面临了新问题。一方面,方面级情感分析需要获取文本中的评价对象方面信息。评价对象方面可能显式的出现在文本中,也可能隐式的包含在文本语义中。因为方面的形式和数量都不确定,所以方面级情感分析技术不仅要对显式的语言表达结构进行分析,还要对隐式的语义表达进行深层理解。另一方面,方面级情感分析需要为每个评价对象确定对其表达情感的上下文范围。自然语言不但表达连贯、用语灵活,指代词等表达方式也非常普遍。方面级情感分析技术需要正确理解了文本词语级和句子级的语义信息,才能正确地界定对各个评价对象方面进行情感表达的上下文范围。解决上述问题需要更强大的NLP技术。

(摘自本人博士毕业论文引言)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。