2000年初,Hu等[1]首次建立了基于规则的细粒度情感分析模型,命名为基于特征的观点摘要(Feature-based Opinion Summarization),受到学术界关注,带动了该领域技术方法的发展。2010年,Thet等[2]明确提出了方面级情感分析(Aspect Based Sentiment Analysis,ABSA)的概念,并定义评论对象“方面”为实体的属性或实体的组成部分。2012年,Liu[3]进一步形式化地给出了观点的定义,为方面级情感分析研究指明了方向。接下来,国际语义评测SemEval从2014年起连续三年将ABSA任务作为其子任务,梳理了四个子任务,提供了一系列人工标注的基准数据集[4-6]。近年来,基于深度学习技术的方面级情感分析研究蓬勃发展,取得了突破性进展。
下面根据Liu[3]和SemEval评测会议[4]的阐述,梳理本文涉及的基本概念。
定义1:观点(Opinion):观点对象包含五个元素:(表达者,实体,方面,时间,情感)。其中,表达者是观点表达的主体;实体是主体评价的客体;方面是实体的一个方面;情感一般包括正面、负面和中立等;时间是发表观点的时间。
定义2:实体(Entity):实体是评论的目标,这个目标可以是产品、服务、话题、时间、人物、组织或事件等。方面级情感分析研究中的每个观点都有一个目标实体,可以是被评价的实体本身,也可以是实体的一部分、一个模块或相关实体。
定义3:方面(Aspect):方面是评论的对象实体属性(如在餐厅评论中,一个方面可以是食品的价格,质量等)。方面是一个较高层次的概念,相对于评论文本包含的词汇,方面概念集合规模很小。
早期研究将评论中的方面信息划分为两类:显式方面与隐式方面。显式方面是指在评论文本中显式出现的评价对象方面表述,隐式方面则是暗含在评论文本语义中的评论对象。2014年,SemEval将方面级情感分析任务的方面对象分为方面术语和方面类别。方面术语是显式方面表述,方面类别则为方面表述不显示出现在评论文本的情况提供了获取方面信息的解决思路。SemEval提供的基准数据集,由人工标注了评论文本中的方面术语、方面类别和情感极性信息,相关定义如下。
定义4:方面术语(Aspect Terms):方面术语是出现在评论文本中的词语序列,是评论对象实体方面的表述信息,通常有较大的词汇量。方面术语可以是一个词也可以由多个词连接组成(如图1.1所示,“juices”、“service”和“staff”邓均为单个词形成的方面术语)。
定义5:方面类别(Aspect Category):方面类别由评价对象实体及其属性组合而成(如图1.1中“Love all their juices”的评价对象对应的方面类别是“DRINKS#QUALITY”类别,其中对象实体为“DRINKS”,属性为“QUALITY”)。
定义6:情感极性(Sentiment Polarity):情感极性是指评论文本中表达的正面、负面、中性或者冲突的情感。其中,冲突是指评论文本对评价对象既表示了正面情感又表达了负面情感。
方面级情感分析任务的目标是找到评价目标方面信息及其对应的情感极性。根据定义4和定义5,方面信息可以是从实际的评论文本中提取方面术语,也可以预定义的方面类别。因此,方面级情感分析可划分为方面术语抽取(Aspect Term Extraction,ATE)、方面类别检测(Aspect Category Detection,ACD)、方面术语极性分类(Aspect Term Polarity,ATP)和方面类别极性分类(Aspect Category Polarity,ACP)四个核心子任务。
(摘自本人博士毕业论文引言)
[1] M.Hu and B. Liu. Mining and summarizing customer reviews. in Proceedings of the ACM {SIGKDD} International Conference on Knowledge Discovery and Data Mining.(2004).
[2]T.T. Thet, J.-C. Na and C.S.G. Khoo, Aspect-based sentiment analysis of movie reviews on discussion boards. Journal of Information Science. 36(6), 823-848. (2010).
[3] B. Liu, Sentiment analysis and opinion mining. Synthesis Lectures on Human Language Technologies. (2012).
[4]M. Pontiki, D. Galanis, J. Pavlopoulos, H. Papageorgiou, I. Androutsopoulos,and S. Manandhar. Semeval-2014 task 4: Aspect based sentiment analysis. in Proceedings of the 8th International Workshop on Semantic Evaluation(SemEval-2014). (2014).
[5]M. Pontiki, D. Galanis, H. Papageorgiou, S. Manandhar, and I. Androutsopoulos.Semeval-2015 task 12: Aspect based sentiment analysis. in Proceedings of the9th International Workshop on Semantic Evaluation (SemEval-2015). (2015).
[6]M. Pontiki, D. Galanis, H. Papageorgiou, I. Androutsopoulos, S. Manandhar, M.Alsmadi, M. Alayyoub, Y. Zhao, B. Qin, O. De Clercq, and others. Semeval-2016 task 5: Aspect based sentiment analysis. in Proceedings of the 10thInternational Workshop on Semantic Evaluation (SemEval-2016). (2016).