Neil Zhu,简书ID Not_GOD,University AI 创始人 & Chief Scientist,致力于推进世界人工智能化进程。制定并实施 UAI 中长期增长战略和目标,带领团队快速成长为人工智能领域最专业的力量。
作为行业领导者,他和UAI一起在2014年创建了TASA(中国最早的人工智能社团), DL Center(深度学习知识中心全球价值网络),AI growth(行业智库培训)等,为中国的人工智能人才建设输送了大量的血液和养分。此外,他还参与或者举办过各类国际性的人工智能峰会和活动,产生了巨大的影响力,书写了60万字的人工智能精品技术内容,生产翻译了全球第一本深度学习入门书《神经网络与深度学习》,生产的内容被大量的专业垂直公众号和媒体转载与连载。曾经受邀为国内顶尖大学制定人工智能学习规划和教授人工智能前沿课程,均受学生和老师好评。
Opinion mining and sentiment analysis: Motivation
现在我们的地图已经探索到了观点挖掘和情感分析,这是一项非常具有挑战性和有趣的问题。我们看看现在可以做到什么程度。
Objective vs. Subjective Sensors
如何找到或者说确定那个文档的观点呢?首先我们看看观点的定义
什么是观点 opinion?
观点大概就是一个描述了观点持有人相信或者认定某事物的主观陈述(相对于客观陈述或者事实描述,不可以证明正确或者错误),而且相信或者认定本身也是依赖于文化、背景和上下文关系。
观点的表示
- 基本表示
- 观点持有者:是谁的观点?
- 观点目标:是关于什么的观点?
- 观点内容:观点本身是什么?
- 增强的观点表示
- 观点的上下文:在什么情境下(时间,位置),表示的观点?
- 观点的情感:观点告诉我们关于观点持有者的感受(正面、反面)?
产品评论(显见持有者和目标)
稍微容易挖掘和分析
- 基本表示
- 观点持有者:是谁的观点? 评论者 X
- 观点目标:是关于什么的观点? 产品:iPhone 6
- 观点内容:观点本身是什么? 评论文本
- 增强的观点表示
- 观点的上下文:在什么情境下(时间,位置),表示的观点? Year = 2015
- 观点的情感:观点告诉我们关于观点持有者的感受(正面、反面)? 正面
新闻中的语句(隐式持有者和目标)
这个例子说明了观点目标和持有者都不是显见的,隐藏在文本中间,需要更深的NLP技术才能挖掘和分析
观点的变体
- 观点持有者: Individual vs. group
- 观点对象: One entity, a group of entities, one attribute of
an entity, someone else’s opinion, etc. - 观点内容:
- Surface variation: one sentence/phrase, a paragraph, a whole article
- Sentiment/emotion variation: positive vs. negative, happy vs. sad,
etc. - 观点上下文:
- Simple context: Different time, location, etc.
- Complex context: Potentially includes the entire discourse context of
an opinion
文本中的不同类型的观点
可以看到有如下几种类型:
- 观测到的观点
- 报告的观点
- 作者的观点
- 间接/推测的观点
观点挖掘的任务
为何进行观点挖掘?
- 决策支持
- 帮助消费者选择产品或者服务
- 帮着投票者决定投谁
- 帮助制定新的规则
- 理解人类
- 帮助我们理解人们的偏好(从而更好地服务他们;优化搜索,推荐的效果)
- 帮助我们进行广告(精准广告投放)
- 志愿者调查(人类作为sensor;聚合观点)
- 商务智能
- 市场调研
- 数据驱动的社会科学研究
- 基于文本的预测中获得性能的提升