中文情感分析

一.Deep Learning（深度学习）学习笔记整理系列https://blog.csdn.net/zouxy09/article/details/8775360

二.文本情感分类（一）：传统模型
 https://spaces.ac.cn/archives/3360
传统的基于情感词典的文本情感分类，是对人的记忆和判断思维的最简单的模拟，可以通过以下几个步骤实现基于情感词典的文本情感分类：预处理、分词、训练情感词典、判断，整个过程可以如下图所示。

image.png

1.文本的预处理
2.句子自动分词
结巴中文分词、中科院分词、smallseg、Yaha 分词
3.载入情感词典
词典是文本挖掘最核心的部分，对于文本感情分类也不例外。情感词典分为四个部分：积极情感词典、消极情感词典、否定词典以及程度副词词典。

image.png

加入了某些行业词汇，以增加分类中的命中率。不同行业某些词语的词频会有比较大的差别，而这些词有可能是情感分类的关键词之一。比如，薛云老师提供的评论数据是有关蒙牛牛奶的，也就是饮食行业的；而在饮食行业中，“吃”和“喝”这两个词出现的频率会相当高，而且通常是对饮食的正面评价
4.文本情感分类

image.png

优化思路：
1.非线性特征的引入
所谓非线性，指的是词语之间的相互组合形成新的语义。我们将积极词语和消极词语相邻的情况，视为一个组合的消极语块，赋予它负的权值
2.情感词典的自动扩充
结论：
（1）基于情感词典的文本情感分类是容易实现的，其核心之处在于情感词典的训练。
（2）语言系统是相当复杂的，基于情感词典的文本情感分类只是一个线性的模型，其性能是有限的。
（3）在文本情感分类中适当地引入非线性特征，能够有效地提高模型的准确率。
（4）引入扩充词典的无监督学习机制，可以有效地发现新的情感词，保证模型的强健性和时效性。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

中文情感分析

中文情感分析

相关阅读更多精彩内容

友情链接更多精彩内容