Character-level Convolutional Networks for Text Classification

文中指出,在大规模数据集上(尤其是书写不规范的ugc),cnn文本分类问题在char-level同样有很好的效果。
文中alphabet总共有70个char:


alphabet

模型包括6层卷积3层全连接,前两层fc使用了0.5的dropout。


char-cnn

每层细节如下表所示:


输入部分截断到长度为1014,不在alphabet中的词向量置0。

数据增强:近义词替换

评估:


Evaluation
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容