登录注册写文章

词向量《A La Carte Embedding: Cheap but Effective Induction of Semantic Feature Vectors》

布口袋_天晴了

词向量《A La Carte Embedding: Cheap but Effective Induction of Semantic Feature Vectors》

一、背景

词的向量表示，在很多NLP任务中常用预训练好的词向量表作为模型的输入。该论文提出了一个A La Carte词向量表示模型，相对于word2vec，它利用了更多的词的上下文信息。实验数据使用的是SemEval 2013、2015比赛的多语言词义消歧任务(Mutilingual Word Sense Disambiguation Task)，包含5种语言，英语、法语、德语、意大利语、西班牙语。

二、模型

假设：
1)有一个大的文本语料集 $C_{v}$ ={ $text_{1}$ , $text_{2}$ , $text_{3}$ ...}
2)文本语料集中的词w，构成一个词表V
3)词w的上下文词序列用c表示，它由固定大小的窗口截取而来
4)模型需要训练的词向量 $v_{w}\in \mathbb{R}^{d}$ ，词向量表为v_w，模型的目标是训练出一个好的文本特征表示 $v_{f}\in \mathbb{R}^{d}$

三、理论分析

四、实验结果

最后编辑于：2019.07.28 18:56:39

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

吾爱NLP(5)—词向量技术-从word2vec到ELMo
本文关键词：NLP、词向量、word2vec、ELMo、语言模型该系列更新的第二篇已在个人微信公众号「AI极客」...
流川枫AI阅读 27,765评论 6赞 48
NLP笔记——词向量Why and How
从今天起，我们一起来学习词向量word2vector（简称w2v）相关的知识。虽然，对于NLP来说，w2v技术和操...
Stack_empty阅读 9,582评论 0赞 11

《自然语言处理》整理
References：《speech and language processing 》2nd & 3rd 《统...
艺术叔阅读 12,300评论 1赞 8
王小暖的简介
王小暖，彩票营销自媒体第一人。从事彩票行业七年，撰写彩票营销文章近百篇，公众号“王小暖的暖小王”定期更新，呈现更...
王小暖LOTTERY阅读 8,769评论 0赞 2
暑末秋初
夜转凉星北移众门户皆安宁偶有瓦片轻响檐西喵呜一声墙角伏螽斯一生无垢长得有趣行的方正喜乐好诗最...
叶抽抽阅读 1,742评论 2赞 2

赞1赞

赞赏

手机看全文