word2vec-20161213

计算短文本的相似性,并用向量来表示短文本。预料库可以自己的文本,不需要分词。要求可以掌握word2vector的模型调用方法和计算相似度的函数。步骤如下:

1)安装gensim(如果没有),根据word2vec将词表示成20维的向量。

2)采用欧式距离或者余弦相似度计算两个词之间的相似性分数。可以自己定义书写。

3)例如 小白鞋 [0.223,0.334,0.873,0.445,0.456] 小白鞋女 [0.344,0.983,0.983,-0.873,0.124] 余弦相似度为0.68.

参考资料

1)http://blog.csdn.net/mebiuw/article/details/52303622

2)http://blog.csdn.net/szlcw1/article/details/52751314

3)建议一周时间学习掌握。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容