无限池兴趣持续down,目标是整整百池收手。但是火纹和美妙世界暂时又不是很想玩……
上午主要工作是继续微调GloVe的中文实现(其实主要精力在给公众号语料分词),顺便使之可以处理多篇文档。
下午先是开会了解我这个工作的具体需求,比如提取简历标签和公司标签什么的,先从相对比较简单的前者做起吧……之后总算把代码改完并顺利跑起了公众号语料,3000x3000的词汇量半分钟一次循环,感觉有点慢,可能是源代码效率的问题?早知道就用github上直接用cython编译的版本了……
期间还被经理交代了给贵州移动那边写说明文档的任务,说麻烦也不麻烦说简单也不简单,主要是这个文档应该长什么样我都一点印象没了……
晚饭时间程序终于跑出了一个像样的结果。挑了几个词寻找与之最相似的对象,结果还算靠谱,开心。不过在人才简历语料上能不能达到类似的效果就不太好说了(。)希望顺利吧。
下班路上食鸭血粉丝汤当晚饭,回家后一直在FIFA,今天居然一直没输,分数涨了100+。感觉自己就是手风顺时能一直赢,反之则会心态爆炸一直输(。)心理素质不行没药治!
明天抽空写一下贵州移动的需求文档,然后研究一下GloVe中表示两个词的相似程度的度量?