上午拿到了简历语料,json格式稍微有点混乱(主要是不同网站的都有),于是慢慢研究pattern并提取出可用的文本部分。
忙了一天大概挑出来50万条工作经历相关的文字,词汇量应该是充分了,只是不知道训练出来的效果如何,相似度度量又是否可以直接用于匹配简历……不是很放心。
晚上部门在楼下的饭店聚餐,不想喝酒不过最后还是喝了两罐,全程也没什么话,只是觉得困(靠
散伙后回公司看了下文本处理的进度,直接让模型开始跑,希望明天去看的时候不要跑崩掉也不要跑太慢(。)然后回家。
回家后头有点疼就直接补觉了,1点30起床看球,然后继续回去睡觉。
如果明天早上看到模型跑出能看的结果就买游戏犒赏自己!