2021-01-29

1、商品包匹配模型完成在32w全流量数据的商品级问法的预打标,将阈值卡在0.95,召回的流量大约13%(总数据量为326588条,商品级问法数据召回41349条)。

2、随机抽样1000条样本进行人工检验打标,精度值为58%。

3、对错误进行分析:

1)模型训练集是原来模型预打标的阈值以上的数据加上聚类之后合并的一些问法数据,清洗不彻底。

2)导入ES库中的问法对应的句子数量少(有些只有个位数),知识太少,ES召回损失大

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容