2021-01-22

本周工作:

1、对问题进行分桶,从行业包与通用包二分类,到行业包、通用包、商品包、其他四分类进行演进与调整。

2、抽取问题进行标注,并根据标注结果与标注过程中发现的问题汇总了行业表通用包标注规范,并协调运营标注完成高质量的1000条数据,抽取出额外的2000条数据按照最新的标注规范进行标注,作为黄金测试集。

3、以1000条数据为标的不断的吸取相似的数据扩充数据集,训练模型,并准备在新的2000条数据上验证效果。

4、目前采用1000条有偏数据作为测试集的PRF值如下:

precision recall f1-score support

1 0.78 0.81 0.79 181

2 0.75 0.63 0.68 302

3 0.67 0.78 0.72 206

4 0.76 0.78 0.77 311

accuracy 0.74 1000

macro avg 0.74 0.75 0.74 1000

weighted avg 0.74 0.74 0.74 1000

[[146 10 6 19]

[ 17 190 54 41]

[ 3 27 161 15]

[ 21 27 19 244]]

下周计划:

1、完成行业包商品包通用包其他四分类模型,调优到基本可用。

2、协助商品级问答在线与离线的推进与相关工作。

3、智能客服3.0相关其他工作。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring JDBC 和 事务控制 主要内容 Spring 整合 JDBC 环境 ​ Spring 框架除了提供...
    xyx清风暖阳阅读 255评论 0 0
  • 最初我们用excel就可以做常规的数据存储和分析,但是当excel的数据超过10万条性能就不行了,有的版本的exc...
    祥云的简书阅读 418评论 0 1
  • 久违的晴天,家长会。 家长大会开好到教室时,离放学已经没多少时间了。班主任说已经安排了三个家长分享经验。 放学铃声...
    飘雪儿5阅读 7,599评论 16 22
  • 今天感恩节哎,感谢一直在我身边的亲朋好友。感恩相遇!感恩不离不弃。 中午开了第一次的党会,身份的转变要...
    迷月闪星情阅读 10,625评论 0 11
  • 可爱进取,孤独成精。努力飞翔,天堂翱翔。战争美好,孤独进取。胆大飞翔,成就辉煌。努力进取,遥望,和谐家园。可爱游走...
    赵原野阅读 2,802评论 1 1