2021-02-05

1、完成80w+的3C数码数据预打标与统计分析,对数据去重去链接之后发现老模型的覆盖率约为29%,新模型的覆盖率约为32%,都是偏低。

2、抽取真实流量50w(保留链接等),进行新老模型+正则的打标处理,等待结果出来后统计cover。

3、品类包中属性聚类:去头去尾后删选出了88个属性,但是发现不同类目间共有的属性完全没有规律,人工都没有办法将相似的聚类到一起更何况聚类算法,感觉此路不太通。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 人教版八年级物理上册重点知识点 第一章机械运动 常考点 1.机械运动:一个物体相对另一个物体位置改变(关键抓住五个...
    双胞胎他妈阅读 848评论 0 4
  • 保卫黄河,人人有责 《汉书》中说:“中国川源以百数,莫著于四渎,而河为宗。”自古以来,黄河被中...
    ccb573688638阅读 251评论 0 0
  • 总目录:地址如下看总纲 https://www.jianshu.com/p/929ca9e209e8[https:...
    鄙人_阿K阅读 798评论 1 2
  • 推荐指数: 6.0 书籍主旨关键词:特权、焦点、注意力、语言联想、情景联想 观点: 1.统计学现在叫数据分析,社会...
    Jenaral阅读 5,757评论 0 5
  • 城空了,有树长出来 我的城死了 铸起它的人,杀死它的人 不愿因为这件事而骄傲 一座城的终结 永远因为终结这件事而显...
    于十六阅读 2,895评论 6 17