2021-02-02

1、完成采用3C训练集商品级问法的模型训练与知识库更新。

2、基于商品类目属性数据(来自勇哥)进行聚类划分品类,具体实施与数据如下:

1)总共的cid数为395条,属性特征数为1062个(特征非常稀疏,有些特征只有一两个cid才有)

2)对以上395条数据进行kmeans聚类,K值备选集合如下:

Ks = [50, 60, 70, 80, 90, 100, 120, 150, 160, 170, 180]

最终在70个类上Calinski-Harabasz系数最大,聚类效果较好。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  •  评估聚类算法的性能并不像计算错误数量或监督分类算法的精度和召回率那么简单。特别是任何评价指标不应考虑集群的绝对值...
    zsdy阅读 10,732评论 0 0
  • 聚类:在数据中识别相似行的技术。常见聚类技术:k-means, DBSCAN, OPTICS k-means 是一...
    wonphen阅读 1,587评论 0 10
  • 夜莺2517阅读 127,770评论 1 9
  • 版本:ios 1.2.1 亮点: 1.app角标可以实时更新天气温度或选择空气质量,建议处女座就不要选了,不然老想...
    我就是沉沉阅读 6,989评论 1 6
  • 我是一名过去式的高三狗,很可悲,在这三年里我没有恋爱,看着同龄的小伙伴们一对儿一对儿的,我的心不好受。怎么说呢,高...
    小娘纸阅读 3,438评论 4 7