聚类

铁柱在研究一个区域的小黄车使用分布。他得到了服务器上最近10000个用户的二维位置,现在他想把这些用户聚成K(K<10) 组,每组有一个中心C_i。他想评价聚类算法的好坏,把每个数据点到中心的l1距离作为总距离。即
D = sum_j || X_j - C( X_j ) ||_1
其中C(X_j)代表X_j所属的中心。现在他想找一个尽可能好的聚类算法,使得这个总距离尽可能小。要求你输出K个中心的位置(顺序不限)
比如如果有5个数据点
1 1
1 2
1 4
3 4
3 5
给定2个中心1 2, 3 4的话
总距离就是1+0+2+0+1 = 4

输入描述:
本题总是会有10000个数据点
第一个输入为K,表示需要聚类的个数,
之后10000行,为每个点的x和y
例如:
2
2-5001行 每行都是 0 0
5002-10001行 每行都是 2 2

输出描述:
依次输出每个类中心

输入例子1:
2
2-5001行 每行都是 0 0
5002-10001行 每行都是 2 2

输出例子1:
0.00000 0.00000
2.00000 2.00000

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 聚类算法 前面介绍的集中算法都是属于有监督机器学习方法,这章和前面不同,介绍无监督学习算法,也就是聚类算法。在无监...
    飘涯阅读 41,448评论 3 52
  • 注,有疑问 加QQ群..[174225475].. 共同探讨进步有偿求助请 出门左转 door , 合作愉快 1....
    飘舞的鼻涕阅读 3,626评论 0 2
  • 写在之前 因简书导入公式很麻烦,如果想获得更好的观看体验请移步https://www.zybuluo.com/ha...
    hainingwyx阅读 6,889评论 2 13
  • 下午有场专家评审会,关于从东莞松山湖新建一条与深圳公明对接的快速路。资料已经提前发我邮箱了,仔细看了看,觉得确实需...
    福慧倍增阅读 186评论 0 1
  • 脑脑脑脑脑脑脑脑脑脑脑脑脑脑脑脑脑脑脑脑脑脑脑脑子疼
    小黄穿马甲阅读 118评论 0 0