登录注册写文章

sklearn 中 make_blobs模块使用

sklearn 中 make_blobs模块使用

最近在学习K-means算法。如果自己想写一个K-means算法的话，需要造数据集，这个时候，用sklearn中的make_blobs模块就很有用。
官方API说明
输入和输出：

输入和输出

翻译如下：

n_samples是待生成的样本的总数。
n_features是每个样本的特征数。
centers表示类别数。
cluster_std表示每个类别的方差，例如我们希望生成2类数据，其中一类比另一类具有更大的方差，可以将cluster_std设置为[1.0,3.0]。

样例samples:

from sklearn.datasets import make_blobs
from matplotlib import pyplot

data, label = make_blobs(n_samples=100, n_features=2, centers=4)
# 绘制样本显示
pyplot.scatter(data[:, 0], data[:, 1], c=label)
pyplot.show()

结果1

如果要设置方差，可以增加cluster_std参数

from sklearn.datasets import make_blobs
from matplotlib import pyplot

data, label = make_blobs(n_samples=30, n_features=2, centers=3, cluster_std=[0.8, 2.5, 4.5])
# 绘制样本显示
pyplot.scatter(data[:, 0], data[:, 1], c=label)
pyplot.show()

结果2

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

【转】聚类算法——Kmeans算法
一、关于聚类及相似度、距离的知识点二、k-means算法思想与流程三、sklearn中对于kmeans算法的参...
徽hero兔阅读 3,668评论 0赞 12
学习笔记——机器学习（七）
申明一下，只是学习笔记，只是学习笔记，只是学习笔记。 K-近邻算法（又叫knn算法）第一点——用途：1.解决分类...
吉林天师阅读 373评论 0赞 0
K-means聚类
聚类指的是把集合，分组成多个类，每个类中的对象都是彼此相似的。K-means是聚类中最常用的方法之一，它是基于点与...
词不达意_张阅读 443评论 0赞 0
跟我一起学scikit-learn15：K-近邻算法
KNN（K-Nearest Neighbor，K-近邻算法）算法是一种有监督的机器学习算法，可以解决分类问题，也可...
金字塔下的小蜗牛阅读 1,627评论 0赞 4
8种顶级Python机器学习算法-你必须学习
今天，我们将更深入地学习和实现8个顶级Python机器学习算法。让我们开始Python编程中的机器学习算法之旅。...
栀子花_ef39阅读 8,447评论 0赞 62

1赞2赞

赞赏

手机看全文