python数据样本不平衡处理

# 将数据拆分为训练集和测试集

X_train,X_test,y_train,y_test = model_selection.train_test_split(X,y,test_size = 0.3, random_state = 1234)

# 导入第三方包

from imblearn.over_sampling import SMOTE

# 运用SMOTE算法实现训练数据集的平衡

over_samples = SMOTE(random_state=0)

over_samples_X,over_samples_y = over_samples.fit_sample(X_train, y_train)

#over_samples_X, over_samples_y = over_samples.fit_sample(X_train.values,y_train.values.ravel())

# 重抽样前的类别比例

print(y_train.value_counts()/len(y_train))

# 重抽样后的类别比例

print(pd.Series(over_samples_y).value_counts()/len(over_samples_y))

Machine Learning in Python (Scikit-learn)转人人
Machine Learning in Python (Scikit-learn)-(No.1) 作者:范淼（人人...
hzyido阅读 11,401评论 2赞 13
物联网
一句话理解物联网：把所有物品通过信息传感设备与互联网连接起来，进行信息交换，即物物相息，以实现智能化识别和管理。 ...
61a75161e4aa阅读 3,511评论 0赞 0

简年3: 20171022 参加华德福教育公益活动的感触
上周带孩子参加了一次禾心源组织的华德福教育的公益活动，在上海浦东的下沙学校，作为第一次参加华德福活动的义工爸爸，深...
Thinkpolo阅读 4,266评论 0赞 1
儿子做梦，母亲老说口渴打开柜子一看，明白了！
01 村头的山边又新添了一座坟。男子跪在坟边哭泣，他说：“妈啊妈，你怎么就离我而去了，我还没来得及孝敬你啊！妈啊...
晴儿11阅读 5,231评论 4赞 21

赞1赞

赞赏

手机看全文