机器学习中的random_state参数

原因:为什么需要用到这样一个参数random_state(随机状态)?

在此先简单罗列三种情况:

1、在构建模型时:

forest = RandomForestClassifier(n_estimators=100, random_state=0)

forest.fit(X_train, y_train)

2、在生成数据集时:

X, y = make_moons(n_samples=100, noise=0.25, random_state=3)

3、在拆分数据集为训练集、测试集时:

X_train, X_test, y_train, y_test = train_test_split(

cancer.data, cancer.target, stratify=cancer.target, random_state=42)

如果不设置random_state的话会怎样?

例如1中,每次构建的模型是不同的。

例如2中,每次生成的数据集是不同的。

例如3中,每次拆分出的训练集、测试集是不同的。

之所以会这样,是因为模型的构建、数据集的生成、数据集的拆分都是一个随机的过程。

作用:控制随机状态。

random_state 它按一定的规则去取出我们的数据

原文链接:https://blog.csdn.net/ytomc/article/details/113437926

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容