机器学习中的random_state参数

原因：为什么需要用到这样一个参数random_state（随机状态）？

在此先简单罗列三种情况：

1、在构建模型时：

forest = RandomForestClassifier(n_estimators=100, random_state=0)

forest.fit(X_train, y_train)

2、在生成数据集时：

X, y = make_moons(n_samples=100, noise=0.25, random_state=3)

3、在拆分数据集为训练集、测试集时：

X_train, X_test, y_train, y_test = train_test_split(

cancer.data, cancer.target, stratify=cancer.target, random_state=42)

如果不设置random_state的话会怎样？

例如1中，每次构建的模型是不同的。

例如2中，每次生成的数据集是不同的。

例如3中，每次拆分出的训练集、测试集是不同的。

之所以会这样，是因为模型的构建、数据集的生成、数据集的拆分都是一个随机的过程。

作用：控制随机状态。

random_state 它按一定的规则去取出我们的数据

原文链接：https://blog.csdn.net/ytomc/article/details/113437926

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

赞1赞

赞赏

手机看全文