【机器学习】scikit-learn机器学习中随机数种子的应用与重现

本文主要是介绍【机器学习】scikit-learn机器学习中随机数种子的应用与重现，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

随机数种子是为了能重现某一次实验生成的随机数而设立的，相同的随机数种子下，生成的随机数序列一样
一、随机数种子基础应用
在python中简单运用随机数种子

import random
random.seed(1)
a = random.sample(range(0,100),10)
random.seed(2)
b = random.sample(range(0,100),10)

结果如下

a
Out[3]: [17, 72, 97, 8, 32, 15, 63, 57, 60, 83]
b
Out[4]: [7, 11, 10, 46, 21, 94, 85, 39, 32, 77]
random.seed(1)//加载随机数种子
random.sample(range(0,100),10)
Out[6]: [17, 72, 97, 8, 32, 15, 63, 57, 60, 83]

可以看到out[6]之前加载了随机数种子1之后可以重现第一次随机数的生成结果

二、随机数种子在scikit-learn中的应用(以鸢尾花为例)
注：以下代码需要在你的环境中先行安装scikit-learn工具包
具体方法可以参考https://blog.csdn.net/quicmous/article/details/106824638

首先scikit-learn中鸢尾花的数据集需要我们进行拆分，将其拆分为训练集和测试集。在这里需要将原数据进行随机拆分：

from sklearn import datasets
X=iris.data[:,[2,3]]
y=iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1)

X,y分别为原数据与标签，0.3指的是把X和y随机分为30%的测试数据和70%的训练数据
这里的随机数种子参数为random_state
在未来想要重新获取X_train, X_test, y_train, y_test的时候可以再次调用以下语句

train_test_split(X, y, test_size=0.3, random_state=1)

例子：

X_train1, X_test1, y_train1, y_test1 = train_test_split(X, y, test_size=0.3, random_state=1)

检验新生成的数据和同样的随机数种子下生成的数据是否一样，可以自行运行程序发现是一样的
如果将random_state设置成1以外的数

X_train2, X_test2, y_train2, y_test2 = train_test_split(X, y, test_size=0.3, random_state=2)

会发现结果不一样了

这篇关于【机器学习】scikit-learn机器学习中随机数种子的应用与重现的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

【机器学习】scikit-learn机器学习中随机数种子的应用与重现

相关文章

利用Python操作Word文档页码的实际应用

Java中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例解析

Java 缓存框架 Caffeine 应用场景解析

使用Node.js和PostgreSQL构建数据库应用

PHP应用中处理限流和API节流的最佳实践

深入浅出Spring中的@Autowired自动注入的工作原理及实践应用

PostgreSQL简介及实战应用

Unity新手入门学习殿堂级知识详细讲解（图文）

Python中的filter() 函数的工作原理及应用技巧

Python中yield的用法和实际应用示例