网格搜索参数优化（以 diabetes 数据集为例）

最新推荐文章于 2025-08-20 20:33:51 发布

原创

最新推荐文章于 2025-08-20 20:33:51 发布 · 1.3k 阅读

收录于

当前文章被以下社区和专栏收录：

文章通过导入糖尿病数据集，使用XGBoost构建回归模型，并通过R^2评估模型拟合效果。接着，利用网格搜索进行参数优化，提高模型的拟合优度，最终达到提升模型预测能力的目的。

网格搜索参数优化（以 diabetes 数据集为例）

在机器学习过程中通常情况不能一次就得到最优的模型，往往需要多次调整模型的参数才能得到较好的结果。

1、导入数据，查看数据

import pandas as pd
from sklearn import datasets
# 导入数据
diabetes = datasets.load_diabetes()
X = diabetes.data
y = diabetes.target
feature_names = diabetes.feature_names
# 这个函数可以查看 sklearn 中数据集的详细信息
print(diabetes.DESCR)

把数据做成最初的表格形式，查看数据长啥样

df = pd.DataFrame(X,columns=feature_names)
df['measure'] = y
df.head()

在这里插入图片描述
查看数据基本信息

df.info()

在这里插入图片描述
查看数据的描述性统计量，因为 $se x$ 是性别，所以只有两个情况，这里是按浮点数类型处理，所以不放入查看。

df.describe()

在这里插入图片描述

2、划分训练集和测试集

from sklearn.model_selection

标签

#python #sklearn #机器学习

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

梦什

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

【超参数研究01】使用网格搜索优化超参数

gongdiwudu的专栏

10-24

4113

在神经网络训练中，超参数也是需要优化的，然而在超参数较多（大于3个）后，如果用穷举的，或是通过经验约摸实现就显得费时费力，无论如何，这是需要研究、规范、整合的要点，本文对超参的网格化搜索展开研究。

【数据＋代码】多分类——网格搜索优化超参数

weixin_46287760的博客

06-27

2303

本文涵盖主题：变量分析、数据分析、数据准备与特征工程、KNN-随机森林-SVM三种算法默认参数与网格搜索优化超参数6种方法进行对分类、总结六个部分。

参与评论您还未登录，请先登录后发表或查看评论

XGBoost模型调参：GridSearchCV方法网格搜索优化参数

qq_44949041的博客

12-31

1万+

GridSearchCV是XGBoost模型最常用的调参方法。本文主要介绍了如何使用GridSearchCV寻找XGBoost的最优参数，有完整的代码和数据文件。文中详细介绍了GridSearchCV的工作原理，param_grid等常用参数；常见的learning_rate和max_depth等可调参数及调参顺序；最后总结了GridSearchCV的缺点及对应的解决方法。

超参数优化 - 随机网格搜索

talle2021的博客

07-21

4100

决定枚举网格搜索运算速度的因子一共有两个：①参数空间的大小（参数空间越大，需要建模的次数越多）；②数据量的大小（数据量越大，每次建模时需要的算力和时间越多）。sklearn中的网格搜索优化方法主要包括两类，其一是调整搜索空间，其二是调整每次训练的数据。对网格搜索而言，如果参数空间中的某一个点指向了损失函数真正的最小值，那枚举网格搜索时一定能够捕捉到该最小值以及对应的参数（相对的，假如参数空间中没有任意一点指向损失函数真正的最小值，那网格搜索就一定无法找到最小值对应的参数组合）。

超参数优化方法之网格优化

LUyan10086的博客

07-04

4270

超参数优化是机器学习中提升模型性能的关键步骤。在众多优化方法中，网格搜索（Grid Search）以其直观和系统性的特点脱颖而出。作为一种穷举搜索策略，网格搜索通过遍历给定参数网格中的所有可能组合，寻找最优的超参数设置。在所有超参数优化的算法当中，枚举网格搜索是最为基础和经典的方法。在搜索开始之前，需要人工将每个超参数的备选值一一列出，多个不同超参数的不同取值之间排列组合，最终将组成一个参数空间（parameter space）。枚举网格搜索算法会将这个参数空间当中所有的参数组合带入模型进行训练，最终选出泛

lr使用grid_search来调参

u010569893的博客

12-25

1415

目的：使用sklearn的网格搜索grid_search来计算最好的LR模型参数，这样省去了人工调试参数的工作，而且算法会帮你计算出最好的模型参数。另外，xgboost的网格搜索代码请参考：https://blog.csdn.net/u010569893/article/details/91887394 代码 import numpy as np from numpy import loadtx...

PimaIndiansdiabetes-数据预处理实验（一）

weixin_30241919的博客

05-13

1415

有趣的事，Python永远不会缺席！如需转发，请注明出处：小婷儿的pythonhttps://www.cnblogs.com/xxtalhr/p/10859517.html 链接：https://pan.baidu.com/s/1PyP_r8BMnLLE-2fkKEPqKA 提取码：vztm 一、PimaIndiansdiabet...

scikit-learn Tutorials （3）

hzx2012的博客

02-22

509

Model selection: choosing estimators and their parameters

Python的数据分析中超参数调优方法：网格搜索

liujingwei8610的专栏

03-09

1万+

【小白从小学Python、C、Java】【Python全国计算机等级考试】【Python数据分析考试必会题】 ● 标题与摘要 Python的数据分析中超参数调优方法：网格搜索 ● 选择题以下说法错误的是： A 网格搜索是一种调参方法 B 网格搜索会遍历几乎所有参数组合 C 网格搜索的最大优点就是搜索速度快 D 网格搜索在面对大数据集时会非常耗时 ● 问题解析 1.网格搜索（Grid Search）是一种调参方法，也称为穷举搜索，搜索的是参数，在所有候选的参数选择中，

超参数优化--随机网格法

weixin_44820355的博客

07-25

1898

在网格搜索时我们提到，伴随着数据和模型的复杂度提升，网格搜索所需要的时间急剧增加。以随机森林算法为例，如果使用过万的数据，搜索时间则会立刻上升好几个小时。因此，我们急需寻找到一种更加高效的超参数搜索方法。因此，sklearn中的网格搜索优化方法主要包括两类，其一是调整搜索空间，其二是调整每次训练的数据。其中，调整参数空间的具体方法，是放弃原本的搜索中必须使用的全域超参数空间，改为挑选出部分参数组合，构造超参数子空间，并只在子空间中进行搜索。...

Dataset之diabetes：diabetes数据集的简介、下载、使用方法(比较八种机器学习算法实现二分类预测)之详细攻略

头部AI社区如有邀博主AI主题演讲请私信—心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，专注，谦虚，自律，反思，成长，还算比较正能量的博主，公益免费传播…内心特别想在AI界做出一些可以推进历史进程影响力的技术(兴趣使然，有点小情怀，也有点使命感呀

06-19

2万+

Dataset之diabetes：diabetes数据集的简介、下载、使用方法(比较八种机器学习算法实现二分类预测)之详细攻略目录 diabetes数据集的简介 diabetes数据集的下载 diabetes数据集的使用方法 diabetes数据集的简介糖尿病数据集由768个数据点组成，各有9个特征。输出表格的列表字段；9个特征（怀孕次数，血糖，血压，皮脂厚度，胰岛素，BMI身体质量指数，糖尿病遗传函数，年龄，结果）。在768个数

SVM参数优化：网格搜索法实战指南

weixin_28235889的博客

06-04

1652

支持向量机（SVM）是一种有效的分类器，其基本原理是寻找数据间的最优超平面来实现类别划分。在数学上，SVM通过最大化分类间隔来构建决策边界，即找到一个超平面，使得最近的异类样本点到该平面的距离（即间隔）最大化。这一过程可以通过解决一个凸优化问题来实现，确保找到的解是全局最优的。最大化间隔是SVM的核心，因为它直接关联到模型的泛化能力。在进行网格搜索之前，需要定义参数空间，这一步是模型优化的基础。参数空间是由一系列待优化的参数构成的多维空间，每个维度对应模型的一个超参数。

python输出偶数_python程序使用递归查找数字是偶数还是奇数

weixin_39682697的博客

11-26

732

所以我想通过使用递归函数找到偶数,该函数重复从数字中减去2以找到它是否为偶数.到目前为止,我所拥有的功能是def isEven(number):if number!=0:return(n-2)while number =>> isEven(3)False>>> isEven(2)True您的函数不会调用自身,因此不使用递归. while循环将用于非递归函数,因为循环将重复从数字中减去2.上面给出的...

【无标题】天池机器学习task2

SY594230的博客

03-31

934

GridSearchCV，它存在的意义就是自动调参，只要把参数输进去，就能给出最优化的结果和参数。但是这个方法适合于小数据集，一旦数据的量级上去了，很难得出结果。这个时候就是需要动脑筋了。数据量比较大的时候可以使用一个快速调优的方法——坐标下降。它其实是一种贪心算法：拿当前对模型影响最大的参数调优，直到最优化；再拿下一个影响最大的参数调优，如此下去，直到所有的参数调整完毕。这个方法的缺点就是可能会调到局部最优而不是全局最优，但是省时间省力，巨大的优势面前，还是试一试吧，后续可以再拿bagging再优化。

超参数优化（网格搜索和贝叶斯优化）