11、数值预测：回归入门

最新推荐文章于 2026-06-13 11:26:11 发布

原创最新推荐文章于 2026-06-13 11:26:11 发布 · 51 阅读

0 GEO检测

标签

#数值预测 # 回归入门 # 最近邻回归

收录于

Python机器学习实战指南专栏收录该内容

47 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

数值预测：回归入门

在机器学习中，预测数值是一项重要任务，本文将介绍最近邻回归和线性回归这两种方法，以及相关的统计指标。

1. 最近邻回归与统计指标

1.1 最近邻回归步骤

之前讨论过最近邻分类，其步骤如下：
1. 描述示例对之间的相似度。
2. 选择几个最相似的示例。
3. 将选择的示例组合成一个答案。

当从预测类别转向预测数值时，步骤1和2保持不变，但步骤3需要调整。不能简单地对候选答案进行投票，而是要将数值组合成一个具有代表性的答案。这就需要用到统计指标，下面介绍中位数和均值这两种常用的统计指标。

1.2 中位数

中位数是一组按顺序排列的数字中的中间数。例如，对于有序数组 [1, 8, 10] ，中位数是8，因为它上面和下面各有一个数字。如果数字个数为偶数，如 [1, 2, 3, 4] ，通常取中间两个数（2和3）的平均值，得到中位数2.5。

中位数具有鲁棒性，即当对排序数据的开头或结尾的数值进行调整时，中位数保持不变。例如，将 [1, 8, 10] 记录为 [2, 8, 11] ，中位数仍然是8。

以下是计算中位数的示例代码：

import numpy as np

values = np.array([1, 8, 10])
print(np.median(values))  

values_with_fuzzy_tails = np.

订阅专栏解锁全文

会员秒杀 ¥9.9 重磅福利

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

sat99

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

大数据线性回归预测学生成绩

qq_41108186的博客

12-21

2万+

title: 大数据线性回归预测学生成绩 date: 2019/12/21 18:29 tags: 算法大数据 id: lr-student 通过训练集训练和测试集测试来生成多个线性模型，从而预测学生成绩，本文所有代码请点击Github 1. 实验数据背景 1.1 数据来源本项目的数据来源于kaggle.com，数据集的名称为Student Grade Prediction，Paul...

Python数据分析与挖掘——线性回归预测模型

热门推荐

Fo*(Bi)的博客

02-27

4万+

线性回归模型属于经典的统计学模型，该模型的应用场景是根据已知的变量（自变量）来预测某个连续的数值变量（因变量）。例如，餐厅根据每天的营业数据（包括菜谱价格、就餐人数、预定人数、特价菜折扣等）预测就餐规模或营业额；网站根据访问的历史数据（包括新用户的注册量、老用户的活跃度、网页内容的更新频率等）预测用户的支付转化率；医院根据患者的病历数据（如体检指标、药物服用情况、平时的饮食习惯等）预测某种疾病发生的概率。站在数据挖掘的角度看待线性回归模型，它属于一种有监督的学习算法，即在建模过程中必须同时具

参与评论您还未登录，请先登录后发表或查看评论

线性回归、Lasso回归、岭回归预测北京PM2.5浓度

初一的博客

12-26

6429

一、项目背景北京PM2.5浓度回归分析训练赛 1.数据数据主要包括2010年1月1日至2014年12月31日间北京pm2.5指数以及相关天气指数数据。数据分为训练数据和测试数据，分别保存在pm25_train.csv和pm25_test.csv两个文件中。其中训练数据主要包括35746条记录，13个字段，主要字段说明如下： date：观测数据发生的日期（年-月-日） hour：观...

机器学习实战——第八章（回归）：回归——预测数值型数据

摆正心态

07-30

7361

前言接着上一篇继续学习。首先感谢博主：Jack-Cui 主页：http://blog.csdn.net/c406495762 回归博文地址：https://blog.csdn.net/c406495762/article/details/78760239 https://blog.csdn.net/c406495762/article/details/82967529 这篇博文对书上的内容很形象的进行了表达，通俗易懂，用自己的实例来进行讲解，比书上讲的清楚太多，于是我才开始了学习，感激不尽，真心推荐。

机器学习：逻辑回归实现癌症预测

梓栋DREM

06-27

4638

1. 数据集介绍数据描述（1）699 条样本，共 11 列数据，第一列用语检索的 id，后 9 列分别是与肿瘤相关的医学特征，最后一列表示肿瘤类型的数值。（2）包含 16 个缺失值，用”?”标出。该案例的数据我会上传到CSDN，请自行搜索下载 2. 案例分析：缺失值处理 # 将？转化为np.nan data.replace("?",np.nan,inplace=True) # ...

汽车价格的回归预测项目

极光喵的博客

03-20

1803

汽车ID，符号，汽车名称，燃油类型，吸气，门号，车身，驱动轮，发动机位置，轴距，车长，车宽，车高，整备质量，发动机类型，气缸数，发动机尺寸，燃油系统，硼比，冲程，压缩比，马力，峰值转速，城市英里数，高速公路英里数。此项目的主要目标是开发一个预测模型，该模型能够根据汽车的各种特征准确预测其市场价值。这个模型应能处理不同类型的数据，包括数值数据和类别数据，并在预测准确度和计算效率之间取得平衡。2.马力、城市英里数、高速公路英里数和价格（基本上是与车辆功率相关的所有属性）本项目依赖的科学计算库。

python多项式回归预测（基于淘宝双十一数据）

kewill的博客

11-13

5308

双11已经结束，按照天猫官方公布的最终数据看，今年的双11成交额为2684亿元，成功刷新了自己创下的商业纪录。然而，早在2019年4月就有网友指出，从天猫双十一的全天销售额来看，实际生产数据几乎完美地分布在三次回归曲线上，拟合度均超过99.94%，几乎为1，而且生产数据有10年之久，每一年的数据都这么高度拟合，数据过于完美。与此同时，这名网友还预测，“2019年淘宝双11当天的销售额为2675.3...

机器学习之逻辑回归（三）：基于逻辑回归的癌症预测案例——【癌症分类预测-良／恶性乳腺癌肿瘤预测】

汪雯琦的博客

02-27

1万+

逻辑回归需要掌握的知识点知道逻辑回归的损失函数知道逻辑回归的优化方法知道sigmoid函数知道逻辑回归的应用场景应用LogisticRegression实现逻辑回归预测知道精确率、召回率指标的区别知道如何解决样本不均衡情况下的评估了解ROC曲线的意义说明AUC指标大小应用classification_report实现精确率、召回率计算应用roc_auc_score实现指标计...

11 逻辑回归：如何预测用户是否会购买商品？

Maggie8888888888的博客

03-28

864

逻辑回归算法是机器学习领域中经典的分类算法，作为产品经理，我们要掌握它的核心原理、应用场景以及优缺点。逻辑回归的核心原理就是在线性回归模型基础上，把原有预测的连续值转化成一个事件的概率，用来解决分类问题。在实际应用中，逻辑回归也可以在线性回归的基础上做进一步预测。比如说，线性回归可以用来预测身高、销售额、房价、库存是多少，逻辑回归就可以预测身高是高了还是矮了，预测销售额提升了还是降低了，预测房价涨了还是跌了，预测库存够用还是不够用等等。

机器学习：回归预测连续与离散的深度剖析----看完完全理解了回归是什么东西了！

qq_35050438的博客

03-01

6705

回归的预测完整过程前提： 1.线性回归与非线性回归概念要解释线性回归和非线性回归首先我们要理解这两个词 (1):什么是回归(regression)？由于是外国人命名的，我们找其根源只能从英文单词开始入手，regression的词根有重复的意思统计学家在很久以前对于一些混乱的，看似无规律的，复杂的家族之间身高的数据中，不断统计提取，发现了一些规律，父亲身高高的，孩子的身高趋于下降，父亲身高矮...

基于逻辑回归的森林火灾发生预测报告

weixin_54707168的博客

08-20

2109

本课程设计旨在利用机器学习算法，特别是逻辑回归算法，对森林火灾的发生进行预测。通过分析森林火灾的历史数据和环境特征，构建预测模型，以帮助预防火灾、及早采取灭火措施。本设计使用某森林管理机构的森林火灾数据集进行模型构建和评估，结果表明逻辑回归算法在森林火灾发生预测方面具有较高的准确性和预测能力。关键词：机器学习，逻辑回归，森林火灾发生预测。

回归树模型：零基础可懂的数值预测入门技术

赵士杰的博客

06-13

432

回归树是一种面向连续型目标变量（如房价、销量、温度）的机器学习基础模型，其核心原理是通过递归二分数据，使每个子集内部数值尽可能接近，从而用均值实现可解释预测。它不依赖复杂数学假设，天然支持特征重要性分析与决策路径可视化，技术价值在于‘高透明度+强业务对齐+低上手门槛’。广泛应用于销售预测、设备运维、房产估价等需向非技术人员说明逻辑的场景。本文以北京二手房真实数据为例，完整呈现从数据清洗、分段编码、树结构训练到误差诊断的全流程，重点突出Regression Tree Model在实际落地中的可调试性与人话级解

R语言学习_回归预测

weixin_42030577的博客

04-04

1万+

逻辑回归介绍（案例：癌症分类预测）

干炒牛河的博客

12-15

1936

广告点击率是否为垃圾邮件是否患病金融诈骗虚假账号逻辑回归就是解决二分类问题的利器。

基于MATLAB的岭回归的数据回归预测方法应用

张陈亚的博客

07-14

1065

摘要：本项目基于MATLAB平台实现岭回归的数据回归预测方法，针对多重共线性数据问题。数据集包含10个特征变量和1个因变量，共2000条完整数据。通过数据预处理、特征工程和80/20数据集划分，构建岭回归模型。结果显示模型效果优异（R方=1.0，均方误差=0.002），真实值与预测值高度吻合，证明该模型适用于实际预测场景。项目完整包含数据、代码和文档，可供参考使用。

机器学习入门（线性回归）---波士顿房价预测

m0_68231845的博客

03-16

6416

(Machine Learning, ML)是一种通过算法让计算机从数据中学习规律、预测未来的方法。是人工智能的一个重要分支，是实现人工智能的基础之一。线性回归模型是一种常用的有监督机器学习算法，它可以用来预测连续的数值型数据。今天，我们将使用波士顿房价数据集来介绍线性回归模型的应用。在这个项目中，我们将利用马萨诸塞州波士顿郊区的房屋信息数据训练和测试一个模型，并对模型的性能和预测能力进行评估。通过该数据训练后的好的模型可以被用来对房屋做特定预测--尤其是对房屋的价值。

线性回归与逻辑回归

会思考的蜗牛

06-06

2万+

回归算法是一种通过最小化预测值与实际结果值之间的差距，而得到输入特征之间的最佳组合方式的一类算法。对于连续值预测有线性回归等，而对于离散值/类别预测，我们也可以把逻辑回归等也视作回归算法的一种。　　线性回归与逻辑回归是机器学习中比较基础又很常用的内容。线性回归主要用来解决连续值预测的问题，逻辑回归用来解决分类的问题。

【机器学习】（八）线性回归与多元回归：预测的数学基础

2501_92688825的博客

07-09

1681

引言：从线性到多元回归分析是机器学习中一种非常基础且广泛应用的技术，它帮助我们通过数据预测未来的趋势，揭示变量之间的关系。在回归任务中，线性回归和多元回归是最常见的两种模型，它们通过找到自变量与因变量之间的关系来进行预测。

python logistic参数_用logistic回归预测参数值

weixin_39522927的博客

12-10

520

我已经编写了vary基本sklearn代码使用逻辑回归来预测值。在训练数据看起来像-date hr_of_day vals01/05/2014 9 92901/05/2014 10 94201/05/2014 11 96801/05/2014 12 85601/05/2014 13 83501/05/2014 14 88501/05/2014 15 9450...

slick editor