🌳 一、决策树回归是什么?
决策树回归(Regression Tree)和分类树的区别在于:
- 目标不同:分类树预测离散类别(如猫/狗),回归树预测连续值(如房价、温度)
- 分裂标准:回归树常使用**均方误差(MSE)**作为分裂依据,追求组内数据差异最小化
优点速览:
✅ 可视化强,解释性高
✅ 无需特征标准化
✅ 自动处理缺失值(MATLAB内置功能)
🔧 二、MATLAB实战四步走
1. 数据准备:生成示例数据
我们以“房屋面积预测房价”为例:
% 生成100组样本数据,面积50-200平米,加入随机噪声
rng(1); % 固定随机种子便于复现
area = randi([50 200], 100, 1);
price = 50*area + 2000 + 3000*randn(100,1);
% 拆分训练集(70%)和测试集(30%)
cv = cvpartition(length(area), 'HoldOut', 0.3);
X_train = area(training(cv), :);
y_train = price(training(cv), :);
X_test = area(test(cv), :);
y_test = price(test(cv), :);
2. 训练模型:fitrtree函数
model = fitrtree(X_train, y_train, 'MinLeafSize', 5);
- 关键参数解释:
MinLeafSize:叶节点最小样本数,控制模型复杂度(值越小树越深)
3. 可视化树结构:一目了然!
view(model, 'Mode', 'graph'); % 生成图形化决策树
运行后会弹出树形图,清晰看到每个节点的分裂条件和预测值!
4. 预测与评估:三大指标
y_pred = predict(model, X_test);
% 计算评估指标
mse = mean((y_pred - y_test).^2);
rmse = sqrt(mse);
R2 = 1 - sum((y_test - y_pred).^2)/sum((y_test - mean(y_test)).^2);
disp(['MSE: ', num2str(mse)]);
disp(['RMSE: ', num2str(rmse)]);
disp(['R²: ', num2str(R2)]);
特征重要性分析
当有多个特征时,快速找出关键变量:
imp = predictorImportance(model);
bar(imp);
xlabel('特征');
ylabel('重要性得分');
💻 代码已打包:获取完整版代码和实战数据集 → 点击【利用matlab实现决策树回归】
👍 如果觉得有用,记得三连哦! 我们下期再见~





1710

被折叠的 条评论
为什么被折叠?



