Python 利用SVM,KNN,随机森林进行预测

最新推荐文章于 2026-02-20 11:31:53 发布

原创

最新推荐文章于 2026-02-20 11:31:53 发布 · 1.6w 阅读

176

收录于

当前文章被以下社区和专栏收录：

本文介绍了使用Python在Win10和Python3.6.4环境下，通过Pycharm进行SVM、KNN和随机森林的预测。数据集中最后一列表示是否有超市，通过计算相关系数去除低相关性特征。实验结果显示，SVM和随机森林的预测效果优于KNN，同时计算并考虑了精确率、召回率和F1分数。

Python 利用SVM,KNN,随机森林进行预测

工具：Pycharm，Win10，Python3.6.4

上图是我们的数据文件，最后一列是附近有无超市的标签，1代表有，-1代表没有。可以发现数据维度比较多，我通关计算相关系数提出相关性低的特征。

data = pd.read_excel('data.xls')
# print(data)
column = data.columns.tolist()[:19]
# print(column)
mcorr = data.corr()
mcorr_data = np.array(mcorr.标签)
# print(mcorr_data)
mask = np.zeros_like(mcorr, dtype=np.bool)  # 构造与mcorr同维矩阵 为bool型
mask[np.triu_indices_from(mask)] = True  # 角分线右侧为True
# 绘制图像
plt.figure(figsize=(24, 24))
cmap = sns.diverging_palette(220, 10, as_cmap=True)  # 返回matplotlib colormap对象
g = sns.heatmap(mcorr, mask=mask, cmap=cmap, square=True, annot=True, fmt='0.2f')  # 热力图
plt.show()

#删除相关性小的特征
x = pd.DataFrame(data.drop(['风景名胜', '公共设施', '租赁成本'], axis=1))

标签