Python 利用SVM,KNN,随机森林进行预测
工具:Pycharm,Win10,Python3.6.4

上图是我们的数据文件,最后一列是附近有无超市的标签,1代表有,-1代表没有。可以发现数据维度比较多,我通关计算相关系数提出相关性低的特征。
data = pd.read_excel('data.xls')
# print(data)
column = data.columns.tolist()[:19]
# print(column)
mcorr = data.corr()
mcorr_data = np.array(mcorr.标签)
# print(mcorr_data)
mask = np.zeros_like(mcorr, dtype=np.bool) # 构造与mcorr同维矩阵 为bool型
mask[np.triu_indices_from(mask)] = True # 角分线右侧为True
# 绘制图像
plt.figure(figsize=(24, 24))
cmap = sns.diverging_palette(220, 10, as_cmap=True) # 返回matplotlib colormap对象
g = sns.heatmap(mcorr, mask=mask, cmap=cmap, square=True, annot=True, fmt='0.2f') # 热力图
plt.show()
#删除相关性小的特征
x = pd.DataFrame(data.drop(['风景名胜', '公共设施', '租赁成本'], axis=1))

本文介绍了使用Python在Win10和Python3.6.4环境下,通过Pycharm进行SVM、KNN和随机森林的预测。数据集中最后一列表示是否有超市,通过计算相关系数去除低相关性特征。实验结果显示,SVM和随机森林的预测效果优于KNN,同时计算并考虑了精确率、召回率和F1分数。
1381

被折叠的 条评论
为什么被折叠?



