实验任务:
请根据表1给出的16个因素对我国31个地区的发展状况进行聚类分析。
- 请用六种类间距离进行系统聚类,并绘制聚类图
- 请对16个因素采用kmeans聚类法分析我国31个地区的发展状况

实验步骤:
1.用六种类间距离进行系统聚类,并绘制聚类图
①读取上方表格的数据
library(openxlsx)
read.xlsx("C:\\Users\\Dell\\Desktop\\多元统计和r语言\\shiyansi.xlsx")
X=read.xlsx("C:\\Users\\Dell\\Desktop\\多元统计和r语言\\shiyansi.xlsx",rowNames=T)
②将因素进行分类
colnames(X)=c("y","x1","x2","x3","x4","x5","x6","x7","x8","x9","x10","x11","x12"
,"x13","x14","x15","x16")
D=dist(X,method="euclidean",p=2)
③最短距离法(采用欧氏距离)
a=hclust(D,method = "complete")
plot(a)

④最长距离法(欧氏距离)
b=hclust(D,method = "complete")
plot(b)

⑤ward(欧氏距离)
c=hclust(D,method="ward.D2")
plot(c)

该文通过R语言对我国31个地区的发展状况进行聚类分析,使用了包括欧氏距离在内的六种类间距离进行系统聚类,并绘制了聚类图。接着,应用KMeans算法,基于标准化数据选择3作为最佳聚类数,分析了不同类别的特征,如第三类城市在某些因素上表现突出。此外,还展示了各组因素的密度分布情况。
920

被折叠的 条评论
为什么被折叠?



