第147页 7.3 相关
- 章节名:7.3 相关
- 页码:第147页
这章读的想报复社会了都~一点统计学的课都没上课~简直是硬啃这个东西~一句话~给丫死磕!
> states <- state.x77[,1:6] > cor(states) Population Income Illiteracy Life Exp Murder HS Grad Population 1.0000 0.208 0.108 -0.0681 0.344 -0.0985 Income 0.2082 1.000 -0.437 0.3403 -0.230 0.6199 Illiteracy 0.1076 -0.437 1.000 -0.5885 0.703 -0.6572 Life Exp -0.0681 0.340 -0.588 1.0000 -0.781 0.5822 Murder 0.3436 -0.230 0.703 -0.7808 1.000 -0.4880 HS Grad -0.0985 0.620 -0.657 0.5822 -0.488 1.0000 引自 7.3 相关 cor函数可以计算三种相关系数 通过参数Method来指定。 以下三种 Person积差相关系数 Spearman等级相关系数 还有kendall 一种非参数的等级相关度量。 关于Person函数 相关系数用r表示,它的基本公式为:著名统计学家卡尔·皮尔逊设计了统计指标——相关系数。依据相关现象之间的不同特征,其统计指标的名称有所不同。 相关系数的值介于–1与+1之间,即–1≤r≤+1。其性质如下: * 当r>0时,表示两变量正相关,r<0时,两变量为负相关。 * 当|r|=1时,表示两变量为完全线性相关,即为函数关系。 * 当r=0时,表示两变量间无线性相关关系。 * 当0<|r|<1时,表示两变量存在一定程度的线性相关。且|r|越接近1,两变量间线性关系越密切;|r|越接近于0,表示两变量的线性相关越弱。 * 一般可按三级划分:|r|<0.4为低度线性相关;0.4≤|r|<0.7为显著性相关;0.7≤|r|<1为高度线性相关。 所以从这个测试数据集里可以看出书中所提到的 收入和高中毕业率的关系Income & HS Grad存在很强的正关系(0.6199) 还有预期寿命Life Exp和文盲率Illiteracy存在很强的负相关(-0.588) 。 正相关 无: 0 to 0.09 弱:0.1 to -0.3 中:0.3 to 0.5 强:0.5 to 1.0 负相关 无: -0.09 to 0.0 弱:-0.3 to -0.1 中:-0.5 to -0.3 强:-1.0 to -0.5 #-----------------------------------DIY 计算非方形的相关矩阵-----------------------------# > x <- states[,c("Population","Income","Illiteracy","HS Grad")] > y <- states[,c("Life Exp","Murder")] > cor(x,y) 简单明了 只计算和观察需要的变量
黑涩布朗尼对本书的所有笔记 · · · · · ·
-
第136页 7.2 频数表和列联表
7.2 频数表和列联表(什么是列联表) 使用 Arthritis数据集 创建列联表(交叉的分类) 类别型变量...
-
第141页 7.2 频数表和列联表
三维列联表的概念。强化三维数组的存在感。 mytable <- xtabs(~ Treatment+Sex+Improved, dat...
-
第147页 7.3 相关
-
第148页 7.3.1. 相关
偏相关:是指在控制一个或多个定量变量时,另外两个定量变量之间的相互关系。 使用ggm包中的pc...
说明 · · · · · ·
表示其中内容是对原文的摘抄