常见库存方法的数据分析与辅助信息应用
1 引言
在抽样估计中,利用辅助信息可以显著提高估计效率。辅助信息是与感兴趣变量相关的关于抽样单元的知识,且这些知识对于总体中的所有单元都是已知的,或者至少总体参数是已知的。辅助信息可用于样本设计(如分层抽样)或估计过程(如比率估计和回归估计)。
2 分层抽样
2.1 分层抽样原理
分层抽样是将总体利用辅助变量划分为离散、不重叠的子总体,然后在每个子总体内独立抽样。这样做可以控制变异,通过分别计算可能不同的事物的统计量,再对这些层统计量进行加权平均来计算总体水平的估计值,从而使子总体之间的变异不影响估计的不确定性。分层可以使用离散或连续的辅助变量,一旦完成分层,除非通过更高级的估计技术明确涉及,否则不再使用辅助变量。
2.2 分层抽样分析
以PREF实验森林为例,森林被分为L = 9个层,各层相对大小为 (w_h)((h = 1…9)),假设在每层内独立进行简单随机抽样且各层大小相等。每个点测量体积 (v_{ij})((m^3/ha)),我们要估计总体均值 (\bar{v} {sts}) 和总体均值的95%置信区间。
- 估计总体均值 :
- 估计公式为 (\bar{v} {sts} = \sum_{h=1}^{L} w_h \bar{v}_h)
- R代码实现:
pref.StRS <- svydesign(id = ~1,
strata = ~stratum,
超级会员免费看
订阅专栏 解锁全文
1676

被折叠的 条评论
为什么被折叠?



