1. 超效率SBM模型入门指南
第一次接触超效率SBM模型时,我也被那些数学公式搞得头晕眼花。但后来在实际项目中用了两次才发现,这其实就是个"找差距"的工具。想象你管理着10家连锁超市,想知道哪家运营效率最高——超效率SBM就是帮你量化这个问题的神器。
传统DEA模型有个致命缺陷:当多个决策单元(DMU)效率值都是1时,它就傻眼了。我2018年分析长三角制造业时就遇到这个问题——15家企业效率值全是1,根本分不出高低。这时候超效率SBM就派上用场了,它能让效率值突破1的上限,就像给优等生加了附加题。
模型核心是这个公式:
def super_sbm(inputs, outputs):
# inputs: m维投入向量
# outputs: s维产出向量
rho = 1 + (sum(s_plus/outputs) + sum(s_minus/inputs))/(m + s)
return rho # 可能>1的效率值
去年帮某省环保局做污染治理效率评估时,我们选了这些指标:
- 投入项:治理资金(万元)、技术人员(人)
- 期望产出:污染物处理量(吨)
- 非期望产出:二次污染指数
关键技巧:数据必须全部为正数!遇到0或负值可以用平移法处理:x'_i = x_i + abs(min(x)) + 0.01
2. 模型实战七步法
2.1 数据准备陷阱
上周刚有个研究生找我哭诉,说跑出来的效率值全是1。一看数据就发现问题——他的投入产出指标高度线性相关。记住:指标间要有独立性!建议先做Person相关性检验,相关系数>0.8的指标要踢掉一个。
我常用的数据清洗流程:
- 缺失值处理:用KNNImputer填充
- 异常值处理:3σ原则+箱线图复核
- 标准化:Max-Min归一化</

2万+

被折叠的 条评论
为什么被折叠?



