[mpv脚本系统] (二) Lua三层闭包实现自动资源管理

原创已于 2026-06-03 10:02:56 修改 · 411 阅读

6 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#lua #junit #单元测试

于 2026-06-02 09:00:00 首次发布

Lua学习同时被 2 个专栏收录

9 篇文章

订阅专栏

mpv源码剖析

7 篇文章

订阅专栏

从一个疑惑开始：为什么 mpv 的 Lua 绑定函数（如 mp.utils.readdir）打开目录、分配临时内存后，从不写 closedir 或 free，却从不泄漏？

答案藏在 af_pushcclosure 的三层闭包封装里。

阅读这类源码时，最重要的不是逐行翻译，而是把"为什么这样设计""这样设计带来什么收益"讲清楚。本文先从 Lua 闭包与上值的本质开始，再用 mpv 的 af_pushcclosure 机制说明 C/Lua 混合编程如何把资源生命周期自动化。

文章目录

1. 闭包与上值：先建立概念模型

从工程角度看，闭包不是“函数里套函数”的语法糖，而是函数实例 + 其词法环境的绑定。它的意义在于：函数不仅能执行代码，还能携带它定义时所依赖的状态。

在 Lua 里，闭包的核心能力有两个：

延长变量生命周期：函数离开定义作用域后，仍能继续访问捕获到的变量。
保留状态：同一个闭包实例可以在多次调用之间维护私有数据。

1.1 普通函数 vs. 闭包

维度	普通函数	闭包
访问变量	仅能访问参数和局部变量	可以访问参数、局部变量，以及外部捕获的变量
生命周期	调用结束后，局部环境通常随之结束	绑定状态可跨调用保留
状态保持	无状态，调用结果取决于入参	可维护内部状态，天然适合做状态机、计数器、资源包装

Lua 示例最能说明问题：

function make_counter()
    local count = 0
    return function()
        count = count + 1
        return count
    end
end

local counter1 = make_counter()
local counter2 = make_counter()

print(counter1()) -- 1
print(counter1()) -- 2
print(counter2()) -- 1

这里的关键不是 return function() 本身，而是匿名函数捕获到了 count。count 不是全局变量，也不是参数，而是被闭包“保存住了”，这就是上值的表现。

1.2 上值是什么？

**上值（Upvalue）**就是闭包捕获到的外部变量。继续用上面的 counter 来说，count 就是闭包的上值。

在 C API 层面，创建一个 C 闭包时，lua_pushcclosure(L, fn, n) 会把栈顶的 n 个值作为这个闭包的上值封装进去。随后，在 C 侧通过 lua_upvalueindex(i) 读取第 i 个上值，就可以把“闭包捕获的环境”显式拿出来使用。

这一点很关键：

在 Lua 语法层，闭包自然地把状态绑进了函数；
在 C API 层，闭包则变成了一个可携带上下文的运行时对象。

2. 为什么 mpv 要用这种结构？

mpv 的 Lua 绑定层并不只是简单地把 C 函数暴露给脚本。它还要解决一类真实工程问题：C 侧需要把临时资源、错误处理、释放逻辑隐藏在调用栈之外。

mp.utils.readdir 这类接口就是典型例子。它需要：

读取目录并返回 Lua table；
分配临时内存；
在目录句柄、字符串缓冲区等资源上建立生命周期约束；
即使中途报错，也要保证资源被释放。

如果把这些逻辑全部手工塞进每个绑定函数，会导致重复代码和异常路径漏清理。af_pushcclosure 的价值就在于：它把“调用包装”和“资源释放”放进一层闭包层次中，让真实业务函数只关心自己的工作。

术语速查：下文出现的 talloc 是 mpv 使用的层次化内存分配器（来自 Samba 项目）。它的核心特性是父节点释放时，所有子节点自动释放——这正是"注册资源到上下文、上下文销毁时统一清理"这一模式的基础。talloc_new(NULL) 创建根上下文，talloc_free(ctx) 释放整棵树。

3. `af_pushcclosure`：三层封装的运行时模型

af_pushcclosure 不是单纯的函数包裹，而是一个多层闭包组合器。以 mp.utils.readdir 的注册过程为例，核心流程如下：

// FN_ENTRY / AF_ENTRY 是注册函数表的宏（lua.c）：
//   FN_ENTRY(name) → {name, script_##name, 0}    普通 lua_CFunction
//   AF_ENTRY(name) → {name, 0, script_##name}    带 autofree 的函数
// af 字段非空时走 af_pushcclosure，否则走普通 lua_pushcclosure
static void register_package_fns(lua_State *L, char *module,
                                 const struct fn_entry *e)
{
    push_module_table(L, module);        // 获取或创建模块表
    for (int n = 0; e[n].name; n++) {
        if (e[n].af) {
            // ★ 走 autofree 包装路径：三层闭包封装
            af_pushcclosure(L, e[n].af, 0);
        } else {
            // 普通路径：直接注册为 lua_CFunction
            lua_pushcclosure(L, e[n].fn, 0);
        }
        lua_setfield(L, -2, e[n].name);  // modtable.name = fn
    }
    lua_pop(L, 1);  // 弹出模块表
}

// utils_fns 中有：
AF_ENTRY(readdir) // {name="readdir", af=script_readdir}

当 readdir 被注册时，绑定层会把真正的目标函数 script_readdir 交给 af_pushcclosure 包装。

3.1 第一层：构造包装闭包

先交代两个关键类型定义：

// af_CFunction：带自动释放的 Lua C 函数类型（lua.c）
// 与普通 lua_CFunction 的区别：多一个 void *ctx 参数，
// ctx 由外层 trampoline 自动创建和释放，业务函数只管用。
typedef int (*af_CFunction)(lua_State *L, void *ctx);

// autofree_data：trampoline 传递给内层闭包的上下文打包结构
typedef struct autofree_data {
    af_CFunction target;  // 指向真正的业务函数（如 script_readdir）
    void *ctx;            // talloc 临时上下文指针
} autofree_data;

然后看 af_pushcclosure 的完整实现（源码中有详细的英文注释，这里保留原意并补充中文说明）：

static void af_pushcclosure(lua_State *L, af_CFunction fn, int n)
{
    // 思路：不直接创建 fn 的闭包，而是创建一个 trampoline 闭包，
    // 它有两个上值：
    //   上值1: script_autofree_call 闭包（携带调用者给的 n 个上值）
    //   上值2: fn 函数指针（轻量级用户数据）
    //
    // 当 Lua 调用这个闭包时，trampoline 会：
    //   1. 创建 talloc 上下文
    //   2. 用 lua_pcall 调用 autofree_call（传入 ctx + fn）
    //   3. 无论成功失败都释放 talloc 上下文

    // 步骤1: 创建内层闭包 script_autofree_call，携带 n 个上值
    lua_pushcclosure(L, script_autofree_call, n);

    // 步骤2: 将目标函数指针作为轻量级用户数据压栈
    lua_pushlightuserdata(L, fn);  // 不归 Lua GC 管的 C 指针

    // 步骤3: 创建外层闭包 script_autofree_trampoline，
    //        消耗栈顶 2 个值作为上值（autofree_call + fn 指针）
    lua_pushcclosure(L, script_autofree_trampoline, 2);
}

这一步生成了两个闭包：

script_autofree_call：真正执行底层业务逻辑的中间层；
script_autofree_trampoline：作为最终暴露给 Lua 的函数入口。

其中最外层的 trampoline 会捕获两个上值：

内层 autofree_call 闭包；
真正的目标函数指针 &script_readdir。

这意味着最终暴露给 Lua 的函数，实际上是一个“带上下文的执行器”。
这三层的关系可以直观地表示为：

3.2 第二层：调用发生时，执行链开始

假设 Lua 脚本执行：

mp.utils.readdir("/path")

调用会进入 script_autofree_trampoline。这个函数的职责是把“当前调用上下文”打包起来，并交给内层包装器去执行。


typedef struct autofree_data {
    af_CFunction target;
    void *ctx;
} autofree_data;

static int script_autofree_trampoline(lua_State *L)
{
    // 从上值2取出目标函数指针（&script_readdir）
    autofree_data data = {
        .target = lua_touserdata(L, lua_upvalueindex(2)), //fn
        .ctx = NULL,
    };

    // 将上值1（autofree_call 闭包）压栈并移到栈底
    lua_pushvalue(L, lua_upvalueindex(1)); // n*args autofree_call (closure)
    lua_insert(L, 1); // autofree_call  n*args

    // 把 data 结构地址作为参数压栈
    lua_pushlightuserdata(L, &data); // autofree_call n*args &data

    // ★ talloc_new：创建层次化内存上下文
    data.ctx = talloc_new(NULL);

    // ★ lua_pcall：受保护调用，错误不会让进程崩溃
    // LUA_MULTRET = 返回所有结果，不做数量限制
    int r = lua_pcall(L, lua_gettop(L) - 1, LUA_MULTRET, 0);

    // ★★★ 无论成功失败，释放 talloc 上下文 ★★★
    talloc_free(data.ctx);

    if (r)
        lua_error(L);  // 重抛 Lua 错误

    return lua_gettop(L);  // 返回结果个数
}

这里有几个关键动作：

从上值中取出目标函数指针 script_readdir；
取出内层闭包 script_autofree_call；
创建一个 talloc 临时上下文 ctx；
构造 autofree_data，把目标函数和 ctx 绑定起来；
通过 lua_pcall 调用内层闭包；
无论成功还是失败，都会执行 talloc_free(data.ctx)。

这一步最值得注意的是：trampoline 不是为了“转发调用”而存在，而是在调用边界上建立了一个统一的释放语义。

3.3 第三层：真正的业务函数只关心自己

内层闭包 script_autofree_call 的逻辑非常简单：

static int script_autofree_call(lua_State *L)
{
    // 从栈顶取出 trampoline 压入的 data 指针
    // n*args &data
    autofree_data *data = lua_touserdata(L, -1);
    // 弹出 &data，恢复栈状态为 n*args 
    lua_pop(L, 1);  // 弹出 &data，栈恢复为业务函数的原始参数

    // 调用真正的业务函数，传入 talloc 上下文
    return data->target(L, data->ctx);
}

它只负责把数据从栈上取出来，并把控制权交给真正的业务函数 script_readdir。

script_readdir 本身的签名看起来像普通 C 函数，但多了一个 void *tmp 参数（这就是 af_CFunction 类型——带 talloc 上下文的 Lua C 函数）：

// af_CFunction 类型定义（lua.c）：
//   typedef int (*af_CFunction)(lua_State *L, void *ctx);
// 与普通 lua_CFunction 的区别：多一个 void *ctx 参数，
// ctx 由外层 trampoline 自动创建和释放。
static int script_readdir(lua_State *L, void *tmp)
{
    // 第一个参数：目录路径
    const char *path = luaL_checkstring(L, 1);

    // 打开目录（POSIX 系统调用，返回 DIR* 句柄）
    DIR *dir = opendir(path);
    if (!dir) {
        lua_pushnil(L);
        lua_pushstring(L, "error");
        return 2;  // Lua 侧收到 nil, "error"
    }

    // ★ 关键：把 DIR* 注册到 tmp 上，tmp 被释放时自动 closedir
    add_af_dir(tmp, dir);

    lua_newtable(L);  // 创建返回给 Lua 的结果表
    // 在 tmp 上分配临时缓冲区（talloc_strdup = talloc 版 strdup）
    char *fullpath = talloc_strdup(tmp, "");
    struct dirent *e;
    int n = 0;

    // 遍历目录项
    while ((e = readdir(dir))) {
        char *name = e->d_name;
        // 跳过 . 和 ..
        if (strcmp(name, ".") == 0 || strcmp(name, "..") == 0)
            continue;
        // 将条目名填入 Lua table（索引从 1 开始）
        lua_pushinteger(L, ++n);
        lua_pushstring(L, name);
        lua_settable(L, -3);  // list[n] = name
    }

    // 返回 1 个值（Lua table），后续由 trampoline 原样传递给调用方
    return 1;
}

这一层的设计非常巧妙：

script_readdir 不需要关心异常清理；
它只要把需要自动释放的资源注册到 tmp 上；
释放时机由外层 trampoline 统一控制。

4. 这套机制如何工作：调用链总结

这条链路的价值在于：资源释放不再依赖业务函数主动写完所有异常分支。调用边界统一负责清理，让业务代码保持纯粹。

5. 为什么这类模式值得学习

这类双层/三层闭包封装，本质上是把以下两件事做成了“运行时协议”：

把隐藏状态放进闭包上值中；
把异常路径上的清理逻辑放进统一调用边界。

对 C/Lua 混合编程来说，这种模式的意义非常直接：

业务函数更接近普通 C 函数，代码更干净；
资源管理不需要散落在各个 API 分支中；
错误路径也能保持资源安全。

6. 动手验证：一个可复现的案例

如果你想亲手验证这套机制，可以用以下方式：

6.1 写一个最简 Lua 测试脚本

-- test_readdir.lua
local utils = require("mp.utils")
local files = utils.readdir(".")
for _, f in ipairs(files) do
    print(f)
end

6.2 用 valgrind 验证无泄漏

valgrind --leak-check=full --track-fds=yes \
    mpv --no-config --script=test_readdir.lua --idle=no

你应该看到：

definitely lost: 0 bytes —— 没有泄漏；
FILE DESCRIPTORS: ... open at exit 不包含 DIR* 句柄 —— 目录已关闭。

6.3 反向验证：注释掉 `talloc_free`

如果你在 lua.c 中临时注释掉 talloc_free(data.ctx) 这行，重新编译后再次运行 valgrind，就会看到 DIR* 和临时字符串的内存泄漏记录。这直观地证明了 trampoline 的释放逻辑是整个资源安全的关键。

7. 结论

这篇文章里最重要的不是“Lua 怎么定义闭包”，而是“闭包如何在 C API 层演化成一个上下文传递与资源管理机制”。

从这个角度，可以得到三个结论：

闭包的本质是绑定环境：它不仅能访问外部变量，还能让状态跨调用保留。
上值是 C/Lua 交互的隐藏通道：通过 lua_pushcclosure 和 lua_upvalueindex，C 代码可以把函数指针、临时上下文、释放器等运行时信息封装进闭包。
mpv 的 af_pushcclosure 是一种工程化封装：它把“真实业务逻辑”与“自动释放资源”“异常兜底”解耦，显著提升了绑定层代码的健壮性。

如果把这套机制抽象成一句话，它就是：用 Lua 闭包承载状态，用 C 闭包承载调用边界，把资源释放变成调用协议的一部分。