线性二次型最优控制（LQR）在机器人轨迹跟踪中的应用与实践

原创

于 2026-03-02 05:42:11 发布 · 225 阅读

标签

1. 从理论到实践：为什么LQR是机器人轨迹跟踪的“王牌”？

如果你玩过遥控车，或者看过机器人比赛，大概会知道让一个机器小车沿着一条画好的线走直线有多难。它要么会左右摇摆，要么会冲过头，要么干脆跑偏。这背后其实是一个经典的轨迹跟踪问题。在工业界和学术界，解决这个问题有一个非常经典且强大的工具，那就是线性二次型最优控制，也就是我们常说的LQR。

你可能听说过PID控制器，它简单好用，但面对复杂的机器人系统，比如一个多关节的机械臂或者一个高速移动的无人机，PID的调参就像一场噩梦，而且性能上限不高。这时候，LQR的优势就体现出来了。它不是一个“拍脑袋”想出来的控制器，而是从一个非常优雅的数学问题出发：如何设计一个控制器，使得系统在满足动态方程的同时，最小化一个衡量“误差”和“能量消耗”的代价函数？

听起来有点抽象？我来打个比方。假设你要开车从A点到B点，你希望：

尽快到达（误差小）：对应LQR里对状态误差的惩罚。
开车平稳省油（控制柔和）：对应LQR里对控制量（如油门、刹车）的惩罚。 LQR就是那个帮你计算出最优驾驶策略的“超级大脑”，它告诉你每个时刻方向盘该转多少，油门该踩多深，才能完美平衡“快”和“稳”。

我在实际做轮式移动机器人和机械臂项目时，LQR是我的首选方案之一。尤其是在需要高精度、高实时性的轨迹跟踪场景，比如机器人抓取、AGV循迹、无人机定点悬停，LQR的表现非常可靠。它最大的魅力在于，一旦你建立了准确的系统模型，剩下的工作几乎可以交给计算机自动完成——求解一个叫做Riccati方程的数学问题，就能得到最优的反馈增益矩阵。这个增益矩阵就是控制器的“核心配方”，告诉你如何根据当前机器人的“状态”（比如位置、速度）来计算出最优的“控制指令”（比如电机扭矩）。

与原始文章中偏重理论推导不同，这篇文章我会带你绕过复杂的数学，直击工程实现的要害。我会分享我是如何一步步为机器人建模、选择权重、实现控制器，并处理实际中遇到的各种“坑”。你会发现，LQR并不神秘，它是一套非常系统化、工程友好的设计方法。

2. 第一步：为你的机器人建立一个“数字替身”

LQR是建立在线性系统模型之上的。但我们的机器人，无论是轮式的、足式的还是飞行的，本质上都是非线性的。这就像你要给一个脾气多变的朋友提建议，最好先把他当下的情绪状态搞清楚。所以，应用LQR的第一步，也是最重要的一步，就是为你的机器人建立一个可用的线性模型。这个过程通常称为系统建模与线性化。

2.1 从物理定律到状态方程

我们以一个最经典的例子开始：两轮差分驱动机器人的轨迹跟踪。它的运动学模型是非线性的。假设我们期望它跟踪一个给定的参考轨迹 (x_ref(t), y_ref(t), θ_ref(t))。

首先，定义跟踪误差。我们不直接在全局坐标系下控制，而是将误差转换到机器人自身的车体坐标系下。这样更直观，也更容易设计控制器。定义误差状态向量为： e = [e_x; e_y; e_θ] = R(θ)^T * ([x_ref; y_ref] - [x; y]) ; θ_ref - θ 其中 R(θ) 是旋转矩阵。这个 e 就是我们的状态变量，我们的目标就是让 e 趋近于零。

接着，对这个误差模型进行微分，并在一阶近似下（假设误差和速度控制量较小），我们可以推导出线性时变误差系统： ė = A(t) * e + B(t) * u 这里的 u 通常是机器人的线速度和角速度指令 [v; ω]。A(t) 和 B(t) 矩阵中包含了参考轨迹的速度信息 v_ref(t) 和 ω_ref(t)，因此是时变的。

这是我踩过的第一个坑： 很多新手会直接使用机器人的全局非线性模型，然后尝试在某个固定点（比如零点）进行线性化。这对于定点镇定（比如让机器人走到一个固定点）是可行的，但对于跟踪一条时变的轨迹，这样做会导致跟踪性能很差，尤其是在参考速度变化较快时。必须使用基于参考轨迹的线性化，才能得到准确的误差动力学。

2.2 离散化：让算法能在电脑里跑起来

上面得到的是连续时间的状态方程。但我们的控制器是在数字计算机（比如ROS节点、单片机）上运行的，需要以固定的周期（例如10ms）进行计算。所以，我们必须把连续模型离散化。

假设我们的控制周期是 T，采用零阶保持法，离散化后的系统方程为： e[k+1] = A_d * e[k] + B_d * u[k] 其中 A_d ≈ I + A(t)*T, B_d ≈ B(t)*T。更精确的离散化可以使用矩阵指数，在Python或MATLAB中都有现成函数（如 scipy.linalg.expm）。

关键点： 对于跟踪时变轨迹，A_d 和 B_d</