非线性离散系统的MPC鲁棒性分析

本文为非线性离散系统的MPC鲁棒性分析，主要翻译自B. Picasso的论文[1]，增加了其中引用的其他文章的定理、证明过程等。在模型准确的情况下，使用最优控制一定可以保证稳定性，这时就需要通过鲁棒性分析来作为参考，检验控制算法的性能，对控制参数调整也有指导意义。

1 系统定义和鲁棒稳定的性质

考虑扰动的非线性离散系统 $x(k+1)=\tilde{f}(x(k),\omega(k)),k\in N \tag{1.1}$ 其中 $x(k)\in R^n$ 是系统状态， $\omega(k)\in W\subseteq R^d$ 是系统扰动， $\tilde{f}(x,\omega)$ 不一定要连续，但是需要保证输入有界时输出有界。

去掉扰动影响得到标称模型（nominal model） $x(k+1)=f(x(k)),k\in N \tag{1.2}$ $f(x)$ 满足 $f(x)=\tilde{f}(x,0),f(0)=0$

定义系统扰动为 $g(x,\omega)=\tilde{f}(x,\omega)-f(x)$

当函数 $f(x)$ 满足连续、 $f(0)=0$ 和不减时，称函数 $f(x)$ 为 $\mathbf{N_0}$ 函数

当函数 $f(x)$ 满足连续、 $f(0)=0$ 和严格单调增时，称函数 $f(x)$ 为K函数

当K函数满足 $f(\infty)=\infty$ 则称其为 $\mathbf{K_\infty}$ 函数

如果函数 $\beta:R_{\geqslant 0}\times I_{\geqslant 0}\rightarrow R_{\geqslant 0}$ 连续，且对每一个 $t\in R^+,\beta(\cdot,t)$ 是一个K，每一个 $s\in R^+,\beta(s,\cdot)$ 都是不增的， $\lim_{t\rightarrow \infty}\beta(s,t)=0$ ，那么称 $\beta$ 是一个KL函数

如果集合 $\Gamma \subseteq R^n$ 满足 $\forall x \in \Gamma ,f(x)\in \Gamma$ 则称集合 $\Gamma$ 为系统 $（1.2）$ 的正不变集（positively invariant）

考虑系统（1.2），设两个集合 $\Gamma,\Omega$ 满足 $\Omega \subseteq \Gamma,0\in \mathrm{int}(\Omega)$ ，且 $\Gamma$ 是个正不变集。那么函数 $V:R^n\rightarrow R_+$ 被称为 $(\Gamma,\Omega)$ 的李雅普诺夫函数当且仅当存在 $K_\infty$ 函数 $\alpha_1,\alpha_2,\alpha_3$ 满足 $\begin{aligned}V(x)&\geqslant \alpha_1(\mid x \mid)\ \forall x\in \Gamma\\V(x)&\leqslant \alpha_2(\mid x \mid)\ \forall x\in \Omega\\ V(f(x))-V(x)&\leqslant -\alpha_3(\mid x\mid)\ \forall x \in \Gamma \end{aligned}$

当系统（1.2）在 $(\Gamma,\Omega)$ 内存在一个李雅普诺夫函数，则系统的原点为 $\Gamma$ 内的一个渐进稳定点。

如果一个 $\Gamma \subseteq R^n$ 对 $\forall x \in \Gamma,\forall \omega \in W$ 都有 $\tilde{f}(x,\omega)\in\Gamma$ 那么称 $\Gamma$ 是系统（1.1）的鲁棒正不动集（robust positively invariant），可以表示为 $W\subseteq R^d(W-RPI)$

如果函数 $\Gamma$ 是一个W-RPI的，并且存在 $\beta \in KL,\gamma \in K$ ，使 $\forall k \geqslant 0,\forall \bar{x}\in \Gamma , \forall w\in M_w,\mid x(k,\bar{x},w)\mid \leqslant \beta(\mid \bar{x} \mid,k)+\gamma(\parallel w\parallel)$ ，则称起为 $\mathbf{\Gamma}$ 输入-状态稳定的，可以表示为 $W\subseteq R^d((\Gamma,W)-ISS)$

当且仅当W-RPI的紧集 $\Gamma$ ，存在紧集 $\Omega\subseteq \Gamma,0\in \mathrm{int}(\Gamma)$ ，有 $K_\infty$ 函数 $\alpha_1,\alpha_2,\alpha_3$ 和K函数 $\tau$ 满足 $V(\tilde{f}(x,\omega))-V(x)\leqslant -\alpha_3(\mid x \mid)+\tau(\mid \omega \mid)\\\forall x \in \Gamma,\forall \omega \in W$ 称函数 $V:R^n\rightarrow R_+$ 是系统(1.1)的 $\mathbf{(\Gamma,W)-ISS}$ 李雅普诺夫函数。

2 固有鲁棒性分析（inherent robustness analysis）

设V是系统（[1.2）（ $\Gamma,\Omega$ ）下的李雅普诺夫函数。对 $s\geqslant 0$ ，使 $\psi(s)=\max_{\varsigma\in[0,s]}(\alpha_2-\alpha_3)(\varsigma)$ ，那么 $\Psi(s)=(i-\alpha_1^{-1}\circ \psi)(s)$ 称函数 $\Psi$ 与V相关（ $\Psi$ -function associated to V）。

考虑扰动的系统（[1.1），令 $\delta (s,\mu)=\sup_{\mid x \mid \leqslant s,\mid \omega \mid \leqslant \mu}\mid g(x,\omega)\mid \tag{2.1}$ 其中 $g(x,\omega)$ 为系统扰动。如果存在 $K_\infty$ 函数 $\varphi_x,\varphi_\omega$ 满足 $\delta(s,\mu)\leqslant\varphi_x(s)+\varphi_\omega(\mu)\ for\ \forall s \geqslant 0,\forall \mu \geqslant 0\tag{2.2}$ 设 $\Theta=(\Psi-\varphi_x)(s)$ 称函数 $\Theta$ 与V、g相关（ $\Theta$ -function associated to V and g）。

引理1：
若函数 $\Xi:R_+\rightarrow R_+$ 是不减的，且经过原点，并在0处连续，那么一定存在一个 $K_\infty$ 函数 $\xi:R_+\rightarrow R_+$ ，满足 $\forall s \geqslant 0,\Xi(s)\leqslant\xi(s)$ 。

证明：
函数 $\xi(s)=\begin{cases}0&\mathrm{if }s=0\\s +\frac{1}{s} \int^{2s}_{s} \Xi(\zeta)\mathrm{d}\zeta&\mathrm{if }s>0\end{cases}$ 满足要求。

引理2：
若函数 $\delta:R_+\times R_+\rightarrow R_+$ 是一个不增的，并使 $\tilde{\delta}(s)=\delta(s,s)$ 在0连续，并经过原点。那么存在一个 $K_\infty$ 函数 $\varphi:R_+\rightarrow R_+$ 满足 $\forall (s,\mu)\in R_+\times R_+,\delta(s,\mu)\leqslant \varphi(s)+\varphi(\mu)$ 。

证明：
因为 $\delta(s,\mu)$ 是不增的，所以有 $\delta(s,\mu) \leqslant \tilde{\delta}(s+\mu)$ 。由引理1可知，存在一个 $K_\infty$ 函数 $\hat{\delta}(s)$ 满足 $\tilde{\delta}(s)\leqslant\hat{\delta}(s)$ 。这样 $\delta(s,\mu)\leqslant \tilde{\delta}(s+\mu) \leqslant \hat{\delta}(s+\mu)\leqslant\hat{\delta}(2s)+\hat{\delta}(2\mu)$ 所以令 $\varphi(\xi) = \hat{\delta}(2\xi)$ 可以满足要求。

假设1：
对于扰动系统（1.1）和满足上面定义的 $\delta$ ，函数 $\tilde{\delta}(\zeta)=\delta(\zeta,\zeta)$ 在0连续。

引理3：
$K_\infty$ 函数 $\varphi_x,\varphi_\omega$ 仅在满足假设1的情况下才能满足关系(2.2)。

证明：
必要性由([l2.2)得 $\tilde{\delta}(s)\leqslant \varphi_x(s) \varphi_\omega(s)$ 。 $\varphi_x(s),\varphi_\omega(s)$ 都是 $K_\infty$ 函数，经过原点并在0处连续，所以 $\tilde{\delta}(s)$ 也经过原点并在0处连续。
充分行可以直接用引理2证明。 $\varphi_x(\zeta) =\varphi_\omega(\zeta) =\hat{\varphi}(2\zeta)$ 是一个满足条件的函数。其中 $\hat{\varphi}(\zeta)=\begin{cases}0&\mathrm{if }\zeta=0\\ \zeta +\frac{1}{\zeta} \int^{2\zeta}_{\zeta} \varphi(s,s) \mathrm{d} s &\mathrm{if } \zeta>0\end{cases}$

定理1：
设V是系统（1.2） $(\Gamma,\Omega)$ 下的李雅普诺夫函数，并且满足假设1。那么有
如果 $B_r\subset \Omega,\Theta(r)>0$ 其中 $\Theta$ 与V、g相关，那么 $B_r$ 是系统（1.1）的鲁棒正不动集，最大扰动幅值 $\mu=(\varphi^{-1}\circ\Theta)(r)$

其中 $B_r$ 为以原点为圆心，r为半径的圆形区域。定理1描述了正不动集半径与能接受的最大扰动之间的关系。

证明：
根据系统扰动模型、 $\delta$ 的定义有 $\begin{aligned} \mid \tilde{f}(x,\omega) \mid &\leqslant \mid f(x) \mid+\mid g(x,\omega) \mid\\ &\leqslant \mid f(x) \mid +\delta(r,\mu)\\ \end{aligned}$ 因为满足假设1，应用引理3有 $\mid \tilde{f}(x,\omega) \mid \leqslant \mid f(x) \mid +\varphi_x(r) +\varphi_\omega(\mu) \tag{2.3}$
根据李雅普诺夫函数定义有 $\begin{aligned} \alpha_1 &\leqslant V(f(x))\\ & \leqslant V(x) -\alpha_3(\left| x \right|)\\ &\leqslant (\alpha_2 -\alpha_3)(\left| x \right|)\end{aligned}$ 所以有 $\left| f(x)\right| \leqslant (\alpha^{-1}_1 \circ (\alpha_2-\alpha_3))( \left| x \right|)$
结合（2.3）可以得到 $\left| \tilde{f}(x,\omega) \right| \leqslant (\alpha^{-1}_1 \circ ( \alpha_2 - \alpha_3)(\left| x \right|)) +\varphi_x(r)+\varphi_\omega(\mu)$
$B_r$ 是正不动集，那么 $(\alpha^{-1}_1 \circ (\alpha_2-\alpha_3))(\left| x \right|)+\varphi_x(r) +\varphi_\omega(\mu) \leqslant r$
整理得 $\begin{aligned} \varphi_\omega(\mu) &\leqslant r- \max_{x\in B_r}(\alpha^{-1}_1 \circ (\alpha_2 - \alpha_3 )) (\left| x \right|)-\varphi_x(r) \\ &=r- \alpha_1 \circ (\max_{x\in B_r}(\alpha_2 - \alpha_3 ) (\left| x \right|))-\varphi_x(r) \\ &=r- \alpha_1 \circ (\max_{\zeta \in [0,r]}(\alpha_2 - \alpha_3 ) (\zeta))-\varphi_x(r) \\ &=r- (\alpha_1 \circ \Psi)(r)-\varphi_x(r) \\ &=\Theta(r) \end{aligned}$ 两侧取逆就可以得到 $\mu \leqslant (\varphi^{-1}_\omega \circ \Theta)(r)$

定理3：
$\circ$ 如果 $B_{\bar{r}} \subset \Omega ,\exists \tilde{\Theta}\in K_\infty$ ，使得 $\forall r<\bar{r},\Theta(r)\geqslant \tilde{\Theta}(r)$ ，那么 $\forall r \in (0,\bar{r}]$ 系统(1.1)都是（ $B_r,B_\mu$ ）-ISS稳定的， $\mu=(\varphi_\omega^{-1}\circ\Theta)(r)$ ， $\tilde{V}(x)=\mid x \mid$ 是（ $B_r,B_\mu$ ）-ISS李雅普诺夫函数。

3 常规模型预测控制(Nominal Model Predictive control)

下面将前面得到的规律应用到使用模型预测控制的闭环系统中。首先需要在开环扰动系统中加入系统输入的作用 $x(k+1)=f_o(x(k),u(k))+g(x(k),\omega(k)),k\in N \tag{3.1}$

对应标称系统有 $x(k+1)=f_o(x(k),u(k)),k\in N \tag{3.2}$

模型预测控制的应用场景多为有约束的环境，约束表示为 $\forall x \in N\rightarrow x(k)\in X \subset R^n,u(k)\in U \subset R^m\tag{3.3}$ ，其中 $x,u$ 都应包含原点。

定义预测长度N为大于1的正整数，输入序列 $u_{0,N-1}=[u(0),u(1),\ldots,u(N-1)]\in U^N$ ，U为系统输入的允许范围，过程成本（stage cost） $l:R^n\times R^m \rightarrow R_+$ ，终端成本（terminal cost） $V_f:R^n\rightarrow R_+$ ，最终状态（terminal set）记为 $X_f$ ，允许函数 $\gamma_\epsilon$ 是一个K函数。

有限时域控制优化问题（finite horizon optimal control problem，FHOCP）是在对系统（3.2），在满足约束（3.3）的情况下找到一组 $u,_{0,N-1}$ 使得代价函数J最小。 $J(x_0,u_{0,N-1},N)=\sum^{N-1}_{k=0}l(x(k),u(k))+V_f(x(N))$ Nominal MPC控制规律就是通过求解有限时域控制优化问题得到。

记 $V_N(x)$ 为代价函数 $J(x_u,\cdot,N)$ 的最小值。进行在线控制时，取 $V_N(x)$ 对应的控制序列u中第一个控制量进行实施。每个状态作为初始状态都会得到一个实施的控制量u，这样就可以得到一个控制规律。虽然可能不能写成代数形式，但是把他记为 $u(x)=\phi^{MPC}(x)\tag{3.4}$

下面提出两个假设，约束控制规律可以使控制对象保持稳定

假设2：
代价函数（cost function）l满足 $l(0,0)=0$ ，且存在 $\alpha_l\in K_\infty$ 使 $\forall x \in X,\forall u \in U,l(x,u)\geqslant \alpha(\mid x\mid)$ 。 $\varepsilon \in K$ 是使 $\alpha_l-\varepsilon\in K_\infty$ 满足的任意函数。令 $\gamma =\min\{\varepsilon /N:\varepsilon/2\}$ 。

假设3：
设存在一个控制规律 $u(x)=\phi _f(x)$ ，使得最终成本 $V_f$ 和最终状态 $X_f$ 满足
$\circ\ \exists \varrho \>0,X_f=B_\varrho\subseteq X$
此外，对 $\forall x\in X_f$ 都有：
$\circ\ \phi_f(x)\in U$
$\circ\ f_o(x,\phi_f(x))\in X_f$
$\circ\ 0\leqslant V_f(x)\leqslant \beta_{V_f}(\mid x\mid),for\ some\ \beta_{V_f}\in K_\infty$
$\circ\ V_f(f_o(x,\phi_f(x)))-V_f(x)\leqslant -l(x,\phi_f(x))$

设 $X^{MPC}_N$ 为系统在N时可行的状态集合。若系统（[3.2）在控制规律（3.4）下满足假设2、假设3，则原点是系统的渐进稳定点， $V_N$ 是（ $X^{MPC}_N,X_f$ ）下的李雅普诺夫函数，其中 $\alpha_1=\alpha_l,\alpha_2=\beta_{V_f}+\varepsilon,\alpha_3=\alpha_l-\varepsilon$ 。证明参照[2]中Theorem 1 的证明。

未完待续

4 参考文献

[1] B. Picasso, D. Desiderio, and R. Scattolini, “Robust stability analysis of nonlinear discrete-time systems with application to MPC,” IEEE Trans. Automat. Contr., vol. 57, no. 1, pp. 185–191, Jan. 2012.
[2] L. Magni and R. Scattolini, “Robustness and Robust Design of MPC for Nonlinear Discrete-Time Systems,” in Assessment and Future Directions of Nonlinear Model Predictive Control, Berlin, Heidelberg: Springer Berlin Heidelberg, 2007, pp. 239–254.
[3] B. Picasso, D. Desiderio, and R. Scattolini, “Inherent robustness of nonlinear discrete-time systems,” IFAC Proc. Vol., vol. 44, no. 1, pp. 7438–7443, Jan. 2011.

非线性离散系统的MPC鲁棒性分析

1 系统定义和鲁棒稳定的性质

2 固有鲁棒性分析（inherent robustness analysis）

3 常规模型预测控制(Nominal Model Predictive control)

4 参考文献

发表回复 取消回复

发表回复取消回复