非线性离散系统的MPC鲁棒性分析

  1. 系统定义和鲁棒稳定的性质
  2. 固有鲁棒性分析(inherent robustness analysis)
  3. 常规模型预测控制(Nominal Model Predictive control)
  4. 参考文献

本文为非线性离散系统的MPC鲁棒性分析,主要翻译自B. Picasso的论文[1],增加了其中引用的其他文章的定理、证明过程等。在模型准确的情况下,使用最优控制一定可以保证稳定性,这时就需要通过鲁棒性分析来作为参考,检验控制算法的性能,对控制参数调整也有指导意义。

1 系统定义和鲁棒稳定的性质

考虑扰动的非线性离散系统x(k+1)=\tilde{f}(x(k),\omega(k)),k\in N \tag{1.1}其中x(k)\in R^n是系统状态,\omega(k)\in W\subseteq R^d是系统扰动,\tilde{f}(x,\omega)不一定要连续,但是需要保证输入有界时输出有界。

去掉扰动影响得到标称模型(nominal model)x(k+1)=f(x(k)),k\in N \tag{1.2}f(x)满足f(x)=\tilde{f}(x,0),f(0)=0

定义系统扰动g(x,\omega)=\tilde{f}(x,\omega)-f(x)

当函数f(x)满足连续、f(0)=0和不减时,称函数f(x)\mathbf{N_0}函数

当函数f(x)满足连续、f(0)=0和严格单调增时,称函数f(x)K函数

当K函数满足f(\infty)=\infty则称其为\mathbf{K_\infty}函数

如果函数\beta:R_{\geqslant 0}\times I_{\geqslant 0}\rightarrow R_{\geqslant 0}连续,且对每一个t\in R^+,\beta(\cdot,t)是一个K,每一个s\in R^+,\beta(s,\cdot)都是不增的,\lim_{t\rightarrow \infty}\beta(s,t)=0,那么称\beta是一个KL函数

如果集合\Gamma \subseteq R^n满足\forall x \in \Gamma ,f(x)\in \Gamma则称集合\Gamma为系统1.2正不变集(positively invariant)

考虑系统(1.2),设两个集合\Gamma,\Omega满足\Omega \subseteq \Gamma,0\in \mathrm{int}(\Omega),且\Gamma是个正不变集。那么函数V:R^n\rightarrow R_+被称为(\Gamma,\Omega)李雅普诺夫函数当且仅当存在K_\infty函数\alpha_1,\alpha_2,\alpha_3满足 \begin{aligned}V(x)&\geqslant \alpha_1(\mid x \mid)\ \forall x\in \Gamma\\V(x)&\leqslant \alpha_2(\mid x \mid)\ \forall x\in \Omega\\ V(f(x))-V(x)&\leqslant -\alpha_3(\mid x\mid)\ \forall x \in \Gamma \end{aligned}

当系统(1.2)在(\Gamma,\Omega)内存在一个李雅普诺夫函数,则系统的原点为\Gamma内的一个渐进稳定点。

如果一个\Gamma \subseteq R^n\forall x \in \Gamma,\forall \omega \in W都有\tilde{f}(x,\omega)\in\Gamma那么称\Gamma是系统(1.1)的鲁棒正不动集(robust positively invariant),可以表示为W\subseteq R^d(W-RPI)

如果函数\Gamma是一个W-RPI的,并且存在\beta \in KL,\gamma \in K,使\forall k \geqslant 0,\forall \bar{x}\in \Gamma , \forall w\in M_w,\mid x(k,\bar{x},w)\mid \leqslant \beta(\mid \bar{x} \mid,k)+\gamma(\parallel w\parallel),则称起为\mathbf{\Gamma}输入-状态稳定的,可以表示为W\subseteq R^d((\Gamma,W)-ISS)

当且仅当W-RPI的紧集\Gamma,存在紧集\Omega\subseteq \Gamma,0\in \mathrm{int}(\Gamma),有K_\infty函数\alpha_1,\alpha_2,\alpha_3和K函数\tau满足V(\tilde{f}(x,\omega))-V(x)\leqslant -\alpha_3(\mid x \mid)+\tau(\mid \omega \mid)\\\forall x \in \Gamma,\forall \omega \in W称函数V:R^n\rightarrow R_+是系统1.1\mathbf{(\Gamma,W)-ISS}李雅普诺夫函数

2 固有鲁棒性分析(inherent robustness analysis)

设V是系统(1.2)(\Gamma,\Omega)下的李雅普诺夫函数。对s\geqslant 0,使\psi(s)=\max_{\varsigma\in[0,s]}(\alpha_2-\alpha_3)(\varsigma),那么\Psi(s)=(i-\alpha_1^{-1}\circ \psi)(s)称函数\Psi与V相关(\Psi-function associated to V)。

考虑扰动的系统(1.1),令\delta (s,\mu)=\sup_{\mid x \mid \leqslant s,\mid \omega \mid \leqslant \mu}\mid g(x,\omega)\mid \tag{2.1}其中g(x,\omega)为系统扰动。如果存在K_\infty函数\varphi_x,\varphi_\omega满足\delta(s,\mu)\leqslant\varphi_x(s)+\varphi_\omega(\mu)\ for\ \forall s \geqslant 0,\forall \mu \geqslant 0\tag{2.2}\Theta=(\Psi-\varphi_x)(s)称函数\Theta与V、g相关(\Theta-function associated to V and g)。

引理1:
若函数\Xi:R_+\rightarrow R_+是不减的,且经过原点,并在0处连续,那么一定存在一个K_\infty函数\xi:R_+\rightarrow R_+,满足\forall s \geqslant 0,\Xi(s)\leqslant\xi(s)

证明:
函数\xi(s)=\begin{cases}0&\mathrm{if }s=0\\s +\frac{1}{s} \int^{2s}_{s} \Xi(\zeta)\mathrm{d}\zeta&\mathrm{if }s>0\end{cases}满足要求。

引理2:
若函数\delta:R_+\times R_+\rightarrow R_+是一个不增的,并使\tilde{\delta}(s)=\delta(s,s)在0连续,并经过原点。那么存在一个K_\infty函数\varphi:R_+\rightarrow R_+满足\forall (s,\mu)\in R_+\times R_+,\delta(s,\mu)\leqslant \varphi(s)+\varphi(\mu)

证明:
因为\delta(s,\mu)是不增的,所以有\delta(s,\mu) \leqslant \tilde{\delta}(s+\mu)。由引理1可知,存在一个K_\infty函数\hat{\delta}(s)满足\tilde{\delta}(s)\leqslant\hat{\delta}(s)。这样\delta(s,\mu)\leqslant \tilde{\delta}(s+\mu) \leqslant \hat{\delta}(s+\mu)\leqslant\hat{\delta}(2s)+\hat{\delta}(2\mu)所以令 \varphi(\xi) = \hat{\delta}(2\xi)可以满足要求。

假设1:
对于扰动系统(1.1)和满足上面定义的\delta,函数\tilde{\delta}(\zeta)=\delta(\zeta,\zeta)在0连续。

引理3:
K_\infty函数\varphi_x,\varphi_\omega仅在满足假设1的情况下才能满足关系(2.2)。

证明:
必要性 由(2.2)得\tilde{\delta}(s)\leqslant \varphi_x(s) \varphi_\omega(s)\varphi_x(s),\varphi_\omega(s)都是K_\infty函数,经过原点并在0处连续,所以\tilde{\delta}(s)也经过原点并在0处连续。
充分行 可以直接用引理2证明。\varphi_x(\zeta) =\varphi_\omega(\zeta) =\hat{\varphi}(2\zeta)是一个满足条件的函数。其中\hat{\varphi}(\zeta)=\begin{cases}0&\mathrm{if }\zeta=0\\ \zeta +\frac{1}{\zeta} \int^{2\zeta}_{\zeta} \varphi(s,s) \mathrm{d} s &\mathrm{if } \zeta>0\end{cases}

定理1:
设V是系统(1.2(\Gamma,\Omega)下的李雅普诺夫函数,并且满足假设1。那么有
如果B_r\subset \Omega,\Theta(r)>0其中\Theta与V、g相关,那么B_r是系统(1.1)的鲁棒正不动集,最大扰动幅值\mu=(\varphi^{-1}\circ\Theta)(r)

其中B_r为以原点为圆心,r为半径的圆形区域。定理1描述了正不动集半径与能接受的最大扰动之间的关系。

证明:
根据系统扰动模型、\delta的定义有 \begin{aligned} \mid \tilde{f}(x,\omega) \mid &\leqslant \mid f(x) \mid+\mid g(x,\omega) \mid\\ &\leqslant \mid f(x) \mid +\delta(r,\mu)\\ \end{aligned}因为满足假设1,应用引理3有 \mid \tilde{f}(x,\omega) \mid \leqslant \mid f(x) \mid +\varphi_x(r) +\varphi_\omega(\mu) \tag{2.3}
根据李雅普诺夫函数定义有 \begin{aligned} \alpha_1 &\leqslant V(f(x))\\ & \leqslant V(x) -\alpha_3(\left| x \right|)\\ &\leqslant (\alpha_2 -\alpha_3)(\left| x \right|)\end{aligned}所以有 \left| f(x)\right| \leqslant (\alpha^{-1}_1 \circ (\alpha_2-\alpha_3))( \left| x \right|)
结合(2.3)可以得到 \left| \tilde{f}(x,\omega) \right| \leqslant (\alpha^{-1}_1 \circ ( \alpha_2 - \alpha_3)(\left| x \right|)) +\varphi_x(r)+\varphi_\omega(\mu)
B_r是正不动集,那么 (\alpha^{-1}_1 \circ (\alpha_2-\alpha_3))(\left| x \right|)+\varphi_x(r) +\varphi_\omega(\mu) \leqslant r
整理得\begin{aligned} \varphi_\omega(\mu) &\leqslant r- \max_{x\in B_r}(\alpha^{-1}_1 \circ (\alpha_2 - \alpha_3 )) (\left| x \right|)-\varphi_x(r) \\ &=r- \alpha_1 \circ (\max_{x\in B_r}(\alpha_2 - \alpha_3 ) (\left| x \right|))-\varphi_x(r) \\ &=r- \alpha_1 \circ (\max_{\zeta \in [0,r]}(\alpha_2 - \alpha_3 ) (\zeta))-\varphi_x(r) \\ &=r- (\alpha_1 \circ \Psi)(r)-\varphi_x(r) \\ &=\Theta(r) \end{aligned} 两侧取逆就可以得到\mu \leqslant (\varphi^{-1}_\omega \circ \Theta)(r)

定理3:
\circ如果B_{\bar{r}} \subset \Omega ,\exists \tilde{\Theta}\in K_\infty,使得\forall r<\bar{r},\Theta(r)\geqslant \tilde{\Theta}(r),那么\forall r \in (0,\bar{r}]系统(1.1)都是(B_r,B_\mu)-ISS稳定的,\mu=(\varphi_\omega^{-1}\circ\Theta)(r)\tilde{V}(x)=\mid x \mid是(B_r,B_\mu)-ISS李雅普诺夫函数。

3 常规模型预测控制(Nominal Model Predictive control)

下面将前面得到的规律应用到使用模型预测控制的闭环系统中。首先需要在开环扰动系统中加入系统输入的作用x(k+1)=f_o(x(k),u(k))+g(x(k),\omega(k)),k\in N \tag{3.1}

对应标称系统有x(k+1)=f_o(x(k),u(k)),k\in N \tag{3.2}

模型预测控制的应用场景多为有约束的环境,约束表示为\forall x \in N\rightarrow x(k)\in X \subset R^n,u(k)\in U \subset R^m\tag{3.3},其中x,u都应包含原点。

定义预测长度N为大于1的正整数,输入序列u_{0,N-1}=[u(0),u(1),\ldots,u(N-1)]\in U^N,U为系统输入的允许范围,过程成本(stage cost)l:R^n\times R^m \rightarrow R_+终端成本(terminal cost)V_f:R^n\rightarrow R_+最终状态(terminal set)记为X_f允许函数\gamma_\epsilon是一个K函数。

有限时域控制优化问题(finite horizon optimal control problem,FHOCP)是在对系统(3.2),在满足约束(3.3)的情况下找到一组u,_{0,N-1}使得代价函数J最小。J(x_0,u_{0,N-1},N)=\sum^{N-1}_{k=0}l(x(k),u(k))+V_f(x(N))Nominal MPC控制规律就是通过求解有限时域控制优化问题得到。

V_N(x)为代价函数J(x_u,\cdot,N)的最小值。进行在线控制时,取V_N(x)对应的控制序列u中第一个控制量进行实施。每个状态作为初始状态都会得到一个实施的控制量u,这样就可以得到一个控制规律。虽然可能不能写成代数形式,但是把他记为 u(x)=\phi^{MPC}(x)\tag{3.4}

下面提出两个假设,约束控制规律可以使控制对象保持稳定

假设2:
代价函数(cost function)l满足l(0,0)=0,且存在\alpha_l\in K_\infty使\forall x \in X,\forall u \in U,l(x,u)\geqslant \alpha(\mid x\mid)\varepsilon \in K是使\alpha_l-\varepsilon\in K_\infty满足的任意函数。令\gamma =\min\{\varepsilon /N:\varepsilon/2\}

假设3:
设存在一个控制规律u(x)=\phi _f(x),使得最终成本V_f和最终状态X_f满足
\circ\ \exists \varrho \>0,X_f=B_\varrho\subseteq X
此外,对\forall x\in X_f都有:
\circ\ \phi_f(x)\in U
\circ\ f_o(x,\phi_f(x))\in X_f
\circ\ 0\leqslant V_f(x)\leqslant \beta_{V_f}(\mid x\mid),for\ some\ \beta_{V_f}\in K_\infty
\circ\ V_f(f_o(x,\phi_f(x)))-V_f(x)\leqslant -l(x,\phi_f(x))

X^{MPC}_N为系统在N时可行的状态集合。若系统(3.2)在控制规律(3.4)下满足假设2、假设3,则原点是系统的渐进稳定点,V_N是(X^{MPC}_N,X_f)下的李雅普诺夫函数,其中\alpha_1=\alpha_l,\alpha_2=\beta_{V_f}+\varepsilon,\alpha_3=\alpha_l-\varepsilon。证明参照[2]中Theorem 1 的证明。

未完待续

4 参考文献

[1] B. Picasso, D. Desiderio, and R. Scattolini, “Robust stability analysis of nonlinear discrete-time systems with application to MPC,” IEEE Trans. Automat. Contr., vol. 57, no. 1, pp. 185–191, Jan. 2012.
[2] L. Magni and R. Scattolini, “Robustness and Robust Design of MPC for Nonlinear Discrete-Time Systems,” in Assessment and Future Directions of Nonlinear Model Predictive Control, Berlin, Heidelberg: Springer Berlin Heidelberg, 2007, pp. 239–254.
[3] B. Picasso, D. Desiderio, and R. Scattolini, “Inherent robustness of nonlinear discrete-time systems,” IFAC Proc. Vol., vol. 44, no. 1, pp. 7438–7443, Jan. 2011.