变分法 是处理泛函的数学领域,和处理函数的普通微积分相对。本文将介绍泛函、线性泛函、泛函的变分、边值条件固定的拉格朗日问题等基础概念。之后将介绍欧拉-拉格朗日 (Euler-Lagrange) 方程及其证明和无约束的最有控制问题。
1 基础概念
泛函
对于向量空间\mathbf{Y}内每一个向量y(x),都有一个数与之对应J[y(x)] \in \mathbf{R}^1,则称这个数J[y(x)]是向量y(x)的泛函。
线性泛函
J[y(x)]是函数向量空间\mathbf{Y}上向量y(x)的泛函。如果对于\forall \alpha , \beta \in \mathbf{R}^1,均有
J[\alpha y_1(x)+\beta y_2(x)]=
\alpha J[y_1(x)]+\beta J[y_2(x)] \quad y_1(x),y_2(x) \in \mathbf{Y}
则称J[y(x)]是Y上的线性泛函
泛函的变分
考虑开函数向量空间Y内的泛函J[y(x)],他对定义域内的y(x)施加一个充分小的增量\delta y(x)产生的变化可以表示为
J[y(x)+\delta y(x)]-J[y(x)]=A[y(x),\delta y(x)]+B[y(x),\delta y(x)]
其中A[y(x),\delta y(x)]是关于\delta y(x)的线性泛函,B[y(x),\delta y(x)]是关于\lVert \delta y \rVert的高阶无穷小量。则称A[y(x),\delta y(x)]为泛函J[y(x)](一阶)变分,简记为\delta J[y(x)]、\delta J。\delta y(x)称为y(x)的变分或宗量的变分。
边值条件固定的Lagrange问题
求二次可微函数向量x(t),使得泛函
J=\int^{t_f}_{t_0} F[t,x(t),\dot{x}(t)]\mathrm{d} t \tag{lagrange}
得到极值,并且满足边值条件
x(t_0)=x_0,\quad x(t_f)=x_f
2 Euler-Lagrange方程
在开始证明Euler-Lagrange方程前先证明一个定理。
定理 2.1 如果泛函J[y(x)]的定义域为开函数向量空间Y,其在函数向量y(x)\in Y处充分小的增量\delta y(x) \in Y产生的变分存在,则
\delta J=\frac{\partial}{\partial \alpha}J[y(x)+\alpha \delta y(x)]|_{\alpha = 0}
证明
因为J[y(x)]对增量\delta y(x)产生的变分存在,所以有
\begin{aligned}&\frac{\partial}{\partial \alpha}J[y(x)+\alpha \delta y(x)]|_{\alpha = 0}\\&=\lim_{\alpha \to 0}\frac{J[y(x)+\alpha \delta y(x)]-J[y(x)]}{\alpha}\\&=\lim_{\alpha \to 0}\frac{A[y(x),\alpha \delta y(x)]+B[y(x),\alpha \delta y(x)]}{\alpha}\\&=\lim_{\alpha \to 0}\frac{A[y(x),\alpha \delta y(x)]}{\alpha}+\frac{B[y(x),\alpha \delta y(x)]}{|\alpha \delta y(x)|} \cdot \frac{|\alpha \delta y(x)|}{\alpha}\end{aligned}
由泛函的变分定义得A[y(x),\delta y(x)]是关于\delta y(x)的线性泛函,B[y(x),\delta y(x)]是关于\lVert \delta y \rVert的高阶无穷小量。所以
\mathrm{原式}=\lim_{\alpha \to 0} \frac{A[y(x),\alpha \delta y(x)]}{\alpha}=\frac{\alpha A[y(x), \delta y(x)]}{\alpha}=A[y(x), \delta y(x)]=\delta J
Euler-Lagrange方程
满足Euler-Lagrange方程式函数向量$x^*(t)$成为边值条件固定的Lagrange问题极值解的必要条件。形式如下,
F_x[t,x^*(t),\dot{x}^*(t)]-\frac{\mathrm{d}}{\mathrm{d}t} (F_{\dot{x}}[t,x^*(t),\dot{x}^*(t)])=0
证明
设Langrange问题(lagrange)的极值解为x^*(t)。在令
x(t)=x^*(t)+\alpha \delta x(t)
其中\alpha是一个充分小的量,$\delta x(t)$是满足初值、终值都为零的任意一个二次可微函数向量。将x(t)带入(lagrange)得
J=\int^{t_f}_{t_0} F[t,x^*(t)+\alpha \delta x(t),\dot{x}^*(t)+\alpha \delta \dot{x}(t)]\mathrm{d} t
使用定理2.1得
\begin{aligned}\delta J &=\frac{\partial}{\partial \alpha} \{ \int^{t_f}_{t_0} F[t,x^*(t)+\alpha \delta x(t),\dot{x}^(t)+\alpha \delta \dot{x}(t)]\mathrm{d} t\}\\ &=\int^{t_f}_{t_0} \{F_{x^T}\delta x(t)+F_{\dot{x}^T}\delta \dot{x}(t)\} \mathrm{d}t\\&=\int^{t_f}_{t_0} F_{x^T}\delta x(t) \mathrm{d}t+\int^{t_f}_{t_0} F_{\dot{x}^T}\mathrm{d}(\delta (t))\\&=\int^{t_f}_{t_0} F_{x^T}\delta x(t) \mathrm{d}t-\int^{t_f}_{t_0} \delta x(t) \mathrm{d}F_{\dot{x}^T}+F_{\dot{x}^T} delta x(t) |^{t_f}_{t_0}\end{aligned}
其中单独的F为F[t,x^*(t),\dot{x}^*(t)] 的缩写,第二行使用了全微分,第四行使用了分部积分。这里矩阵求导数结果的形式由分母决定,因为后面要与\delta x相乘,所以导数分母使用x^T。后面不再与\delta x相乘后分母直接使用x。
由于\delta x(t)是满足初值、终值都为零,得
\begin{aligned} \delta J &=\int^{t_f}_{t_0}\{ F_{x^T}-\frac{\mathrm{d}}{\mathrm{d}t}F_{\dot{x}^T}\} \delta x(t) \mathrm{d}t\end{aligned}
为得到极值,令\delta J = 0。因为\delta x(t)为一个任意的函数向量,所以大括号内部分必须等于零才能使积分结果为零,即
F_{x^T}-\frac{\mathrm{d}}{\mathrm{d}t}F_{\dot{x}^T}=0
3 无终端约束的最优控制
考虑系统\dot{x}(t)=f[x(t),u(t),t],为其寻找一组控制信号u(t),使得性能指标J[u]=\Phi [x(t_f),t_f]+\int^{t_f}_{t_0}L[x(t),u(t),t]\mathrm{d}t达到极大值或者极小值。其中t_0,t_f均为常数。
为了把系统本身的关系和评价函数整合在一起,引入一个连续可微的函数向量\lambda(t)称为Lagrange乘子。定义Hamilton函数
H[x(t),u(t),\lambda (t),t]=L[x(t),u(t),t]+\lambda^T(t)f[x(t),u(t),t]
将Hamilton函数带入性能指标得到
J=\Phi-\int^{t_f}_{t_0}(H-\lambda ^T \dot{x})\mathrm{d}t
然后使用分部积分去掉其中的\dot{x}
J=\Phi-\lambda ^T x|^{t_f}_{t_0}+\int^{t_f}_{t_0}(H+\lambda ^Tx)\mathrm{d}t
当u(t)产生一个变分\delta u(t)时,会过程状态和终端状态上产生变分\delta x(t)、\delta x(t_f),从而性能指标也会有个相应的反应\delta J。但是\lambda(t)是一个待定的函数向量,与输入无直接关系。由此得
\delta J=\frac{\partial \Phi}{\partial x_{t_f}} \delta x_{t_f}-\lambda ^T \delta _{x_f}+\int^{t_f}_{t_0}(\frac{\partial H}{\partial x}\delta x+ \frac{\partial H}{\partial u} \delta u+\dot{\lambda}\delta x )\mathrm{d}t
令\lambda(t)满足以下条件
\begin{cases}\lambda=\frac{\partial \Phi}{\partial x_{t_f}} \\\dot{\lambda}=\frac{\partial H}{\partial x}\end{cases}
带回\delta J中得
\delta J=\int^{t_f}_{t_0}\frac{\partial H}{\partial u} \delta u\mathrm{d}t
这样就得到极值条件
\frac{\partial H[x^*(t),u^*(t),\lambda(t),t]}{\partial u^*(t)}=0
其中x^*(t)是最优轨迹,u^*(t)是最优控制信号。
4 参考文献
- 最优控制 钟宜生编著 清华大学出版社
- 变分法(数学学科概念)_百度百科 (baidu.com)
- 变分法 – 维基百科,自由的百科全书 (wikipedia.org)