变分法

变分法是处理泛函的数学领域，和处理函数的普通微积分相对。本文将介绍泛函、线性泛函、泛函的变分、边值条件固定的拉格朗日问题等基础概念。之后将介绍欧拉-拉格朗日 (Euler-Lagrange) 方程及其证明和无约束的最有控制问题。

1 基础概念

泛函
对于向量空间 $\mathbf{Y}$ 内每一个向量 $y(x)$ ，都有一个数与之对应 $J[y(x)] \in \mathbf{R}^1$ ,则称这个数 $J[y(x)]$ 是向量 $y(x)$ 的泛函。

线性泛函
$J[y(x)]$ 是函数向量空间 $\mathbf{Y}$ 上向量 $y(x)$ 的泛函。如果对于 $\forall \alpha , \beta \in \mathbf{R}^1$ ,均有
$J[\alpha y_1(x)+\beta y_2(x)]= \alpha J[y_1(x)]+\beta J[y_2(x)] \quad y_1(x),y_2(x) \in \mathbf{Y}$
则称 $J[y(x)]$ 是 $Y$ 上的线性泛函

泛函的变分
考虑开函数向量空间 $Y$ 内的泛函 $J[y(x)]$ ，他对定义域内的 $y(x)$ 施加一个充分小的增量 $\delta y(x)$ 产生的变化可以表示为
$J[y(x)+\delta y(x)]-J[y(x)]=A[y(x),\delta y(x)]+B[y(x),\delta y(x)]$
其中 $A[y(x),\delta y(x)]$ 是关于 $\delta y(x)$ 的线性泛函， $B[y(x),\delta y(x)]$ 是关于 $\lVert \delta y \rVert$ 的高阶无穷小量。则称 $A[y(x),\delta y(x)]$ 为泛函 $J[y(x)]$ （一阶）变分，简记为 $\delta J[y(x)]、\delta J$ 。 $\delta y(x)$ 称为 $y(x)$ 的变分或宗量的变分。

边值条件固定的Lagrange问题
求二次可微函数向量 $x(t)$ ，使得泛函
$J=\int^{t_f}_{t_0} F[t,x(t),\dot{x}(t)]\mathrm{d} t \tag{lagrange}$
得到极值，并且满足边值条件
$x(t_0)=x_0,\quad x(t_f)=x_f$

2 Euler-Lagrange方程

在开始证明Euler-Lagrange方程前先证明一个定理。

定理 2.1 如果泛函 $J[y(x)]$ 的定义域为开函数向量空间 $Y$ ，其在函数向量 $y(x)\in Y$ 处充分小的增量 $\delta y(x) \in Y$ 产生的变分存在，则
$\delta J=\frac{\partial}{\partial \alpha}J[y(x)+\alpha \delta y(x)]|_{\alpha = 0}$

证明
因为 $J[y(x)]$ 对增量 $\delta y(x)$ 产生的变分存在，所以有
$\begin{aligned}&\frac{\partial}{\partial \alpha}J[y(x)+\alpha \delta y(x)]|_{\alpha = 0}\\&=\lim_{\alpha \to 0}\frac{J[y(x)+\alpha \delta y(x)]-J[y(x)]}{\alpha}\\&=\lim_{\alpha \to 0}\frac{A[y(x),\alpha \delta y(x)]+B[y(x),\alpha \delta y(x)]}{\alpha}\\&=\lim_{\alpha \to 0}\frac{A[y(x),\alpha \delta y(x)]}{\alpha}+\frac{B[y(x),\alpha \delta y(x)]}{|\alpha \delta y(x)|} \cdot \frac{|\alpha \delta y(x)|}{\alpha}\end{aligned}$
由泛函的变分定义得 $A[y(x),\delta y(x)]$ 是关于 $\delta y(x)$ 的线性泛函， $B[y(x),\delta y(x)]$ 是关于 $\lVert \delta y \rVert$ 的高阶无穷小量。所以
$\mathrm{原式}=\lim_{\alpha \to 0} \frac{A[y(x),\alpha \delta y(x)]}{\alpha}=\frac{\alpha A[y(x), \delta y(x)]}{\alpha}=A[y(x), \delta y(x)]=\delta J$

Euler-Lagrange方程
满足Euler-Lagrange方程式函数向量$x^*(t)$成为边值条件固定的Lagrange问题极值解的必要条件。形式如下，
$F_x[t,x^*(t),\dot{x}^*(t)]-\frac{\mathrm{d}}{\mathrm{d}t} (F_{\dot{x}}[t,x^*(t),\dot{x}^*(t)])=0$

证明
设Langrange问题(lagrange)的极值解为 $x^*(t)$ 。在令
$x(t)=x^*(t)+\alpha \delta x(t)$
其中 $\alpha$ 是一个充分小的量，$\delta x(t)$是满足初值、终值都为零的任意一个二次可微函数向量。将 $x(t)$ 带入(lagrange)得
$J=\int^{t_f}_{t_0} F[t,x^*(t)+\alpha \delta x(t),\dot{x}^*(t)+\alpha \delta \dot{x}(t)]\mathrm{d} t$
使用定理2.1得
$\begin{aligned}\delta J &=\frac{\partial}{\partial \alpha} \{ \int^{t_f}_{t_0} F[t,x^*(t)+\alpha \delta x(t),\dot{x}^(t)+\alpha \delta \dot{x}(t)]\mathrm{d} t\}\\ &=\int^{t_f}_{t_0} \{F_{x^T}\delta x(t)+F_{\dot{x}^T}\delta \dot{x}(t)\} \mathrm{d}t\\&=\int^{t_f}_{t_0} F_{x^T}\delta x(t) \mathrm{d}t+\int^{t_f}_{t_0} F_{\dot{x}^T}\mathrm{d}(\delta (t))\\&=\int^{t_f}_{t_0} F_{x^T}\delta x(t) \mathrm{d}t-\int^{t_f}_{t_0} \delta x(t) \mathrm{d}F_{\dot{x}^T}+F_{\dot{x}^T} delta x(t) |^{t_f}_{t_0}\end{aligned}$
其中单独的 $F$ 为 $F[t,x^*(t),\dot{x}^*(t)]$ 的缩写，第二行使用了全微分，第四行使用了分部积分。这里矩阵求导数结果的形式由分母决定，因为后面要与 $\delta x$ 相乘，所以导数分母使用 $x^T$ 。后面不再与 $\delta x$ 相乘后分母直接使用 $x$ 。
由于 $\delta x(t)$ 是满足初值、终值都为零，得
$\begin{aligned} \delta J &=\int^{t_f}_{t_0}\{ F_{x^T}-\frac{\mathrm{d}}{\mathrm{d}t}F_{\dot{x}^T}\} \delta x(t) \mathrm{d}t\end{aligned}$
为得到极值，令 $\delta J = 0$ 。因为 $\delta x(t)$ 为一个任意的函数向量，所以大括号内部分必须等于零才能使积分结果为零，即
$F_{x^T}-\frac{\mathrm{d}}{\mathrm{d}t}F_{\dot{x}^T}=0$

3 无终端约束的最优控制

考虑系统 $\dot{x}(t)=f[x(t),u(t),t]$ ,为其寻找一组控制信号 $u(t)$ ，使得性能指标 $J[u]=\Phi [x(t_f),t_f]+\int^{t_f}_{t_0}L[x(t),u(t),t]\mathrm{d}t$ 达到极大值或者极小值。其中 $t_0,t_f$ 均为常数。

为了把系统本身的关系和评价函数整合在一起，引入一个连续可微的函数向量 $\lambda(t)$ 称为Lagrange乘子。定义Hamilton函数
$H[x(t),u(t),\lambda (t),t]=L[x(t),u(t),t]+\lambda^T(t)f[x(t),u(t),t]$

将Hamilton函数带入性能指标得到
$J=\Phi-\int^{t_f}_{t_0}(H-\lambda ^T \dot{x})\mathrm{d}t$
然后使用分部积分去掉其中的 $\dot{x}$
$J=\Phi-\lambda ^T x|^{t_f}_{t_0}+\int^{t_f}_{t_0}(H+\lambda ^Tx)\mathrm{d}t$
当 $u(t)$ 产生一个变分 $\delta u(t)$ 时，会过程状态和终端状态上产生变分 $\delta x(t)、\delta x(t_f)$ ,从而性能指标也会有个相应的反应 $\delta J$ 。但是 $\lambda(t)$ 是一个待定的函数向量，与输入无直接关系。由此得
$\delta J=\frac{\partial \Phi}{\partial x_{t_f}} \delta x_{t_f}-\lambda ^T \delta _{x_f}+\int^{t_f}_{t_0}(\frac{\partial H}{\partial x}\delta x+ \frac{\partial H}{\partial u} \delta u+\dot{\lambda}\delta x )\mathrm{d}t$
令 $\lambda(t)$ 满足以下条件
$\begin{cases}\lambda=\frac{\partial \Phi}{\partial x_{t_f}} \\\dot{\lambda}=\frac{\partial H}{\partial x}\end{cases}$
带回 $\delta J$ 中得
$\delta J=\int^{t_f}_{t_0}\frac{\partial H}{\partial u} \delta u\mathrm{d}t$
这样就得到极值条件
$\frac{\partial H[x^*(t),u^*(t),\lambda(t),t]}{\partial u^*(t)}=0$
其中 $x^*(t)$ 是最优轨迹， $u^*(t)$ 是最优控制信号。

1 基础概念

2 Euler-Lagrange方程

3 无终端约束的最优控制

4 参考文献

发表回复取消回复

变分法

1 基础概念

2 Euler-Lagrange方程

3 无终端约束的最优控制

4 参考文献

发表回复 取消回复

发表回复取消回复