首页 » 学习 » 变分法

变分法

1 基础概念

泛函
对于向量空间$\mathbf{Y}$内每一个向量$y(x)$,都有一个数与之对应$J[y(x)] \in \mathbf{R}^1$,则称这个数$J[y(x)]$是向量$y(x)$的泛函。

线性泛函
$J[y(x)]$是函数向量空间$\mathbf{Y}$上向量$y(x)$的泛函。如果对于$\forall \alpha , \beta \in \mathbf{R}^1$,均有
\begin{equation*}
J[\alpha y_1(x)+\beta y_2(x)]=\alpha J[y_1(x)]+\beta J[y_2(x)] \quad y_1(x),y_2(x) \in \mathbf{Y}
\end{equation*}
则称$J[y(x)]$是$Y$上的线性泛函

泛函的变分
考虑开函数向量空间$Y$内的泛函$J[y(x)]$,他对定义域内的$y(x)$施加一个充分小的增量$\delta y(x)$产生的变化可以表示为
\begin{equation*}
J[y(x)+\delta y(x)]-J[y(x)]=A[y(x),\delta y(x)]+B[y(x),\delta y(x)]
\end{equation*}
其中$A[y(x),\delta y(x)]$是关于$\delta y(x)$的线性泛函,$B[y(x),\delta y(x)]$是关于$\lVert \delta y \rVert$的高阶无穷小量。则称$A[y(x),\delta y(x)]$为泛函$J[y(x)]$(一阶)变分,简记为$\delta J[y(x)]、\delta J$。$\delta y(x)$称为$y(x)$的变分或宗量的变分。

边值条件固定的Lagrange问题
求二次可微函数向量$x(t)$,使得泛函
\begin{equation}
J=\int^{t_f}_{t_0} F[t,x(t),\dot{x}(t)]\mathrm{d} t
\label{eq:lagrange}\end{equation}
得到极值,并且满足边值条件
\begin{equation*}
x(t_0)=x_0,\quad x(t_f)=x_f
\end{equation*}

2 Euler-Lagrange方程

在开始证明Euler-Lagrange方程前先证明一个定理。

定理 2.1 如果泛函$J[y(x)]$的定义域为开函数向量空间$Y$,其在函数向量$y(x)\in Y$处充分小的增量$\delta y(x) \in Y$产生的变分存在,则
\begin{equation*}
\delta J=\frac{\partial}{\partial \alpha}J[y(x)+\alpha \delta y(x)]|_{\alpha = 0}
\end{equation*}

证明
因为$J[y(x)]$对增量$\delta y(x)$产生的变分存在,所以有
\begin{align*}
&\frac{\partial}{\partial \alpha}J[y(x)+\alpha \delta y(x)]|_{\alpha = 0}\\
&=\lim_{\alpha \to 0}\frac{J[y(x)+\alpha \delta y(x)]-J[y(x)]}{\alpha}\\
&=\lim_{\alpha \to 0}\frac{A[y(x),\alpha \delta y(x)]+B[y(x),\alpha \delta y(x)]}{\alpha}\\
&=\lim_{\alpha \to 0}\frac{A[y(x),\alpha \delta y(x)]}{\alpha}+\frac{B[y(x),\alpha \delta y(x)]}{|\alpha \delta y(x)|} \cdot \frac{|\alpha \delta y(x)|}{\alpha}
\end{align*}
由泛函的变分定义得$A[y(x),\delta y(x)]$是关于$\delta y(x)$的线性泛函,$B[y(x),\delta y(x)]$是关于$\lVert \delta y \rVert$的高阶无穷小量。所以
\begin{equation*}
\mathrm{原式}=\lim_{\alpha \to 0} \frac{A[y(x),\alpha \delta y(x)]}{\alpha}=\frac{\alpha A[y(x), \delta y(x)]}{\alpha}=A[y(x), \delta y(x)]=\delta J
\end{equation*}

Euler-Lagrange方程
满足Euler-Lagrange方程式函数向量$x^*(t)$成为边值条件固定的Lagrange问题极值解的必要条件。形式如下,
\begin{equation*}
F_x[t,x^*(t),\dot{x}^*(t)]-\frac{\mathrm{d}}{\mathrm{d}t} (F_\dot{x}[t,x^*(t),\dot{x}^*(t)])=0
\end{equation*}

证明
设Langrange问题$\eqref{eq:lagrange} $的极值解为$x^*(t)$。在令
\begin{equation*}
x(t)=x^*(t)+\alpha \delta x(t)
\end{equation*}
其中$\alpha$是一个充分小的量,$\delta x(t)$是满足初值、终值都为零的任意一个二次可微函数向量。将$x(t)$带入$\eqref{eq:lagrange} $得
\begin{equation*}
J=\int^{t_f}_{t_0} F[t,x^*(t)+\alpha \delta x(t),\dot{x}^*(t)+\alpha \delta \dot{x}(t)]\mathrm{d} t
\end{equation*}
使用定理2.1得
\begin{align*}
\delta J &=\frac{\partial}{\partial \alpha} \{ \int^{t_f}_{t_0} F[t,x^*(t)+\alpha \delta x(t),\dot{x}^(t)+\alpha \delta \dot{x}(t)]\mathrm{d} t\}\\
&=\int^{t_f}_{t_0} \{F_{x^T}\delta x(t)+F_{\dot{x}^T}\delta \dot{x}(t)\} \mathrm{d}t\\
&=\int^{t_f}_{t_0} F_{x^T}\delta x(t) \mathrm{d}t+\int^{t_f}_{t_0} F_{\dot{x}^T}\mathrm{d}(\delta x(t))\\
&=\int^{t_f}_{t_0} F_{x^T}\delta x(t) \mathrm{d}t-\int^{t_f}_{t_0} \delta x(t) \mathrm{d}F_{\dot{x}^T}+F_{\dot{x}^T} \delta x(t) |^{t_f}_{t_0}
\end{align*}
其中单独的$F$为$F[t,x^*(t),\dot{x}^*(t)]$ 的缩写,第二行使用了全微分,第四行使用了分部积分。这里矩阵求导数结果的形式由分母决定,因为后面要与$\delta x$相乘,所以导数分母使用$x^T$。后面不再与$\delta x$相乘后分母直接使用$x$。
由于$\delta x(t)$是满足初值、终值都为零,得
\begin{align*}
\delta J &=\int^{t_f}_{t_0}\{ F_{x^T}-\frac{\mathrm{d}}{\mathrm{d}t}F_{\dot{x}^T}\} \delta x(t) \mathrm{d}t
\end{align*}
为得到极值,令$\delta J = 0$。因为$\delta x(t)$为一个任意的函数向量,所以大括号内部分必须等于零才能使积分结果为零,即
\begin{equation*}
F_{x^T}-\frac{\mathrm{d}}{\mathrm{d}t}F_{\dot{x}^T}=0
\end{equation*}

3 无终端约束的最优控制

考虑系统$\dot{x}(t)=f[x(t),u(t),t]$,为其寻找一组控制信号$u(t)$,使得性能指标$J[u]=\Phi [x(t_f),t_f]+\int^{t_f}_{t_0}L[x(t),u(t),t]\mathrm{d}t$达到极大值或者极小值。其中$t_0,t_f$均为常数。

为了把系统本身的关系和评价函数整合在一起,引入一个连续可微的函数向量$\lambda(t)$称为Lagrange乘子。定义Hamilton函数
\begin{equation*}
H[x(t),u(t),\lambda (t),t]=L[x(t),u(t),t]+\lambda^T(t)f[x(t),u(t),t]
\end{equation*}

将Hamilton函数带入性能指标得到
\begin{equation*}
J=\Phi-\int^{t_f}_{t_0}(H-\lambda ^T \dot{x})\mathrm{d}t
\end{equation*}
然后使用分部积分去掉其中的$\dot{x}$
\begin{equation*}
J=\Phi-\lambda ^T x|^{t_f}_{t_0}+\int^{t_f}_{t_0}(H+\lambda ^Tx)\mathrm{d}t
\end{equation*}
当$u(t)$产生一个变分$\delta u(t)$时,会过程状态和终端状态上产生变分%\delta x(t)、\delta x(t_f)%,从而性能指标也会有个相应的反应$\delta J$。但是$\lambda(t)$是一个待定的函数向量,与输入无直接关系。由此得
\begin{equation*}
\delta J=\frac{\partial \Phi}{\partial x_{t_f}} \delta x_{t_f}-\lambda ^T \delta x_{x_f}+\int^{t_f}_{t_0}(\frac{\partial H}{\partial x}\delta x+
\frac{\partial H}{\partial u} \delta u+\dot{\lambda}\delta x )\mathrm{d}t
\end{equation*}
令$\lambda(t)$满足以下条件
\begin{cases}
\lambda=\frac{\partial \Phi}{\partial x_{t_f}} \\
\dot{\lambda}=\frac{\partial H}{\partial x}
\end{cases}
带回$\delta J$中得
\begin{equation*}
\delta J=\int^{t_f}_{t_0}\frac{\partial H}{\partial u} \delta u\mathrm{d}t
\end{equation*}
这样就得到极值条件
\begin{equation*}
\frac{\partial H[x^*(t),u^*(t),\lambda(t),t]}{\partial u^*(t)}=0
\end{equation*}
其中$x^*(t)$是最优轨迹,$u^*(t)$是最优控制信号。

4 参考文献

  • 最优控制 钟宜生编著 清华大学出版社



发表评论

电子邮件地址不会被公开。 必填项已用*标注