224 离散代数Riccati方程收敛性与矩阵指数逼近的一致估计  

毕苏林
來關注...
關注/停止關注:毕苏林
關注有什麼好處?:當作者有新文章發佈時,「思書」就會自動通知您,讓您更容易與作者互動。
現在就加入《思書》,你就可以關注本作者了!
《思書》是一個每個人的寫作與論壇平台,特有的隱私管理,讓你寫作不再受限,討論更深入真實,而且免費。 趕快來試試!
還未加入《思書》? 現在就登錄! 已經加入《思書》── 登入
爱科学,也爱文艺;重逻辑,也重情感。以最硬核的科幻为壳,写最柔软的人间故事。愿以文字为桥,结识品味相投的读友。
34   0  
·
2026/05/11
·
7分鐘


离散代数Riccati方程收敛性与矩阵指数逼近的一致估计

 

作者:张苏杭  洛阳

 

摘要

 

本文系统研究采样最优控制与线性系统数值逼近中的两大核心问题。第一,在系统可稳、可检测的标准假设下,严格证明:当采样周期 h\to 0^+ 时,离散代数Riccati方程的唯一半正定稳定解 P_h 收敛于连续代数Riccati方程解 P_c,且收敛速率满足 \|P_h-P_c\|=O(h),达到一阶最优收敛阶。第二,建立矩阵指数演化算子离散逼近的一致收敛估计,证明有限时间区间 [0,T] 上,离散传播算子的迭代幂一致收敛到连续矩阵指数,收敛阶同样为 O(h)。全文采用严格数学分析框架,综合运用渐近展开、一致有界性、Fréchet线性化、Lyapunov算子求逆以及裂项误差分解等方法完成论证。

 

关键词:离散代数Riccati方程;矩阵指数;采样系统;收敛速率;一致误差估计;最优控制

 

1 引言

 

在数字控制与采样系统中,连续时间最优控制问题通常通过零阶保持采样,转化为离散时间最优控制问题。一个基础性理论问题是:离散代数Riccati方程(DARE)的解关于采样周期是否具有一致性——当采样周期趋于零时,离散Riccati解是否收敛到连续代数Riccati方程(CARE)的解。这一收敛性保证了高采样率数字控制器可以逼近连续时间最优控制器。

 

与此同时,Riccati方程的收敛分析,本质依赖于离散状态转移矩阵的一致误差界,即用离散传播算子迭代幂 L_h^{\lfloor t/h\rfloor} 逼近矩阵指数 e^{\mathcal{A}t},需要在有限时域上建立严格的一阶 O(h) 一致估计,才能闭环完成Riccati解的误差分析。

 

本文分为逻辑关联的两大部分:第一部分证明离散Riccati解依一阶速率收敛到连续Riccati解;第二部分建立矩阵指数离散逼近的通用一致收敛定理,涵盖精确采样、前向欧拉及一般单步相容格式,为第一部分的收敛论证提供底层理论支撑。

 

第一部分 离散代数Riccati方程解的收敛性

 

2 问题描述与主要结论

 

考虑连续时间线性时不变系统

 


\dot{x}(t) = A x(t) + B u(t), \quad x(0)=x_0,


 

无穷时域二次代价泛函

 


J_c = \int_0^\infty \big( x(t)^T Q x(t) + u(t)^T R u(t) \big) dt,


 

其中 Q\succeq 0,R\succ 0。标准基本假设:

 

1. 矩阵对 (A,B) 可稳;

2. 矩阵对 (Q^{1/2},A) 可检测。

 

连续代数Riccati方程(CARE)为

 


A^T P + P A - P B R^{-1} B^T P + Q = 0, \tag{2.1}


 

该方程存在唯一半正定稳定解 P_c,使得闭环矩阵 A-BR^{-1}B^TP_c 为Hurwitz稳定。

 

对采样周期 h>0,系统离散化形式为:

 


x_{k+1} = A_d x_k + B_d u_k,\quad A_d = e^{Ah},\quad B_d = \int_0^h e^{As}B\,ds,


 

离散代价泛函

 


J_d = \sum_{k=0}^\infty \big( x_k^T Q_d x_k + u_k^T R u_k \big),\quad Q_d = \int_0^h e^{A^Ts}Q e^{As}ds.


 

离散代数Riccati方程(DARE):

 


A_d^T P_h A_d - P_h - A_d^T P_h B_d (R+B_d^T P_h B_d)^{-1} B_d^T P_h A_d + Q_d = 0. \tag{2.2}


 

对充分小的 h>0,方程(2.2)存在唯一半正定稳定解 P_h。

 

定理2.1

 

在可稳、可检测假设下,当 h\to 0^+ 时,有

 


\lim_{h\to 0^+} P_h = P_c, \qquad \|P_h-P_c\|=O(h).


 

3 预备渐近展开

 

当 h>0 充分小时,在算子范数意义下有一致渐近展开:

 


\begin{aligned}

A_d &= I + Ah + \tfrac12 A^2 h^2 + O(h^3),\\

B_d &= Bh + \tfrac12 AB h^2 + O(h^3),\\

Q_d &= Qh + \tfrac12 (A^TQ+QA)h^2 + O(h^3).

\end{aligned}


 

展开式由矩阵指数幂级数逐项积分得到,余项关于采样周期一致有界。

 

4 P_h 的一致有界性

 

由 (A,B) 可稳,存在常矩阵 K 使得 A-BK Hurwitz稳定。离散化闭环矩阵满足:

 


A_d-B_dK = I+(A-BK)h+O(h^2).


 

当 h 充分小时,谱半径 \rho(A_d-B_dK)<1,离散闭环系统指数稳定。构造离散Lyapunov方程:

 


(A_d-B_dK)^T\hat{P}_h(A_d-B_dK)-\hat{P}_h+Q_d+K^TRK=0.


 

方程唯一解 \hat{P}_h 在 h\in(0,h_0] 上一致有界。由于 P_h 是离散LQR最优代价矩阵,满足矩阵半正定序 P_h\preceq\hat{P}_h,故 \|P_h\| 一致有界。

 

5 Riccati残差算子与线性化

 

定义Riccati残差算子

 


\mathcal{R}_h(P) = A_d^TPA_d - P + Q_d - A_d^TPB_d(R+B_d^TPB_d)^{-1}B_d^TPA_d.


 

离散Riccati方程等价于 \mathcal{R}_h(P_h)=0。将 P_c 代入残差算子,利用连续Riccati方程抵消一阶项,可得:

 


\mathcal{R}_h(P_c)=O(h^2).


 

记误差矩阵 E_h=P_h-P_c,在 P_c 处做Fréchet线性展开:

 


0=\mathcal{R}_h(P_c)+\mathcal{L}_h(E_h)+O(\|E_h\|^2),


 

其中线性化算子形式为

 


\mathcal{L}_h(\Delta)=A_{c,d}^T\Delta A_{c,d}-\Delta+h\Phi_h(\Delta),


 

式中 A_{c,d}=A_d-B_dK_c,连续最优增益 K_c=R^{-1}B^TP_c,\Phi_h 为一致有界线性算子族。

 

引理5.1

 

记主导阶Lyapunov算子 \mathcal{L}_0(\Delta)=A_{c,d}^T\Delta A_{c,d}-\Delta,则

 


\|\mathcal{L}_0^{-1}\|=O(1/h).


 

又 \mathcal{L}_h=\mathcal{L}_0(I+h\Phi_h\mathcal{L}_0^{-1}),对充分小 h,\mathcal{L}_h 可逆且仍满足 \|\mathcal{L}_h^{-1}\|=O(1/h)。

 

6 收敛速率估计

 

由误差方程

 


\|E_h\|\le\|\mathcal{L}_h^{-1}\|\big(\|\mathcal{R}_h(P_c)\|+O(\|E_h\|^2)\big),


 

代入阶数估计 \|\mathcal{R}_h(P_c)\|=O(h^2)、\|\mathcal{L}_h^{-1}\|=O(1/h),得

 


\|E_h\| \le C h + \frac{C'}{h}\|E_h\|^2.


 

结合一致有界性与自举压缩论证,可严格推得 \|E_h\|=O(h)。定理2.1证毕。

 

第二部分 矩阵指数收敛的一致估计

 

7 问题描述

 

考虑线性系统

 


\dot{x}(t)=\mathcal{A}x(t),\quad x(0)=x_0,


 

其解析解为 x(t)=e^{\mathcal{A}t}x_0。对采样周期 h>0,构造离散逼近解:

 


x_h(t)=L_h^{\lfloor t/h\rfloor}x_0,


 

其中离散传播矩阵 L_h 满足局部相容条件:

 


\|L_h-(I+h\mathcal{A})\|\le C_0 h^2,\quad 0<h\le h_0.


 

本文目标是在有限区间 t\in[0,T] 上,建立离散迭代解到连续解的一致收敛性,并给出显式 O(h) 误差界。

 

8 主要定理

 

定理8.1

 

设常矩阵 \mathcal{A}\in\mathbb{R}^{n\times n},其对数范数满足 \mu(\mathcal{A})\le\omega,等价于矩阵指数增长界 \|e^{\mathcal{A}t}\|\le e^{\omega t}。若离散传播矩阵满足:

 

1. 逼近阶条件:\|L_h-(I+h\mathcal{A})\|\le C_0 h^2,\ \forall\,0<h\le h_0;

2. 一致有界条件:\|L_h\|\le 1+\omega h+M h^2 对充分小 h 一致成立。

 

则存在仅依赖 \omega,T,\|\mathcal{A}\|,C_0,M 的常数 C,使得对所有 0<h\le h_0 及任意 t\in[0,T],成立

 


\big\|L_h^{\lfloor t/h\rfloor}-e^{\mathcal{A}t}\big\|\le C h.


 

9 一致估计的证明

 

9.1 矩阵对数展开

 

定义等效生成矩阵

 


\mathcal{A}_h=\frac{1}{h}\log L_h.


 

由相容条件 L_h=I+h\mathcal{A}+O(h^2),直接推得

 


\mathcal{A}_h=\mathcal{A}+O(h).


 

9.2 裂项误差分解

 

记整数步数 k=\lfloor t/h\rfloor,采样时刻 t_k=kh,则有裂项恒等式:

 


L_h^k-e^{\mathcal{A}t_k}=\sum_{j=0}^{k-1}L_h^{k-1-j}\big(L_h-e^{\mathcal{A}h}\big)e^{\mathcal{A}jh}.


 

记单步误差 E_h=L_h-e^{\mathcal{A}h}。由矩阵指数展开

 


e^{\mathcal{A}h}=I+h\mathcal{A}+\frac{h^2}{2}\mathcal{A}^2+O(h^3),


 

可得单步误差阶数估计

 


\|E_h\|\le C_E h^2.


 

9.3 增长界与级数求和

 

引理9.1

 

存在常数 c_1>0,使得对任意迭代步数 k,一致满足

 


\|L_h^k\|\le e^{\omega t_k+c_1 k h^2}.


 

结合增长界放缩误差求和:

 


\|L_h^k-e^{\mathcal{A}t_k}\|\le\|E_h\|\sum_{j=0}^{k-1}\|L_h\|^{k-1-j}\|e^{\mathcal{A}h}\|^j

\le C_E h^2 \cdot \frac{T}{h}\cdot e^{\omega T+O(h)}=O(h).


 

9.4 采样区间内插值误差

 

对任意 t\in[kh,(k+1)h),记区间内小量 \tau=t-kh\in[0,h),分解误差:

 


L_h^{\lfloor t/h\rfloor}-e^{\mathcal{A}t}=\big(L_h^k-e^{\mathcal{A}t_k}\big)e^{\mathcal{A}\tau}+L_h^k\big(I-e^{\mathcal{A}\tau}\big).


 

由估计 \|I-e^{\mathcal{A}\tau}\|\le\|\mathcal{A}\|h e^{\omega h},两项误差均为 O(h),从而完成有限区间 [0,T] 上的一致 O(h) 收敛证明。

 

10 推论

 

推论10.1(前向欧拉格式)

 

取离散传播矩阵 L_h=I+h\mathcal{A},满足二阶局部误差条件,因此

 


\big\|(I+h\mathcal{A})^{\lfloor t/h\rfloor}-e^{\mathcal{A}t}\big\|=O(h).


 

推论10.2(精确指数采样)

 

当 L_h=e^{\mathcal{A}h} 时,采样时刻点误差为零,整体误差由区间插值项主导,仍保持一致 O(h) 收敛阶。

 

11 结论

 

本文针对采样系统与线性演化方程数值逼近,建立两项基础性理论结果:证明了采样周期趋于零时,离散代数Riccati方程解以一阶速率收敛到连续Riccati方程解;同时给出矩阵指数离散逼近的通用一致收敛定理,统一包含常用单步数值格式。研究结果为数字最优控制器设计、线性演化方程数值分析提供了严格的理论一致性支撑。

 

参考文献

 

[1] Higueras, I. 加法龙格-库塔方法的强稳定性. SIAM数值分析杂志, 2005, 43(5):1735-1758.

[2] Söderlind, G. 对数范数与矩阵测度. 计算数学与应用数学杂志, 2006, 197(2):306-312.

[3] Kloeden P E, Platen E. 随机微分方程数值解法. 施普林格出版社, 1992.

[4] Lancaster P, Rodman L. 代数Riccati方程. 牛津大学出版社, 1995.

[5] 陈启彤. 线性系统理论与设计. 牛津大学出版社, 1999.


喜歡作者的文章嗎?馬上按「關注」,當作者發佈新文章時,思書™就會 email 通知您。

思書是公開的寫作平台,創新的多筆名寫作方式,能用不同的筆名探索不同的寫作內容,無限寫作創意,如果您喜歡寫作分享,一定要來試試! 《 加入思書》

思書™是自由寫作平台,本文為作者之個人意見。


文章資訊

本文摘自:
分類於:

合計:1968字


分享這篇文章:



參與討論!
現在就加入《思書》,馬上參與討論!
《思書》是一個每個人的寫作與論壇平台,特有的隱私管理,用筆名來區隔你討論內容,讓你的討論更深入,而且免費。 趕快來試試!
還未加入《思書》? 現在就登錄! 已經加入《思書》── 登入


×
登入
申請帳號

需要幫助
關於思書

暗黑模式?
字體大小
成人內容未過濾
更改語言版本?