18th June 2024, 17 min read

Stabilitätsfunktionale und Semistabilitätsfunktionale

Original post is here eklausmeier.goip.de/blog/2024/06-18-stabilitaetsfunktionale-und-semistabilitaetsfunktionale.

1. Semistabilitätsfunktionale in Matrixdarstellung
2. Bemerkungen zum Spijkerschen Stabilitätsfunktional

1. Semistabilitätsfunktionale in Matrixdarstellung

Mit Ausnahme der Booleschen Algebra wird keine Theorie in der Mathematik universeller benutzt als die lineare Algeba. Es gibt kaum eine Theorie, die elementarer ist, trotz der Tatsache, daß Generationen von Professoren und Lehrbuchautoren die Einfachheit dieser Theorie durch höchst unangebrachte Berechnungen mit Matrizen verdunkelt haben.

Jean Alexandre Dieudonné (1960)

Man kann beweisen, man vgl. z.B. das Buch Albrecht (1979), oder den Aufsatz von Skeel (1976), daß die Norm $|\mathbb{P}\delta|$ Stabilitätsfunktional ist für Verfahren der allgemeinen Form

$$ z_{n+1} = Sz_n + h\varphi_n, \qquad z_i\in\mathbb{R}^s,\quad\hbox{und}\quad S\in\mathbb{R}^{s\times s}. $$

Man hat also Fehlerabschätzungen der Art

$$ c_1\|\mathbb{P}\delta\| \le \|Z-z\| \le c_2\|\mathbb{P}\delta\|. % \qquad\forall n\in\mathbb{N}_0. $$

$\mathbb{P}$ ist eine Block-Toeplitz Matrix, siehe weiter unten. Hierbei ist $Z=(Z_1,\ldots,Z_n)$ der entsprechende Vektor der exakten Lösungen und $z=(z_1,\ldots,z_n)$, die durch obige Verfahrensvorschrift gewonnene Näherung hierfür.

Diese doppelseitige Abschätzung ist insoweit von besonderer Bedeutung, da sie sofort verständlich macht, daß die berechnete Näherung sich nicht beliebig weit von der exakten Lösung entfernen kann, wenn man die Größe $\delta$ “klein” hält. Wichtig ist natürlich, daß die linke Konstante $c_1$ nicht verschwinden darf, also $c_1\ne0$ und daß die rechte Konsrtante $c_2$ nicht zu “groß” ist, also $c_2<\infty$. Ferner ist zu berücksichtigen, daß beide Konstanten $c_1$ und $c_2$ nicht selber von der Größe $\delta$ abhängen.

Die obige Verfahrensvorschrift $z_{n+1}=Sz_n+h\varphi$ ist recht allgemein. Hier genügt vollkommen die Verfahrensvorschrift

$$ %=Sz_n+h\varphi +A_0z_n = h(B_LF_{n+1}+B_UF_n) \sum_{i=0}^\kappa A_iz_{n+i} = h\sum_{i=0}^\kappa B_iF_{n+i}, \qquad n=0,1,\ldots, $$

mit den Matrizen $A_i,B_i\in\mathbb{R}^{s\times s}$ und entsprechenden Vektoren $z_{n+i},F_{n+i}\in\mathbb{R}^s$.

Es ist sofort offensichtlich, daß die obige Verfahrensvorschrift in der Vorschrift $z_{n+1}=Sz_n+h\varphi_n$ natürlich enthalten ist. Selbstverständlich hängt die Steuerungsfunktion auch von der Zeit $t_n$ ab, möglicherweise auch noch von weiteren Größen. Alle diese einfliessenden Parameter seien in der Schreibweise unterdrückt.

Das allgemeinene Stabilitätsfunktional $\psi$, für welches gilt

$$ c_1\psi(\delta_n) \le \|Y_n-y_n\| \le c_2\psi(\delta_n), $$

muß nicht notwendig eine Norm sein.

Es müssen also nicht die Bedingungen der Definitheit und die der Homogenität und die Dreiecksungleichung erfüllt sein. Das Funktional $\psi$ hängt natürlich von zahlreichen Größen ab, ist also eine Funktion mehrerer Veränderlicher. Diese ganzen Abhängigkeiten werden aber in der weiteren Schreibweise nicht gesondert alle aufgeführt. Unter Berücksichtigung der Argumente hätte man zu schreiben

$$ \psi = \psi(n,h,A_i,\delta), $$

dabei hängen die Matrizen $A_i$ von den Koeffizienten $\alpha_{ij}$ des Verfahrens ab und der Vektor $\delta$ hängt ab von der Matrix $S$ und den Matrizen $B_i$.

Bei der folgenden diskreten Fassung der Kontrollgleichung

$$ z_{n+1}=Az_n+u_n $$

wird nun das Stabilitätsverhalten weiter betrachtet. Es ist hierbei $z_n$ der Vorzustand, $z_{n+1}$ der Folgezustand und $u_n$ die Steuerungsgröße. Von Interesse sei jetzt lediglich der innere Zustand, nicht jedoch der Ausgang des obigen Systems. Häufig ist der Ausgang von der Form $x_n=Bz_n$.

Man erhält jetzt nacheinander

$$ \eqalign { z_1 &= Az_0+u_0, \cr z_2 &= Az_1+u_1 = A^2z_0+Au_0+u_1, \cr z_3 &= Az_2+u_2 = A^3z_0+A^2u_0+Au_1+u_2, \cr \vdots & \qquad \qquad \vdots \qquad \qquad \qquad \qquad \ddots\cr %\noalign{\hbox to 8cm{\dotfill}} z_k &= Az_{k-1}+u_{k-1} = A^kz_0+A^{k-1}u_0+\cdots+Au_{k-2}+A^0u_{k-1}. } $$

Schreibt man dies in Matrix-Vektor Schreibweise auf, so erhält man

$$ \pmatrix{z_1\cr z_2\cr z_3\cr \vdots\cr z_k\cr} = %\left( \vcenter{\offinterlineskip\halign { % \strut$#$\quad & \vrule# && \quad$#$\cr \left( \begin{array}{c|ccccc} A && A^0 & & & & \cr A^2 && A^1 & A^0 & & 0 & \cr A^3 && A^2 & A^1 & A^0 & & \cr \vdots && \vdots & \vdots & \vdots & \ddots & \cr A^k && A^{k-1} & A^{k-2} & A^{k-3} & \ldots & A^0\cr %}} \end{array} \right) \pmatrix{z_0\cr u_0\cr u_1\cr \vdots\cr u_{k-1}\cr} = \pmatrix{A\cr A^2\cr A^3\cr \vdots\cr A^k\cr} z_0 + \mathbb{P} \pmatrix{u_0\cr u_1\cr \vdots\cr u_{k-1}\cr}, $$

wobei hier die Block-Toeplitz-Dreiecksmatrix $\mathbb{P}$ auftaucht, mit

$$ \mathbb{P} = \pmatrix{ A^0 & & & & \cr A^1 & A^0 & & 0 & \cr A^2 & A^1 & A^0 & & \cr \vdots & \vdots & \vdots & \ddots & \cr A^{k-1} & A^{k-2} & A^{k-3} & \ldots & A^0\cr } . $$

Otto Toeplitz (1881--1940).

Wichtig ist zu vermerken, daß diese Block-Dreicksmatrix $\mathbb{P}$ von der Iterationsstufe $k$ abhängt, insbesondere wird die Matrix dimensionsmässig größer, mit größer werdendem $k$; es ist $\mathbb{P}\in\mathbb{R}^{ks\times ks}$.

Man erkennt, wie die alten Steuerungen $u_0,u_1,\ldots,u_{k-1}$ nachwirken, nämlich in Matrixpotenzen

$$ A^k, A^{k-1},\ldots, A, A^0. $$

Die Überlegungen gelten sinngemäß, wenn man die Matrix $A$ selber abhängig vom Index $n$ hält. Dies heißt also, daß sich die Systemzustandsüberführung jedesmal ändern kann. Man hat also die Kontrollgleichung

$$ z_{n+1} = A_nz_n+u_n. $$

Hier erhält man dann ganz genauso wie oben, der Reihe nach ausgehend vom Anfangszustand $z_0$:

$$ \eqalign{ z_1 &= A_0z_0+u_0, \cr z_2 &= A_1A_0z_0+A_1u_0+u_1, \cr z_3 &= A_2A_1A_0z_0+A_2A_1u_0+A_2u_1+u_2, \cr \vdots & \qquad \vdots \qquad \qquad \qquad \ddots \cr %\noalign{\hbox to 10cm{\dotfill}} z_k &= A_{k-1}z_{k-1}+u_{k-1} = A_{k-1}\cdots A_0z_0+A_{k-1}\cdots A_1u_0 +\ldots+A_{k-1}u_{k-2}+u_{k-1}.\cr } $$

Wiederum in Matrix-Vektor Schreibweise ergibt dies

$$ \pmatrix{z_1\cr z_2\cr z_3\cr \vdots\cr z_k\cr} = \left ( \begin{array}{c|ccccc} A_0 && I & & & & \cr A_1A_0 && A_1 & I & & 0 & \cr A_2A_1A_0 && A_2A_1 & A_2 & I & & \cr \vdots && \vdots & \vdots & \vdots & \ddots & \cr A_{k-1}\cdots A_0 && A_{k-1}\cdots A_1 & A_{k-1}\cdots A_2 & A_{k-1}\cdots A_3 & \ldots & I\cr \end{array} \right ) \pmatrix{z_0\cr u_0\cr u_1\cr \vdots\cr u_{k-1}\cr}. $$

Auch hier erkennt man den Einfuß vergangener Steuerungen $u_0,u_1,\ldots,u_{k-1}$ auf den neuen Zustand $z_k$, nämlich nun als Matrizenprodukt (im Gegensatz zu den Matrixpotenzen) zu

$$ (A_{k-1}\cdots A_0), (A_{k-1}\cdots A_1), \ldots, (A_{k-1}), I. $$

Interpretiert man jetzt die Steuerungen $u_i$ als Störungen $\delta_i$ des schon oben angegebenen Verfahrens $z_{n+1}=Az_n+h\varphi$, untersucht man also die veränderte Steuerungsgleichung

$$ \tilde z_{n+1} = A\tilde z_n + h\tilde\varphi_n + \delta_n, $$

so erkennt man, wie sich diese Störungen aufsammeln und “aufaddieren”. Entscheidend ist hier ist also wieder die Block-Toeplitz-Dreiecksmatrix $\mathbb{P}$, mit

$$ \mathbb{P} = \pmatrix{ A^0 & & & & \cr A^1 & A^0 & & 0 & \cr A^2 & A^1 & A^0 & & \cr \vdots & \vdots & \vdots & \ddots & \cr A^{k-1} & A^{k-2} & A^{k-3} & \ldots & A^0\cr } , $$

bzw. für den allgemeineren Falle hat die Block-Dreiecksmatrix $\mathbb{P}$ die Gestalt, nicht notwendig eine Toeplitz-Matrix,

$$ \mathbb{P} = \pmatrix{ I & & & & \cr A_1 & I & & 0 & \cr A_2A_1 & A_2 & I & & \cr \vdots & \vdots & \vdots & \ddots & \cr A_{k-1}\cdots A_1 & A_{k-1}\cdots A_2 & A_{k-1}\cdots A_3 & \ldots & I\cr }, $$

welche beide von der Iterationsstufe $k$ abhängig sind, also wie oben $\mathbb{P}\in\mathbb{R}^{ks\times ks}$. Die Matrix $\mathbb{P}$ ist hier offensichtlich wegen $-Az_n+z_{n+1}={}*$, ($n=0,1,\ldots$) die Inverse der Matrix

$$ \mathbb{P}^{-1} = \pmatrix{ I & & &\llap0\cr -A & I & & \cr & -A & I & \cr &\ddots&\ddots& \cr 0 & & -A & I\cr} \qquad\hbox{bzw.}\qquad \mathbb{P}^{-1} = \pmatrix{ I & & &\llap0\cr -A_1 & I & & \cr & -A_2 & I & \cr &\ddots &\ddots & \cr 0 & & -A_{k-1} & I\cr} $$

Die Sammelwirkung der Steuerungen, bzw. der Störungen, hängt nun ab von $\mathbb{P}\delta$, mit

$$ \delta = \pmatrix{\delta_0\cr \vdots\cr \delta_{k-1}\cr}. $$

Würde man das lineare und homogene Gleichungsystems $\mathbb{P}\delta=0$ betrachten und nach den $\delta_i$ auflösen, so erhielte man das Ergebnis, daß die $\delta_0,\ldots,\delta_{k-1}$ gerade die Jordan-Kette der Länge $k$ ist, bzgl. $\lambda_0$ für das Matrixpolynom $L(\lambda)$, wenn man von der Feinheit absieht, daß man u.U. die ersten $i$-Nullvektoren $\delta_0,\ldots,\delta_{i-1}$ wegstreicht. Bibliographisch: Keldysh, M.V., Jordan, Camille (1838--1921)

Hierbei ist das Matrixpolynom $L(\lambda)$ gegeben durch

$$ L(\lambda) = \sum_{i=0}^{k-1} A^i(\lambda-\lambda_0)^i , % = A^{k-1}(\lambda-\lambda_0)^{k-1}+\ldots+A(\lambda-\lambda_0)+I, $$

man siehe hierzu Gohberg/Lancaster/Rodman (1982). Autoren sind Gohberg, Izrael' TSudikovich, Lancaster, Peter und Rodman, Leiba.

Für den allgemeineren Fall, daß man in jedem Zustand eine neue Matrix $A_n$ betrachtet, also $z_{n+1}=A_nz_n+u_n$, ergibt sich das Matrixplynom $L(\lambda)$ zu

$$ L(\lambda) = \sum_{i=0}^{k-1}{\mskip 3mu} (\prod_{j=0}^i A_j) \cdot(\lambda-\lambda_0)^i. $$

Man sieht sofort, daß für das Spektrum $\sigma(\mathbb{P})$ stets gilt, daß $\sigma(\mathbb{P})=\{1\}$ und zwar unabhängig von den Matrizen $A_0,\ldots,A_k$.

Insbesondere ist die Block-Dreiecksmatrix $\mathbb{P}$ invertierbar und somit ist $\left\Vert\mathbb{P}{}\cdot{}\right\Vert$, für festes $k$, eine Norm, da ganz allgemein für jede Vektornorm gilt, daß mit $\left\Vert\cdot\right\Vert$ auch für eine beliebige invertierbare Matrix $P$ dann ebenfalls $\left\Vert Px\right\Vert$ eine Norm ist. Dabei geht die Invertierbarkeit für die Definitheit ein und die Linearität wird für die Homogenität und die Dreiecksungleichung benötigt.

Das weitergehende Resultat, daß dann für die zugehörige Matrixnorm $\left\Vert A\right\Vert$ entsprechend $\left\Vert PAP^{-1}\right\Vert$ die zugehörige Matrixnorm zu $\left\Vert Px\right\Vert$ ist, kann man leicht beweisen. Dennoch wird dieses Ergebnis hier nicht weiter verwendet. Somit hat man ohne Mühe die Aussage erhalten, daß das Stabilitätsfunktional $\psi(\delta)=\Vert\mathbb{P}\delta\Vert$ tatsächlich eine Norm ist.

Will man nun zu einer Abschätzung für $\Vert z_{n+1}-\tilde z_{n+1}\Vert$ gelangen und beachtet man, daß man ja eine explizite Darstellung der Lösungen hat, so ergibt sich zunächst für $z_{n+1}=Az_n+u_n$ die Darstellung

$$ Z_{n+1} = \pmatrix{A\cr \vdots\cr A^{n+1}\cr} z_0 + \mathbb{P}\pmatrix{u_0\cr \vdots\cr u_n\cr} =: Tz_0+\mathbb{P} u. $$

Für das gestörte System $\tilde z_{n+1} = A\tilde z_n+v_n$ mit den “veränderten” Steuerungen $v_i$ erhält man die Darstellung

$$ \tilde Z_{n+1} = \pmatrix{A\cr \vdots\cr A^{n+1}\cr} \tilde z_0 + \mathbb{P}\pmatrix{v_0\cr \vdots\cr v_n\cr} =: T\tilde z_0+\mathbb{P} v. $$

Hier sind wieder die einzelnen Vektoren $z_i$, bzw. die $\tilde z_i$, zu einem größerem Vektor $Z_{n+1}$, bzw. $\tilde Z_{n+1}$, zusammengefaßt. Es ist also

$$ Z_{n+1} = \pmatrix{z_1\cr \vdots\cr z_{n+1}\cr} \qquad\hbox{und}\qquad \tilde Z_{n+1} = \pmatrix{\tilde z_1\cr \vdots\cr \tilde z_{n+1}\cr}. $$

Die Differenz der beiden oben angegebenen Darstellungen führt nun direkt auf

$$ \|Z_{n+1}-\tilde Z_{n+1}\| = \left\|T(z-\tilde z_0)+\mathbb{P}(u-v)\right\| \le \left\|T\right\|{\mskip 3mu} \left\|z_0-\tilde z_0\right\| + \left\|\mathbb{P}\right\|{\mskip 3mu} \left\|u-v\right\|. $$

Da die Matrizen $T$ und $\mathbb{P}$ von der Iterationsstufe $k$ abhängen, sind Einschränkungen an die Komponenten dieser beiden Matrizen zu stellen. Es werde jetzt an die Matrixpotenz $A^i$ oder an die Produkte $A_k\cdots A_{k-i}$ die Forderung gestellt, daß ihre Normen, für alle $i$ und alle $k$ beschränkt seien. Es solle also gelten, daß

$$ \|A^i\| \le \hbox{const}, \quad\forall i\in\mathbb{N}_0; $$

oder allgemeiner

$$ \left\|A_k\cdots A_{k-i}\right\| \le \hbox{const}, \quad\forall i\lt k,\forall k. $$

Im Lichte der obigen Bauart der oben angegebenen Block-Dreiecksmatrix $\mathbb{P}$, sind diese beiden Forderungen sofort offenkundig sinnvolle Einschränkungen, da die obigen Matrixpotenzen, bzw. Matrixprodukte, die Komponenten der Block-Dreiecksmatrix $\mathbb{P}$ ausmachen. Die erste Bedingung führt dann sofort auf die entsprechende Bedingung an die Eigenwerte der Matrix $A$. Die zweite Bedingung ist diffiziler.

Es zeigt sich nun, daß diese beiden Forderungen genügen, sodaß auch die Normen von $\mathbb{P}$ und $T$ trotz größer werdendem $k$, nicht zu stark wachsen. Man beachte strikt, daß sich die Normen ändern, mit größer werdendem $k$. Die sonst recht triviale Aussage, daß die Norm einer festen, beliebigen Matrix stets beschränkt ist, gilt hier nicht.

Vielmehr gilt: $\left|\mathbb{P}\right|={\cal O}(k)$, oder in anderer Formulierung, es ist

$$ {1\over k}\left\|\mathbb{P}\right\| \le \hbox{const}, \qquad\forall k\in\mathbb{N}_0. $$

Der Nachweis werde nur für die Maximumnorm $\left|\cdot\right|_\infty$ geführt. Exakterweise müßte man natürlich stets Supremumsnorm notieren, dennoch sei diese Feinheit von jetzt ab nicht näher beachtet. Da $|A^j|\le c$, $\forall j\in\mathbb{N}_0$ ergibt sich

$$ \left\|\mathbb{P}\right\|_\infty \le\max_{i=0}^{k-1}{\mskip 3mu} \sum_{j=0}^{k-1} c = kc = {\cal O}(k). $$

Für die 1-Norm $\left\Vert\cdot\right\Vert_1$ ergibt sich dieses Resultat ganz analog. Dies hängt mit der speziellen Gestalt der Matrix $\mathbb{P}$ zusammen. Für den allgemeinen Falle verlaufen die Überlegungen ähnlich.

Die Tatsache, daß $\left\Vert T\right\Vert = {\cal O}(k)$, ist sofort offenkundig für sowohl die Maximumnorm $\left\Vert\cdot\right\Vert_\infty$, als auch für die 1-Norm $\left\Vert\cdot\right\Vert_1$.

Betrachtet man jetzt wieder die beiden Verfahren $z_{n+1}=Sz_n+h\varphi_n$ und $\tilde z_{n+1}=S\tilde z_n+h\tilde\varphi_n+\delta_n$, so erhält man in üblicher vektorieller Schreibweise für die $\varphi_i$, $\delta_i$ und $z_i$ sofort

$$ Z_{n+1}-\tilde Z_{n+1} = T(z_0-\tilde z_0) + h\mathbb{P}(\varphi-\tilde\varphi) - \mathbb{P}\delta $$

und dann mit der Standardabschätzung

$$ \|Z_{n+1}-\tilde Z_{n+1}\| \le \left\|T\right\| {\mskip 3mu} \left\|z_0-\tilde z_0\right\| + \left|h\right| {\mskip 3mu} \left\|\mathbb{P}\right\| {\mskip 3mu} \left\|\varphi-\tilde\varphi\right\| + \left\|\mathbb{P}\right\| {\mskip 3mu} \left\|\delta\right\|. \tag{*} $$

Setzt man jetzt von den Funktionen $\varphi_n$ nur deren Beschränktheit voraus, und damit für $\varphi$, so erhält man sofort das Ergebnis, daß die beiden Zustände sich nicht beliebig weit voneinander entfernen können, wenn nur $k \left|\delta\right| \le \hbox{const}$ und

$$ \left\|z_0-\tilde z_0\right\| = {\cal O}(\frac{1}{k}). $$

Diese beiden Bedingungen sind auch tatsächlich häufig gegeben. Die Beschränktheit des mittleren Summanden in der obigen Abschätzung $(*)$ ist wegen des Vorfaktors von $h$ offensichtlich, da dieser dann das ${\cal O}(k)$-Wachstum der Norm $\left|\mathbb{P}\right|$ auffängt. Die Beschränktheit von der Funktion $\varphi$ ist z.B. dann gegeben, wenn man weiß, daß diese Funktion Lipschitz-stetig ist. Auf einer kompakten Definitionsmenge — sagen wir $[a,b]\times K\times J\subset\!\subset\mathbb{R}^{2s+1}$ — folgt dann sofort die Beschränktheit von $\varphi$.

Bei einer genaueren Untersuchungen muß man natürlich die gestörte Gleichung $\tilde z_{n+1}=Az_n+\tilde h\tilde\varphi_n+\delta_n$ betrachten, da sich bei einer Störung natürlich auch die Schrittweitenfolge $h_0,h_1,\ldots{\mskip 3mu}$ ändert. Das Ausklammern der Schrittweite $h$, setzt natürlich gleiche Schrittweiten beider Verfahren voraus. Man kann dies in die Funktion $\tilde\varphi$ versuchen hinein zu verlagern. Die dann auftretenden Abschätzungen verlangen dann etwas mehr Sorgfalt. Man beachte, daß hier nur Beschränktheit von $|Z_{n+1}-\tilde Z_{n+1}|$ folgt, nicht jedoch erhält man mit der Standardabschätzung wie oben, das weitergehende Resultat, daß die Normdifferenz $|Z_{n+1}-\tilde Z_{n+1}|$ kleiner wird, wenn man $\delta$ normmässig genügend heftig verkleinert.

Man beachte, daß hier nur ein Semistabilitätsfunktional vorliegt mit der obigen Abschätzung $(*)$. Das Stabilitätsfunktional $\psi(\delta) = \left|\mathbb{P}\delta\right|$ geht hier additiv ein.

Bei einer Abschätzung, wie sie z.B. bei Skeel (1976), oder in dem Buche von Albrecht (1979), und auch in dem Buche von Hairer/Wanner/Nørsett (1987) beschrieben wird, geht dieses Funktional direkt multiplikativ in die Abschätzung der Form $(*)$ ein. Man erhält dann natürlich weitergehende Resultate. Allerdings wachsen die Faktoren vor dem Funktional exponentiell mit der Länge des Integrationsintervalles und ebenso exponentiell in der Lipschitzkonstanten. Insbesondere läßt sich auch der Abstand zweier Zustände verkleinern, falls man die Störung hinreichend stark verkleinert.

Bibliographisch:

Hairer, Ernst (*1949)
Wanner, Gerhard (*1942)
Nørsett, Syvert Paul
Albrecht, Peter: “Die numerische Behandlung gewöhnlicher Differentialgleichungen — Eine Einführung unter besonderer Berücksichtigung zyklischer Verfahren”, Carl Hanser Verlag, München Wien, 1979, xi+193 S.
Albrecht, Peter: “Numerische Behandlung gewöhnlicher Differentialgleichungen”, Jül-1274, Februar 1976, Berichte der Kernforschungsanlage Jülich, Institut für Festkörperforschung, Kopie

2. Bemerkungen zum Spijkerschen Stabilitätsfunktional

Nebenläufig sei auf die völlige Analogie der Lösungen von diskreter und kontinuierlicher Zustandsgleichung hingewiesen.

Das lineare und inhomogene Differentialgleichungs-Anfangswertproblem

$$ \dot x = A(t)x+u(t), \qquad x(t_0)=x_0, $$

hat die eindeutig bestimmte Lösung

$$ x(t) = H(t)x_0+\int_{t_0}^t H(t)H^{-1}(\tau)u(\tau)d\tau, $$

wobei $H=H(t)$ das (eindeutig bestimmte) Fundamentalsystem der homogenen Gleichung $\dot x=A(t)x$ ist, mit $H(t_0)=I$. Die Spezialisierung auf die lineare und inhomogene Anfangswertaufgabe mit konstanten Koeffizienten

$$ \dot x=Ax+u, \qquad x(t_0)=x_0, $$

hat demnach die (eindeutig bestimmte) Lösung, die sogar auf der gesamten reellen Achse existiert, falls die Inhomogenität $u(t)$ ebenso existiert,

$$ x(t) = e^{A(t-t_0)}x_0 + \int_{t_0}^t e^{A(t-\tau)}u(\tau)d\tau. $$

Für die diskrete Gleichung $z_{n+1}=Az_n+u_n$ erhält man nach Vorgabe des Anfangszustandes $z_0$ die eindeutig bestimmte Lösung

$$ z_n = A^nz_0+\sum_{\nu=0}^{n-1} A^{n-1-\nu}u_\nu. $$

Zwischen den beiden Problemen $\dot x=Ax+Bz$ und $x_{k+1}=Sx_k+Rz_k$ kann man durch den Homomorphismus

$$ S=e^A,\qquad R=\left(\int_0^1 e^{A\tau}d\tau\right)B $$

stets vermitteln.

Eine weitere Analogie hat man wie folgt. Gilt

$$ % siehe Knuth, Seite 136, der an alles gedacht hat \def\skpty{\skew6\dot{\tilde y}} % Ableitung von y tilde \eqalign{ \left|y(t_0) - \tilde y(t_0)\right| &\le\rho,\cr \left|\skpty(t) - f(y(t))\right| &\le\delta(t),\cr |f(\tilde y(t)) - f(y(t))| &\le\ell(t) \left|\tilde y(t) - y(t)\right|,\cr } $$

so erhält man die Abschätzung

$$ |\tilde y(t) - y(t)| \le e^{L(t)}{\mskip 3mu}\biggl(\rho + \int_{t_0}^t e^{-L(s)}{\mskip 3mu}\delta(s) ds\biggr), $$

mit

$$ L(s) = \int_{t_0}^t \ell(\tau) d\tau. $$

Der notationellen Einfachheit halber sei angenommen, daß $t\ge t_0$ ist — dies erspart Betragszeichen.

Spezialisiert man auf konstante $\delta(t)$ und $\ell(t)$, also $\delta(t)\equiv\delta$ und $\ell(t)\equiv L$, so erhält man die bekannte Abschätzung

$$ |\tilde y(t) - y(t)| \le \bigl(\rho + (t-t_0)\delta\bigr) e^{L\left|t-t_0\right|}, $$

welche eine Aussage darüber macht, wie verschiedene Anfangswerte zu ein und derselben Differentialgleichung zum Auseinanderlaufen der dazugehörigen Lösungen führen können. Im ungünstigsten Falle muß man mit exponentiellen Wachstum rechnen; die Ungleichung ist scharf.

Spezialisiert man lediglich $\ell(t)\equiv L$, so ergibt sich

$$ |\tilde y(t) - y(t)| \le \biggl(\rho + \int_{t_0}^t \delta(\tau) d\tau \biggr) e^{L|t-t_0|}. $$

Die letzte Abschätzung weist schon formal auf den engen Zusammenhang zum Spijkerschen Stabilitätsfunktional hin. Direkter wird dieser Zusammenhang im Falle der folgenden Überlegungen.

Hat man

$$ \eqalign{ \skpty &= f(\tilde y) + d_2(t),\cr \tilde y(t_0) &= y_0 + d_1,\cr } $$

mit den beiden Defekten $d_1, d_2(t)\in\mathbb{R}$, so erhält man

$$ |\tilde y(t) - y(t)| \le e^{L\left|t-t_0\right|}{\mskip 3mu} \max_{\tau\in[t_0,t]}{\mskip 3mu} \biggl|d_2 + \int_{t_0}^\tau d_1(s) ds\biggr|. $$

Man beachte, daß sich die letzte Defektabschätzung nicht durch Spezialisierung aus der obigen allgemeinen Abschätzung herleiten lässt. Dennoch sind die Beweise für beide Aussagen natürlich ähnlich. Ebenso ist gut zwischen $d_2(t)$ aus dem Banachraum $\mathbb{R}$ und der nicht-negativen skalaren Größe $\delta(t)$ zu unterscheiden; Banach, Stefan (1892--1945). Entsprechend sind die Integrale zu verstehen.

Das Spijkersche Stabilitätsfunktional lautet hier

$$ \psi_{\hbox{Sp}}(\delta) = \max_{n=0}^N{\mskip 3mu} \biggl|\sum_{i=0}^n \delta_i\biggr|, $$

in Abweichung der Notation von Albrecht (1979), wegen der veränderten Schreibweise der $\delta_i$. Die zum Stabilitätsfunktional gehörende Matrix $\mathbb{P}$ ist natürlich

$$ \mathbb{P} = \pmatrix{ I & & & & \cr I & I & & 0 & \cr I & I & I & & \cr \vdots & \vdots & \vdots & \ddots & \cr I & I & I & \ldots & I\cr } . $$

Zu den Abschätzungen vergleiche man die Bücher von Schäfke/Schmidt (1973) und Hairer/Wanner/Nørsett (1987). Dort findet man auch Hinweise auf weiterführende Literatur und schwächere Voraussetzungen bei den Behauptungen.

Bibliographisch: