Gâteaux-Differential

Das Gâteaux-Differential, benannt nach René Gâteaux (1889–1914), stellt eine Verallgemeinerung des gewöhnlichen Differentiationsbegriffes dar, indem es die Richtungsableitung auch in unendlichdimensionalen Räumen definiert. Gewöhnlich hat man für eine Funktion f : G → R ,   G ⊂ R n {\displaystyle f\colon G\to \mathbb {R} ,\ G\subset \mathbb {R} ^{n}} offene Menge, die an der Stelle x 0 ∈ G {\displaystyle x_{0}\in G} differenzierbar ist, als Definition der partiellen Ableitung

∂ f ∂ x i ( x 0 ) = lim h → 0 f ( x 0 , 1 , x 0 , 2 , … , x 0 , i + h , … , x 0 , n ) − f ( x 0 ) h ,     ( i = 1 , 2 , . . . , n ) {\displaystyle {\frac {\partial f}{\partial x_{i}}}(x_{0})=\lim _{h\to 0}{\frac {f(x_{0,1},x_{0,2},\ldots ,x_{0,i}+h,\ldots ,x_{0,n})-f(x_{0})}{h}},\ \ (i={1,2,...,n})} .

Insbesondere ergibt sich für n = 1 {\displaystyle n=1} das bekannte Differential

d f d x ( x 0 ) = lim h → 0 f ( x 0 + h ) − f ( x 0 ) h {\displaystyle {\frac {\mathrm {d} f}{\mathrm {d} x}}(x_{0})=\lim _{h\to 0}{\frac {f(x_{0}+h)-f(x_{0})}{h}}} .

Das Gâteaux-Differential verallgemeinert diese Konzepte auf unendlichdimensionale Vektorräume.

Definitionen

Weierstraßsche Zerlegungsformel

Sei f : D ⊂ X → Y {\displaystyle f\colon D\subset X\to Y} mit D {\displaystyle D} offen und X , Y {\displaystyle X,Y} normierte Räume. Dann heißt f {\displaystyle f} in x 0 ∈ D {\displaystyle x_{0}\in D} Gâteaux-differenzierbar, falls die weierstraßsche Zerlegungsformel gilt, also falls eine lineare Funktion A ∈ L ( X , Y ) {\displaystyle A\in L(X,Y)} existiert, sodass

lim t → 0 1 t = 0 {\displaystyle \lim _{t\rightarrow 0}{\frac {1}{t}}=0}

für alle h ∈ X {\displaystyle h\in X} mit ‖ h ‖ = 1 {\displaystyle \lVert h\rVert =1} . Dies ist äquivalent zu

f ( x 0 + t h ) − f ( x 0 ) = t A h + o ( | t | ) {\displaystyle f(x_{0}+th)-f(x_{0})=tAh+o(|t|)} .

Dann bezeichnet man A =: f ′ ( x 0 ) {\displaystyle A=:f'(x_{0})} als die Gâteaux-Ableitung von f {\displaystyle f} im Punkt x 0 {\displaystyle x_{0}} .

1. Variation; Variationsableitung

→ Hauptartikel: Erste Variation

Sei nun für das Gâteaux-Differential folgende Situation gegeben: Es sei wie üblich f : D ( f ) → R {\displaystyle f\colon D(f)\to \mathbb {R} } ein in D ( f ) ⊆ Ω {\displaystyle D(f)\subseteq \Omega } definiertes Funktional; Ω {\displaystyle \Omega } sei ein linearer normierter Raum (das heißt ein Vektorraum, versehen mit einer Norm ‖ ⋅ ‖ {\displaystyle \|\cdot \|} ) oder ein allgemeinerer topologischer Vektorraum mit Voraussetzungen, über die man sich im konkreten Anwendungsfall nähere Gedanken machen muss; ferner sei x 0 ∈ D ( f ) {\displaystyle x_{0}\in D(f)} und v ∈ Ω {\displaystyle v\in \Omega } . Dann ist das Gâteaux-Differential an der Stelle x 0 {\displaystyle x_{0}} in Richtung v {\displaystyle v} , falls es existiert, definiert durch die folgende Ableitung nach ε {\displaystyle \varepsilon } :

δ f ( x 0 , v ) = lim ε → 0 f ( x 0 + ε ⋅ v ) − f ( x 0 ) ε = d f ( x 0 + ε ⋅ v ) d ε | ε = 0 {\displaystyle \delta f(x_{0},v)=\lim _{\varepsilon \to 0}{\frac {f(x_{0}+\varepsilon \cdot v)-f(x_{0})}{\varepsilon }}=\left.{\frac {\mathrm {d} f(x_{0}+\varepsilon \cdot v)}{\mathrm {d} \varepsilon }}\right|_{\varepsilon =0}}

oder auch für x 1 ∈ D ( f ) {\displaystyle x_{1}\in D(f)} durch

δ f ( x 0 , x 1 − x 0 ) = lim ε → 0 f ( x 0 + ε ⋅ ( x 1 − x 0 ) ) − f ( x 0 ) ε . {\displaystyle \delta f(x_{0},x_{1}-x_{0})=\lim _{\varepsilon \to 0}{\frac {f(x_{0}+\varepsilon \cdot (x_{1}-x_{0}))-f(x_{0})}{\varepsilon }}\,.\,}

Man beachte dabei x 0 ∈ D ( f ) {\displaystyle x_{0}\in D(f)} , v ∈ Ω {\displaystyle v\in \Omega } und ebenfalls x 1 − x 0 {\displaystyle x_{1}-x_{0}} darin, aber ε ∈ R {\displaystyle \varepsilon \in \mathbb {R} } .

Die Gâteaux-Ableitung nach ε {\displaystyle \varepsilon } ist bezüglich der Größe h := x 1 − x 0 {\displaystyle h:=x_{1}-x_{0}} ein Funktional, das auch als 1. Variation von f {\displaystyle f} an der Stelle x 0 {\displaystyle x_{0}} bezeichnet wird.

Eine andere Möglichkeit ist, anstelle normierter Vektorräume allgemeinere topologische Vektorräume mit entsprechendem Konvergenzbegriff zu benutzen. Vor allem in Physikbüchern werden Funktionale üblicherweise mit dem Buchstaben I {\displaystyle I} bezeichnet, und statt der Größe h := x 1 − x 0 {\displaystyle h:=x_{1}-x_{0}} schreibt man meist δ q ( x ) {\displaystyle \delta q(x)} , mit distributionswertigen Größen. Statt der Ableitung d I ( x + ε ⋅ h ) d ε | ε = 0 {\displaystyle {\tfrac {dI(x+\varepsilon \cdot h)}{d\varepsilon }}_{\,|\varepsilon =0}} führt man in einem Zusatzschritt die Variationsableitung ein, die eng mit der Gâteaux-Ableitung zusammenhängt.

Beispiel

Für

f ( ε ) := ∫ d t L ( t , q ( t ) + ε ⋅ δ q ( t ) , q ˙ ( t ) + ε ⋅ d ( δ q ( t ) ) d t ) {\displaystyle f(\varepsilon ):=\int \,{\rm {d}}t\,{\mathcal {L}}\left(t,q(t)+\varepsilon \cdot \delta q(t),{\dot {q}}(t)+\varepsilon \cdot {\frac {{\rm {d}}(\delta q(t))}{{\rm {d}}t}}\right)}

erhält man nach einer partiellen Integration mit verschwindendem ausintegrierten Teil ein Resultat der Form d f d ε ( ε → 0 ) = ∫ d t δ L δ q ( t ) ⋅ δ q ( t ) {\displaystyle \textstyle {\frac {{\rm {d}}f}{{\rm {d}}\varepsilon }}(\varepsilon \to 0)\,=\,\int \,{\rm {d}}t\,{\frac {\delta {\mathcal {L}}}{\delta q(t)}}\cdot \delta q(t)} mit der Variationsableitung

δ L δ q ( t ) ≡ ∂ L ∂ q ( t ) − d d t ∂ L ∂ q ˙ ( t ) . {\displaystyle {\frac {\delta {\mathcal {L}}}{\delta q(t)}}\equiv {\frac {\partial {\mathcal {L}}}{\partial q(t)}}-{\frac {\rm {d}}{{\rm {d}}t}}{\frac {\partial {\mathcal {L}}}{\partial {\dot {q}}(t)}}\,.}

(Die Variationsableitung "an der Stelle q(t)" bei kontinuierlichen Variablen ist also die Verallgemeinerung der partiellen Ableitung ∂ L ∂ x i {\displaystyle {\tfrac {\partial {\mathcal {L}}}{\partial x_{i}}}} einer Funktion von n Variablen, also zum Beispiel für den fiktiven Fall L = L ( x 1 , . . . , x n ) {\displaystyle {\mathcal {L}}={\mathcal {L}}(x_{1},...,x_{n})} . So ähnlich wie im fiktiven Fall das totale Differential einer Funktion von n Variablen, so hat auch hier δ f {\displaystyle \delta f} , das totale Differential des Funktionals, invariante Bedeutung. Weitere Einzelheiten im Kapitel Lagrange-Formalismus.)

Im Folgenden wird wegen der Einfachheit auf die Kennung der Vektoren durch „fett geschriebene“ Buchstaben verzichtet.

2. Variation

δ 2 f ( x 0 , v ) = d 2 f ( x 0 + ε ⋅ v ) d ε 2 | ε = 0 {\displaystyle \delta ^{2}f(x_{0},v)=\left.{\frac {\mathrm {d} ^{2}f(x_{0}+\varepsilon \cdot v)}{\mathrm {d} \varepsilon ^{2}}}\right|_{\varepsilon =0}}

Halbseitiges Differential und Richtungsableitung

Unter denselben Voraussetzungen wie oben ist das einseitige Gâteaux-Differential durch

δ + f ( x 0 , v ) = lim ε → 0 + f ( x 0 + ε ⋅ v ) − f ( x 0 ) ε {\displaystyle \delta _{+}f(x_{0},v)=\lim _{\varepsilon \to 0^{+}}{\frac {f(x_{0}+\varepsilon \cdot v)-f(x_{0})}{\varepsilon }}}

beziehungsweise durch

δ − f ( x 0 , v ) = lim ε → 0 − f ( x 0 + ε ⋅ v ) − f ( x 0 ) ε {\displaystyle \delta _{-}f(x_{0},v)=\lim _{\varepsilon \to 0^{-}}{\frac {f(x_{0}+\varepsilon \cdot v)-f(x_{0})}{\varepsilon }}}

definiert. Das einseitige Gâteaux-Differential wird auch Richtungsdifferential von f {\displaystyle f} an der Stelle x 0 {\displaystyle x_{0}} genannt. Für die zum Vektor v {\displaystyle v} gehörende Richtung verallgemeinert nämlich bei „kontinuierlichen Variablen“ das einseitige Gâteaux-Differential (genauer: die zugehörige Variationsableitung) gerade die Richtungsableitung von f {\displaystyle f} in Richtung v {\displaystyle v} an der Stelle x 0 {\displaystyle x_{0}} .

Gâteaux-Ableitung

Ist δ f ( x 0 , v ) {\displaystyle \delta f(x_{0},v)} ein in v {\displaystyle v} stetiges lineares Funktional (d. h. die Funktion vermittelt durch v ↦ δ f ( x 0 , v ) {\displaystyle v\mapsto \delta f(x_{0},v)} ist homogen, additiv und stetig im Argument v {\displaystyle v} ), dann heißt f ′ ( x 0 ) {\displaystyle f'(x_{0})} Gâteaux-Ableitung an der Stelle x 0 {\displaystyle x_{0}} und f {\displaystyle f} Gâteaux-differenzierbar in x 0 {\displaystyle x_{0}} .

Eigenschaften der 1. Variation

Beispiele

  1. f ( x 1 , x 2 ) = 1 {\displaystyle f(x_{1},x_{2})=1} , falls x 2 = x 1 2 {\displaystyle x_{2}=x_{1}^{2}} , x 1 ≠ 0 {\displaystyle x_{1}\neq 0} bzw. 0 {\displaystyle 0} sonst δ f ( ( 0 , 0 ) , v ) = lim t → 0 0 − 0 t = 0 {\displaystyle \delta f((0,0),v)=\lim _{t\to 0}{\frac {0-0}{t}}=0} .
  2. f ( x ) = | x | ,   x ∈ R n {\displaystyle f(x)=|x|,\ x\in \mathbb {R} ^{n}} δ + f ( 0 , v ) = lim ε → 0 + | 0 + ε ⋅ v | − 0 ε = | v | {\displaystyle \delta _{+}f(0,v)=\lim _{\varepsilon \to 0^{+}}{\frac {|0+\varepsilon \cdot v|-0}{\varepsilon }}=|v|}
  3. f ( x 1 , x 2 ) = x 1 2 ( 1 + 1 x 2 ) {\displaystyle f(x_{1},x_{2})=x_{1}^{2}\left(1+{\frac {1}{x_{2}}}\right)} für x 2 ≠ 0 {\displaystyle x_{2}\neq 0} und − x 1 2 x 2 2 {\displaystyle -{\frac {x_{1}^{2}}{x_{2}^{2}}}} für x 2 = 0 {\displaystyle x_{2}=0} , ∇ f ( x 1 , x 2 ) = ( 2 ⋅ x 1 ⋅ ( 1 + 1 x 2 ) , − x 1 2 x 2 2 ) T {\displaystyle \nabla f(x_{1},x_{2})=\left(2\cdot x_{1}\cdot \left(1+{\frac {1}{x_{2}}}\right),-{\frac {x_{1}^{2}}{x_{2}^{2}}}\right)^{T}}

δ f ( ( 0 , 0 ) , v ) = lim ε → 0 ( ε ⋅ v 1 ) 2 ⋅ ( 1 + 1 ε ⋅ v 2 ) ε = v 1 2 v 2 {\displaystyle \delta f((0,0),v)=\lim _{\varepsilon \to 0}{\frac {(\varepsilon \cdot v_{1})^{2}\cdot \left(1+{\frac {1}{\varepsilon \cdot v_{2}}}\right)}{\varepsilon }}={\frac {v_{1}^{2}}{v_{2}}}} (wobei v = ( v 1 , v 2 ) T {\displaystyle v=(v_{1},v_{2})^{T}} )

Anwendungen

Wie die gewöhnliche Ableitung ist das Gâteaux-Differential zum Bestimmen von Extrema und daher in der Optimierung von Nutzen. Sei f : X → R ,   X ⊂ D ( f ) ⊂ Ω {\displaystyle f\colon X\to \mathbb {R} ,\ X\subset D(f)\subset \Omega } offen, Ω {\displaystyle \Omega } linearer normierter Raum, x 0 ∈ int ⁡ ( X ) {\displaystyle x_{0}\in \operatorname {int} (X)} (das Innere der Menge X {\displaystyle X} ), int ⁡ ( X ) ≠ ∅ {\displaystyle \operatorname {int} (X)\neq \emptyset } und B ε ( x 0 ) {\displaystyle B_{\varepsilon }(x_{0})} der offene Ball um x 0 {\displaystyle x_{0}} mit Radius ε {\displaystyle \varepsilon } . Notwendige Optimalitätsbedingung: Sei x 0 {\displaystyle x_{0}} ein lokales Minimum von f {\displaystyle f} auf X {\displaystyle X} , dann ist δ + f ( x 0 , v ) ≥ 0   ∀ v ∈ Ω {\displaystyle \delta _{+}f(x_{0},v)\geq 0\ \forall v\in \Omega } , falls das einseitige Gâteaux-Differential in x 0 {\displaystyle x_{0}} existiert. Hinreichende Optimalitätsbedingung: f {\displaystyle f} besitze in B ε ( x 0 ) {\displaystyle B_{\varepsilon }(x_{0})} eine 2. Variation ∀ v ∈ Ω {\displaystyle \forall v\in \Omega } und ∀ x ∈ B ε ( x 0 ) {\displaystyle \forall x\in B_{\varepsilon }(x_{0})} . Falls gilt δ f ( x 0 , v ) = 0   ∀ v ∈ Ω {\displaystyle \delta f(x_{0},v)=0\ \forall v\in \Omega } und für ein c > 0 {\displaystyle c>0} δ 2 f ( x 0 , v ) ≥ c ⋅ ‖ v ‖ 2   ∀ v ∈ Ω {\displaystyle \delta ^{2}f(x_{0},v)\geq c\cdot \|v\|^{2}\ \forall v\in \Omega } und ∀ x ∈ B ε ( x 0 ) {\displaystyle \forall x\in B_{\varepsilon }(x_{0})} , dann ist x 0 {\displaystyle x_{0}} strenge lokale Minimalstelle von f {\displaystyle f} auf int ⁡ ( X ) {\displaystyle \operatorname {int} (X)} .

Siehe auch