Gâteaux-Differential

Das Gâteaux-Differential, benannt nach René Gâteaux (1889–1914), stellt eine Verallgemeinerung des gewöhnlichen Differentiationsbegriffes dar, indem es die Richtungsableitung auch in unendlichdimensionalen Räumen definiert. Gewöhnlich hat man für eine Funktion f : G → R , G ⊂ R n {\displaystyle f\colon G\to \mathbb {R} ,\ G\subset \mathbb {R} ^{n}} $f\colon G\to \mathbb {R} ,\ G\subset \mathbb {R} ^{n}$ offene Menge, die an der Stelle x 0 ∈ G {\displaystyle x_{0}\in G} $x_{0}\in G$ differenzierbar ist, als Definition der partiellen Ableitung

∂ f ∂ x i ( x 0 ) = lim h → 0 f ( x 0 , 1 , x 0 , 2 , … , x 0 , i + h , … , x 0 , n ) − f ( x 0 ) h , ( i = 1 , 2 , . . . , n ) {\displaystyle {\frac {\partial f}{\partial x_{i}}}(x_{0})=\lim _{h\to 0}{\frac {f(x_{0,1},x_{0,2},\ldots ,x_{0,i}+h,\ldots ,x_{0,n})-f(x_{0})}{h}},\ \ (i={1,2,...,n})}

{\frac {\partial f}{\partial x_{i}}}(x_{0})=\lim _{h\to 0}{\frac {f(x_{0,1},x_{0,2},\ldots ,x_{0,i}+h,\ldots ,x_{0,n})-f(x_{0})}{h}},\ \ (i={1,2,...,n})

Insbesondere ergibt sich für n = 1 {\displaystyle n=1} $n=1$ das bekannte Differential

d f d x ( x 0 ) = lim h → 0 f ( x 0 + h ) − f ( x 0 ) h {\displaystyle {\frac {\mathrm {d} f}{\mathrm {d} x}}(x_{0})=\lim _{h\to 0}{\frac {f(x_{0}+h)-f(x_{0})}{h}}}

{\frac {\mathrm {d} f}{\mathrm {d} x}}(x_{0})=\lim _{h\to 0}{\frac {f(x_{0}+h)-f(x_{0})}{h}}

Das Gâteaux-Differential verallgemeinert diese Konzepte auf unendlichdimensionale Vektorräume.

Definitionen

Weierstraßsche Zerlegungsformel

Sei f : D ⊂ X → Y {\displaystyle f\colon D\subset X\to Y} $f\colon D\subset X\to Y$ mit D {\displaystyle D} $D$ offen und X , Y {\displaystyle X,Y} $X,Y$ normierte Räume. Dann heißt f {\displaystyle f} $f$ in x 0 ∈ D {\displaystyle x_{0}\in D} $x_{0}\in D$ Gâteaux-differenzierbar, falls die weierstraßsche Zerlegungsformel gilt, also falls eine lineare Funktion A ∈ L ( X , Y ) {\displaystyle A\in L(X,Y)} $A\in L(X,Y)$ existiert, sodass

lim t → 0 1 t = 0 {\displaystyle \lim _{t\rightarrow 0}{\frac {1}{t}}=0}

\lim _{t\rightarrow 0}{\frac {1}{t}}=0

für alle h ∈ X {\displaystyle h\in X} $h\in X$ mit ‖ h ‖ = 1 {\displaystyle \lVert h\rVert =1} $\lVert h\rVert =1$ . Dies ist äquivalent zu

f ( x 0 + t h ) − f ( x 0 ) = t A h + o ( | t | ) {\displaystyle f(x_{0}+th)-f(x_{0})=tAh+o(|t|)}

f(x_{0}+th)-f(x_{0})=tAh+o(|t|)

Dann bezeichnet man A =: f ′ ( x 0 ) {\displaystyle A=:f'(x_{0})} $A=:f'(x_{0})$ als die Gâteaux-Ableitung von f {\displaystyle f} $f$ im Punkt x 0 {\displaystyle x_{0}} $x_{0}$ .

1. Variation; Variationsableitung

→ Hauptartikel: Erste Variation

Sei nun für das Gâteaux-Differential folgende Situation gegeben: Es sei wie üblich f : D ( f ) → R {\displaystyle f\colon D(f)\to \mathbb {R} } $f\colon D(f)\to \mathbb {R}$ ein in D ( f ) ⊆ Ω {\displaystyle D(f)\subseteq \Omega } $D(f)\subseteq \Omega$ definiertes Funktional; Ω {\displaystyle \Omega } $\Omega$ sei ein linearer normierter Raum (das heißt ein Vektorraum, versehen mit einer Norm ‖ ⋅ ‖ {\displaystyle \|\cdot \|} $\|\cdot \|$ ) oder ein allgemeinerer topologischer Vektorraum mit Voraussetzungen, über die man sich im konkreten Anwendungsfall nähere Gedanken machen muss; ferner sei x 0 ∈ D ( f ) {\displaystyle x_{0}\in D(f)} $x_{0}\in D(f)$ und v ∈ Ω {\displaystyle v\in \Omega } $v\in \Omega$ . Dann ist das Gâteaux-Differential an der Stelle x 0 {\displaystyle x_{0}} $x_{0}$ in Richtung v {\displaystyle v} $v$ , falls es existiert, definiert durch die folgende Ableitung nach ε {\displaystyle \varepsilon } $\varepsilon$ :

δ f ( x 0 , v ) = lim ε → 0 f ( x 0 + ε ⋅ v ) − f ( x 0 ) ε = d f ( x 0 + ε ⋅ v ) d ε | ε = 0 {\displaystyle \delta f(x_{0},v)=\lim _{\varepsilon \to 0}{\frac {f(x_{0}+\varepsilon \cdot v)-f(x_{0})}{\varepsilon }}=\left.{\frac {\mathrm {d} f(x_{0}+\varepsilon \cdot v)}{\mathrm {d} \varepsilon }}\right|_{\varepsilon =0}}

\delta f(x_{0},v)=\lim _{\varepsilon \to 0}{\frac {f(x_{0}+\varepsilon \cdot v)-f(x_{0})}{\varepsilon }}=\left.{\frac {\mathrm {d} f(x_{0}+\varepsilon \cdot v)}{\mathrm {d} \varepsilon }}\right|_{\varepsilon =0}

oder auch für x 1 ∈ D ( f ) {\displaystyle x_{1}\in D(f)} $x_{1}\in D(f)$ durch

δ f ( x 0 , x 1 − x 0 ) = lim ε → 0 f ( x 0 + ε ⋅ ( x 1 − x 0 ) ) − f ( x 0 ) ε . {\displaystyle \delta f(x_{0},x_{1}-x_{0})=\lim _{\varepsilon \to 0}{\frac {f(x_{0}+\varepsilon \cdot (x_{1}-x_{0}))-f(x_{0})}{\varepsilon }}\,.\,}

\delta f(x_{0},x_{1}-x_{0})=\lim _{\varepsilon \to 0}{\frac {f(x_{0}+\varepsilon \cdot (x_{1}-x_{0}))-f(x_{0})}{\varepsilon }}\,.\,

Man beachte dabei x 0 ∈ D ( f ) {\displaystyle x_{0}\in D(f)} $x_{0}\in D(f)$ , v ∈ Ω {\displaystyle v\in \Omega } $v\in \Omega$ und ebenfalls x 1 − x 0 {\displaystyle x_{1}-x_{0}} $x_{1}-x_{0}$ darin, aber ε ∈ R {\displaystyle \varepsilon \in \mathbb {R} } $\varepsilon \in \mathbb {R}$ .

Die Gâteaux-Ableitung nach ε {\displaystyle \varepsilon } $\varepsilon$ ist bezüglich der Größe h := x 1 − x 0 {\displaystyle h:=x_{1}-x_{0}} $h:=x_{1}-x_{0}$ ein Funktional, das auch als 1. Variation von f {\displaystyle f} $f$ an der Stelle x 0 {\displaystyle x_{0}} $x_{0}$ bezeichnet wird.

Eine andere Möglichkeit ist, anstelle normierter Vektorräume allgemeinere topologische Vektorräume mit entsprechendem Konvergenzbegriff zu benutzen. Vor allem in Physikbüchern werden Funktionale üblicherweise mit dem Buchstaben I {\displaystyle I} $I$ bezeichnet, und statt der Größe h := x 1 − x 0 {\displaystyle h:=x_{1}-x_{0}} $h:=x_{1}-x_{0}$ schreibt man meist δ q ( x ) {\displaystyle \delta q(x)} $\delta q(x)$ , mit distributionswertigen Größen. Statt der Ableitung d I ( x + ε ⋅ h ) d ε | ε = 0 {\displaystyle {\tfrac {dI(x+\varepsilon \cdot h)}{d\varepsilon }}_{\,|\varepsilon =0}} ${\tfrac {dI(x+\varepsilon \cdot h)}{d\varepsilon }}_{\,|\varepsilon =0}$ führt man in einem Zusatzschritt die Variationsableitung ein, die eng mit der Gâteaux-Ableitung zusammenhängt.

Beispiel

Für

f ( ε ) := ∫ d t L ( t , q ( t ) + ε ⋅ δ q ( t ) , q ˙ ( t ) + ε ⋅ d ( δ q ( t ) ) d t ) {\displaystyle f(\varepsilon ):=\int \,{\rm {d}}t\,{\mathcal {L}}\left(t,q(t)+\varepsilon \cdot \delta q(t),{\dot {q}}(t)+\varepsilon \cdot {\frac {{\rm {d}}(\delta q(t))}{{\rm {d}}t}}\right)}

f(\varepsilon ):=\int \,{\rm {d}}t\,{\mathcal {L}}\left(t,q(t)+\varepsilon \cdot \delta q(t),{\dot {q}}(t)+\varepsilon \cdot {\frac {{\rm {d}}(\delta q(t))}{{\rm {d}}t}}\right)

erhält man nach einer partiellen Integration mit verschwindendem ausintegrierten Teil ein Resultat der Form d f d ε ( ε → 0 ) = ∫ d t δ L δ q ( t ) ⋅ δ q ( t ) {\displaystyle \textstyle {\frac {{\rm {d}}f}{{\rm {d}}\varepsilon }}(\varepsilon \to 0)\,=\,\int \,{\rm {d}}t\,{\frac {\delta {\mathcal {L}}}{\delta q(t)}}\cdot \delta q(t)} $\textstyle {\frac {{\rm {d}}f}{{\rm {d}}\varepsilon }}(\varepsilon \to 0)\,=\,\int \,{\rm {d}}t\,{\frac {\delta {\mathcal {L}}}{\delta q(t)}}\cdot \delta q(t)$ mit der Variationsableitung

δ L δ q ( t ) ≡ ∂ L ∂ q ( t ) − d d t ∂ L ∂ q ˙ ( t ) . {\displaystyle {\frac {\delta {\mathcal {L}}}{\delta q(t)}}\equiv {\frac {\partial {\mathcal {L}}}{\partial q(t)}}-{\frac {\rm {d}}{{\rm {d}}t}}{\frac {\partial {\mathcal {L}}}{\partial {\dot {q}}(t)}}\,.}

{\frac {\delta {\mathcal {L}}}{\delta q(t)}}\equiv {\frac {\partial {\mathcal {L}}}{\partial q(t)}}-{\frac {\rm {d}}{{\rm {d}}t}}{\frac {\partial {\mathcal {L}}}{\partial {\dot {q}}(t)}}\,.

(Die Variationsableitung "an der Stelle q(t)" bei kontinuierlichen Variablen ist also die Verallgemeinerung der partiellen Ableitung ∂ L ∂ x i {\displaystyle {\tfrac {\partial {\mathcal {L}}}{\partial x_{i}}}} ${\tfrac {\partial {\mathcal {L}}}{\partial x_{i}}}$ einer Funktion von n Variablen, also zum Beispiel für den fiktiven Fall L = L ( x 1 , . . . , x n ) {\displaystyle {\mathcal {L}}={\mathcal {L}}(x_{1},...,x_{n})} ${\mathcal {L}}={\mathcal {L}}(x_{1},...,x_{n})$ . So ähnlich wie im fiktiven Fall das totale Differential einer Funktion von n Variablen, so hat auch hier δ f {\displaystyle \delta f} $\delta f$ , das totale Differential des Funktionals, invariante Bedeutung. Weitere Einzelheiten im Kapitel Lagrange-Formalismus.)

Im Folgenden wird wegen der Einfachheit auf die Kennung der Vektoren durch „fett geschriebene“ Buchstaben verzichtet.

2. Variation

δ 2 f ( x 0 , v ) = d 2 f ( x 0 + ε ⋅ v ) d ε 2 | ε = 0 {\displaystyle \delta ^{2}f(x_{0},v)=\left.{\frac {\mathrm {d} ^{2}f(x_{0}+\varepsilon \cdot v)}{\mathrm {d} \varepsilon ^{2}}}\right|_{\varepsilon =0}}

\delta ^{2}f(x_{0},v)=\left.{\frac {\mathrm {d} ^{2}f(x_{0}+\varepsilon \cdot v)}{\mathrm {d} \varepsilon ^{2}}}\right|_{\varepsilon =0}

Halbseitiges Differential und Richtungsableitung

Unter denselben Voraussetzungen wie oben ist das einseitige Gâteaux-Differential durch

δ + f ( x 0 , v ) = lim ε → 0 + f ( x 0 + ε ⋅ v ) − f ( x 0 ) ε {\displaystyle \delta _{+}f(x_{0},v)=\lim _{\varepsilon \to 0^{+}}{\frac {f(x_{0}+\varepsilon \cdot v)-f(x_{0})}{\varepsilon }}}

\delta _{+}f(x_{0},v)=\lim _{\varepsilon \to 0^{+}}{\frac {f(x_{0}+\varepsilon \cdot v)-f(x_{0})}{\varepsilon }}

beziehungsweise durch

δ − f ( x 0 , v ) = lim ε → 0 − f ( x 0 + ε ⋅ v ) − f ( x 0 ) ε {\displaystyle \delta _{-}f(x_{0},v)=\lim _{\varepsilon \to 0^{-}}{\frac {f(x_{0}+\varepsilon \cdot v)-f(x_{0})}{\varepsilon }}}

\delta _{-}f(x_{0},v)=\lim _{\varepsilon \to 0^{-}}{\frac {f(x_{0}+\varepsilon \cdot v)-f(x_{0})}{\varepsilon }}

definiert. Das einseitige Gâteaux-Differential wird auch Richtungsdifferential von f {\displaystyle f} $f$ an der Stelle x 0 {\displaystyle x_{0}} $x_{0}$ genannt. Für die zum Vektor v {\displaystyle v} $v$ gehörende Richtung verallgemeinert nämlich bei „kontinuierlichen Variablen“ das einseitige Gâteaux-Differential (genauer: die zugehörige Variationsableitung) gerade die Richtungsableitung von f {\displaystyle f} $f$ in Richtung v {\displaystyle v} $v$ an der Stelle x 0 {\displaystyle x_{0}} $x_{0}$ .

Gâteaux-Ableitung

Ist δ f ( x 0 , v ) {\displaystyle \delta f(x_{0},v)} $\delta f(x_{0},v)$ ein in v {\displaystyle v} $v$ stetiges lineares Funktional (d. h. die Funktion vermittelt durch v ↦ δ f ( x 0 , v ) {\displaystyle v\mapsto \delta f(x_{0},v)} $v\mapsto \delta f(x_{0},v)$ ist homogen, additiv und stetig im Argument v {\displaystyle v} $v$ ), dann heißt f ′ ( x 0 ) {\displaystyle f'(x_{0})} $f'(x_{0})$ Gâteaux-Ableitung an der Stelle x 0 {\displaystyle x_{0}} $x_{0}$ und f {\displaystyle f} $f$ Gâteaux-differenzierbar in x 0 {\displaystyle x_{0}} $x_{0}$ .

Eigenschaften der 1. Variation

Das Gâteaux-Differential ist homogen, das bedeutet

δ f ( x 0 , k ⋅ v ) = k ⋅ δ f ( x 0 , v ) {\displaystyle \delta f(x_{0},k\cdot v)=k\cdot \delta f(x_{0},v)} $\delta f(x_{0},k\cdot v)=k\cdot \delta f(x_{0},v)$

für alle k ∈ R {\displaystyle k\in \mathbb {R} } $k\in \mathbb {R}$ . Die Eigenschaft gilt analog für das einseitige Gâteaux-Differential.

Das Gâteaux-Differential ist eine lineare Operation, es gilt also

δ ( f 1 + f 2 ) ( x 0 , v ) = δ f 1 ( x 0 , v ) + δ f 2 ( x 0 , v ) . {\displaystyle \delta (f_{1}+f_{2})(x_{0},v)=\delta f_{1}(x_{0},v)+\delta f_{2}(x_{0},v).} $\delta (f_{1}+f_{2})(x_{0},v)=\delta f_{1}(x_{0},v)+\delta f_{2}(x_{0},v).$

und

k ⋅ δ f ( x 0 , v ) = δ ( k ⋅ f ) ( x 0 , v ) . {\displaystyle k\cdot \delta f(x_{0},v)=\delta (k\cdot f)(x_{0},v).} $k\cdot \delta f(x_{0},v)=\delta (k\cdot f)(x_{0},v).$

für alle k ∈ R {\displaystyle k\in \mathbb {R} } $k\in \mathbb {R}$

Beispiele

f ( x 1 , x 2 ) = 1 {\displaystyle f(x_{1},x_{2})=1} $f(x_{1},x_{2})=1$ , falls x 2 = x 1 2 {\displaystyle x_{2}=x_{1}^{2}} $x_{2}=x_{1}^{2}$ , x 1 ≠ 0 {\displaystyle x_{1}\neq 0} $x_{1}\neq 0$ bzw. 0 {\displaystyle 0} $0$ sonst δ f ( ( 0 , 0 ) , v ) = lim t → 0 0 − 0 t = 0 {\displaystyle \delta f((0,0),v)=\lim _{t\to 0}{\frac {0-0}{t}}=0} $\delta f((0,0),v)=\lim _{t\to 0}{\frac {0-0}{t}}=0$ .
f ( x ) = | x | , x ∈ R n {\displaystyle f(x)=|x|,\ x\in \mathbb {R} ^{n}} $f(x)=|x|,\ x\in \mathbb {R} ^{n}$ δ + f ( 0 , v ) = lim ε → 0 + | 0 + ε ⋅ v | − 0 ε = | v | {\displaystyle \delta _{+}f(0,v)=\lim _{\varepsilon \to 0^{+}}{\frac {|0+\varepsilon \cdot v|-0}{\varepsilon }}=|v|} $\delta _{+}f(0,v)=\lim _{\varepsilon \to 0^{+}}{\frac {|0+\varepsilon \cdot v|-0}{\varepsilon }}=|v|$
f ( x 1 , x 2 ) = x 1 2 ( 1 + 1 x 2 ) {\displaystyle f(x_{1},x_{2})=x_{1}^{2}\left(1+{\frac {1}{x_{2}}}\right)} $f(x_{1},x_{2})=x_{1}^{2}\left(1+{\frac {1}{x_{2}}}\right)$ für x 2 ≠ 0 {\displaystyle x_{2}\neq 0} $x_{2}\neq 0$ und − x 1 2 x 2 2 {\displaystyle -{\frac {x_{1}^{2}}{x_{2}^{2}}}} $-{\frac {x_{1}^{2}}{x_{2}^{2}}}$ für x 2 = 0 {\displaystyle x_{2}=0} $x_{2}=0$ , ∇ f ( x 1 , x 2 ) = ( 2 ⋅ x 1 ⋅ ( 1 + 1 x 2 ) , − x 1 2 x 2 2 ) T {\displaystyle \nabla f(x_{1},x_{2})=\left(2\cdot x_{1}\cdot \left(1+{\frac {1}{x_{2}}}\right),-{\frac {x_{1}^{2}}{x_{2}^{2}}}\right)^{T}} $\nabla f(x_{1},x_{2})=\left(2\cdot x_{1}\cdot \left(1+{\frac {1}{x_{2}}}\right),-{\frac {x_{1}^{2}}{x_{2}^{2}}}\right)^{T}$

δ f ( ( 0 , 0 ) , v ) = lim ε → 0 ( ε ⋅ v 1 ) 2 ⋅ ( 1 + 1 ε ⋅ v 2 ) ε = v 1 2 v 2 {\displaystyle \delta f((0,0),v)=\lim _{\varepsilon \to 0}{\frac {(\varepsilon \cdot v_{1})^{2}\cdot \left(1+{\frac {1}{\varepsilon \cdot v_{2}}}\right)}{\varepsilon }}={\frac {v_{1}^{2}}{v_{2}}}} $\delta f((0,0),v)=\lim _{\varepsilon \to 0}{\frac {(\varepsilon \cdot v_{1})^{2}\cdot \left(1+{\frac {1}{\varepsilon \cdot v_{2}}}\right)}{\varepsilon }}={\frac {v_{1}^{2}}{v_{2}}}$ (wobei v = ( v 1 , v 2 ) T {\displaystyle v=(v_{1},v_{2})^{T}} $v=(v_{1},v_{2})^{T}$ )

Anwendungen

Wie die gewöhnliche Ableitung ist das Gâteaux-Differential zum Bestimmen von Extrema und daher in der Optimierung von Nutzen. Sei f : X → R , X ⊂ D ( f ) ⊂ Ω {\displaystyle f\colon X\to \mathbb {R} ,\ X\subset D(f)\subset \Omega } $f\colon X\to \mathbb {R} ,\ X\subset D(f)\subset \Omega$ offen, Ω {\displaystyle \Omega } $\Omega$ linearer normierter Raum, x 0 ∈ int ⁡ ( X ) {\displaystyle x_{0}\in \operatorname {int} (X)} $x_{0}\in \operatorname {int} (X)$ (das Innere der Menge X {\displaystyle X} $X$ ), int ⁡ ( X ) ≠ ∅ {\displaystyle \operatorname {int} (X)\neq \emptyset } $\operatorname {int} (X)\neq \emptyset$ und B ε ( x 0 ) {\displaystyle B_{\varepsilon }(x_{0})} $B_{\varepsilon }(x_{0})$ der offene Ball um x 0 {\displaystyle x_{0}} $x_{0}$ mit Radius ε {\displaystyle \varepsilon } $\varepsilon$ . Notwendige Optimalitätsbedingung: Sei x 0 {\displaystyle x_{0}} $x_{0}$ ein lokales Minimum von f {\displaystyle f} $f$ auf X {\displaystyle X} $X$ , dann ist δ + f ( x 0 , v ) ≥ 0 ∀ v ∈ Ω {\displaystyle \delta _{+}f(x_{0},v)\geq 0\ \forall v\in \Omega } $\delta _{+}f(x_{0},v)\geq 0\ \forall v\in \Omega$ , falls das einseitige Gâteaux-Differential in x 0 {\displaystyle x_{0}} $x_{0}$ existiert. Hinreichende Optimalitätsbedingung: f {\displaystyle f} $f$ besitze in B ε ( x 0 ) {\displaystyle B_{\varepsilon }(x_{0})} $B_{\varepsilon }(x_{0})$ eine 2. Variation ∀ v ∈ Ω {\displaystyle \forall v\in \Omega } $\forall v\in \Omega$ und ∀ x ∈ B ε ( x 0 ) {\displaystyle \forall x\in B_{\varepsilon }(x_{0})} $\forall x\in B_{\varepsilon }(x_{0})$ . Falls gilt δ f ( x 0 , v ) = 0 ∀ v ∈ Ω {\displaystyle \delta f(x_{0},v)=0\ \forall v\in \Omega } $\delta f(x_{0},v)=0\ \forall v\in \Omega$ und für ein c > 0 {\displaystyle c>0} $c>0$ δ 2 f ( x 0 , v ) ≥ c ⋅ ‖ v ‖ 2 ∀ v ∈ Ω {\displaystyle \delta ^{2}f(x_{0},v)\geq c\cdot \|v\|^{2}\ \forall v\in \Omega } $\delta ^{2}f(x_{0},v)\geq c\cdot \|v\|^{2}\ \forall v\in \Omega$ und ∀ x ∈ B ε ( x 0 ) {\displaystyle \forall x\in B_{\varepsilon }(x_{0})} $\forall x\in B_{\varepsilon }(x_{0})$ , dann ist x 0 {\displaystyle x_{0}} $x_{0}$ strenge lokale Minimalstelle von f {\displaystyle f} $f$ auf int ⁡ ( X ) {\displaystyle \operatorname {int} (X)} $\operatorname {int} (X)$ .

Siehe auch

Fréchet-Ableitung