Das Gâteaux-Differential, benannt nach René Gâteaux (1889–1914), stellt eine Verallgemeinerung des gewöhnlichen Differentiationsbegriffes dar, indem es die Richtungsableitung auch in unendlichdimensionalen Räumen definiert. Gewöhnlich hat man für eine Funktion f : G → R , G ⊂ R n {\displaystyle f\colon G\to \mathbb {R} ,\ G\subset \mathbb {R} ^{n}} offene Menge, die an der Stelle x 0 ∈ G {\displaystyle x_{0}\in G} differenzierbar ist, als Definition der partiellen Ableitung
∂ f ∂ x i ( x 0 ) = lim h → 0 f ( x 0 , 1 , x 0 , 2 , … , x 0 , i + h , … , x 0 , n ) − f ( x 0 ) h , ( i = 1 , 2 , . . . , n ) {\displaystyle {\frac {\partial f}{\partial x_{i}}}(x_{0})=\lim _{h\to 0}{\frac {f(x_{0,1},x_{0,2},\ldots ,x_{0,i}+h,\ldots ,x_{0,n})-f(x_{0})}{h}},\ \ (i={1,2,...,n})} .Insbesondere ergibt sich für n = 1 {\displaystyle n=1} das bekannte Differential
d f d x ( x 0 ) = lim h → 0 f ( x 0 + h ) − f ( x 0 ) h {\displaystyle {\frac {\mathrm {d} f}{\mathrm {d} x}}(x_{0})=\lim _{h\to 0}{\frac {f(x_{0}+h)-f(x_{0})}{h}}} .Das Gâteaux-Differential verallgemeinert diese Konzepte auf unendlichdimensionale Vektorräume.
Sei f : D ⊂ X → Y {\displaystyle f\colon D\subset X\to Y} mit D {\displaystyle D} offen und X , Y {\displaystyle X,Y} normierte Räume. Dann heißt f {\displaystyle f} in x 0 ∈ D {\displaystyle x_{0}\in D} Gâteaux-differenzierbar, falls die weierstraßsche Zerlegungsformel gilt, also falls eine lineare Funktion A ∈ L ( X , Y ) {\displaystyle A\in L(X,Y)} existiert, sodass
lim t → 0 1 t = 0 {\displaystyle \lim _{t\rightarrow 0}{\frac {1}{t}}=0}für alle h ∈ X {\displaystyle h\in X} mit ‖ h ‖ = 1 {\displaystyle \lVert h\rVert =1} . Dies ist äquivalent zu
f ( x 0 + t h ) − f ( x 0 ) = t A h + o ( | t | ) {\displaystyle f(x_{0}+th)-f(x_{0})=tAh+o(|t|)} .Dann bezeichnet man A =: f ′ ( x 0 ) {\displaystyle A=:f'(x_{0})} als die Gâteaux-Ableitung von f {\displaystyle f} im Punkt x 0 {\displaystyle x_{0}} .
Sei nun für das Gâteaux-Differential folgende Situation gegeben: Es sei wie üblich f : D ( f ) → R {\displaystyle f\colon D(f)\to \mathbb {R} } ein in D ( f ) ⊆ Ω {\displaystyle D(f)\subseteq \Omega } definiertes Funktional; Ω {\displaystyle \Omega } sei ein linearer normierter Raum (das heißt ein Vektorraum, versehen mit einer Norm ‖ ⋅ ‖ {\displaystyle \|\cdot \|} ) oder ein allgemeinerer topologischer Vektorraum mit Voraussetzungen, über die man sich im konkreten Anwendungsfall nähere Gedanken machen muss; ferner sei x 0 ∈ D ( f ) {\displaystyle x_{0}\in D(f)} und v ∈ Ω {\displaystyle v\in \Omega } . Dann ist das Gâteaux-Differential an der Stelle x 0 {\displaystyle x_{0}} in Richtung v {\displaystyle v} , falls es existiert, definiert durch die folgende Ableitung nach ε {\displaystyle \varepsilon } :
δ f ( x 0 , v ) = lim ε → 0 f ( x 0 + ε ⋅ v ) − f ( x 0 ) ε = d f ( x 0 + ε ⋅ v ) d ε | ε = 0 {\displaystyle \delta f(x_{0},v)=\lim _{\varepsilon \to 0}{\frac {f(x_{0}+\varepsilon \cdot v)-f(x_{0})}{\varepsilon }}=\left.{\frac {\mathrm {d} f(x_{0}+\varepsilon \cdot v)}{\mathrm {d} \varepsilon }}\right|_{\varepsilon =0}}oder auch für x 1 ∈ D ( f ) {\displaystyle x_{1}\in D(f)} durch
δ f ( x 0 , x 1 − x 0 ) = lim ε → 0 f ( x 0 + ε ⋅ ( x 1 − x 0 ) ) − f ( x 0 ) ε . {\displaystyle \delta f(x_{0},x_{1}-x_{0})=\lim _{\varepsilon \to 0}{\frac {f(x_{0}+\varepsilon \cdot (x_{1}-x_{0}))-f(x_{0})}{\varepsilon }}\,.\,}Man beachte dabei x 0 ∈ D ( f ) {\displaystyle x_{0}\in D(f)} , v ∈ Ω {\displaystyle v\in \Omega } und ebenfalls x 1 − x 0 {\displaystyle x_{1}-x_{0}} darin, aber ε ∈ R {\displaystyle \varepsilon \in \mathbb {R} } .
Die Gâteaux-Ableitung nach ε {\displaystyle \varepsilon } ist bezüglich der Größe h := x 1 − x 0 {\displaystyle h:=x_{1}-x_{0}} ein Funktional, das auch als 1. Variation von f {\displaystyle f} an der Stelle x 0 {\displaystyle x_{0}} bezeichnet wird.
Eine andere Möglichkeit ist, anstelle normierter Vektorräume allgemeinere topologische Vektorräume mit entsprechendem Konvergenzbegriff zu benutzen. Vor allem in Physikbüchern werden Funktionale üblicherweise mit dem Buchstaben I {\displaystyle I} bezeichnet, und statt der Größe h := x 1 − x 0 {\displaystyle h:=x_{1}-x_{0}} schreibt man meist δ q ( x ) {\displaystyle \delta q(x)} , mit distributionswertigen Größen. Statt der Ableitung d I ( x + ε ⋅ h ) d ε | ε = 0 {\displaystyle {\tfrac {dI(x+\varepsilon \cdot h)}{d\varepsilon }}_{\,|\varepsilon =0}} führt man in einem Zusatzschritt die Variationsableitung ein, die eng mit der Gâteaux-Ableitung zusammenhängt.
Für
f ( ε ) := ∫ d t L ( t , q ( t ) + ε ⋅ δ q ( t ) , q ˙ ( t ) + ε ⋅ d ( δ q ( t ) ) d t ) {\displaystyle f(\varepsilon ):=\int \,{\rm {d}}t\,{\mathcal {L}}\left(t,q(t)+\varepsilon \cdot \delta q(t),{\dot {q}}(t)+\varepsilon \cdot {\frac {{\rm {d}}(\delta q(t))}{{\rm {d}}t}}\right)}erhält man nach einer partiellen Integration mit verschwindendem ausintegrierten Teil ein Resultat der Form d f d ε ( ε → 0 ) = ∫ d t δ L δ q ( t ) ⋅ δ q ( t ) {\displaystyle \textstyle {\frac {{\rm {d}}f}{{\rm {d}}\varepsilon }}(\varepsilon \to 0)\,=\,\int \,{\rm {d}}t\,{\frac {\delta {\mathcal {L}}}{\delta q(t)}}\cdot \delta q(t)} mit der Variationsableitung
δ L δ q ( t ) ≡ ∂ L ∂ q ( t ) − d d t ∂ L ∂ q ˙ ( t ) . {\displaystyle {\frac {\delta {\mathcal {L}}}{\delta q(t)}}\equiv {\frac {\partial {\mathcal {L}}}{\partial q(t)}}-{\frac {\rm {d}}{{\rm {d}}t}}{\frac {\partial {\mathcal {L}}}{\partial {\dot {q}}(t)}}\,.}(Die Variationsableitung "an der Stelle q(t)" bei kontinuierlichen Variablen ist also die Verallgemeinerung der partiellen Ableitung ∂ L ∂ x i {\displaystyle {\tfrac {\partial {\mathcal {L}}}{\partial x_{i}}}} einer Funktion von n Variablen, also zum Beispiel für den fiktiven Fall L = L ( x 1 , . . . , x n ) {\displaystyle {\mathcal {L}}={\mathcal {L}}(x_{1},...,x_{n})} . So ähnlich wie im fiktiven Fall das totale Differential einer Funktion von n Variablen, so hat auch hier δ f {\displaystyle \delta f} , das totale Differential des Funktionals, invariante Bedeutung. Weitere Einzelheiten im Kapitel Lagrange-Formalismus.)
Im Folgenden wird wegen der Einfachheit auf die Kennung der Vektoren durch „fett geschriebene“ Buchstaben verzichtet.
Unter denselben Voraussetzungen wie oben ist das einseitige Gâteaux-Differential durch
δ + f ( x 0 , v ) = lim ε → 0 + f ( x 0 + ε ⋅ v ) − f ( x 0 ) ε {\displaystyle \delta _{+}f(x_{0},v)=\lim _{\varepsilon \to 0^{+}}{\frac {f(x_{0}+\varepsilon \cdot v)-f(x_{0})}{\varepsilon }}}beziehungsweise durch
δ − f ( x 0 , v ) = lim ε → 0 − f ( x 0 + ε ⋅ v ) − f ( x 0 ) ε {\displaystyle \delta _{-}f(x_{0},v)=\lim _{\varepsilon \to 0^{-}}{\frac {f(x_{0}+\varepsilon \cdot v)-f(x_{0})}{\varepsilon }}}definiert. Das einseitige Gâteaux-Differential wird auch Richtungsdifferential von f {\displaystyle f} an der Stelle x 0 {\displaystyle x_{0}} genannt. Für die zum Vektor v {\displaystyle v} gehörende Richtung verallgemeinert nämlich bei „kontinuierlichen Variablen“ das einseitige Gâteaux-Differential (genauer: die zugehörige Variationsableitung) gerade die Richtungsableitung von f {\displaystyle f} in Richtung v {\displaystyle v} an der Stelle x 0 {\displaystyle x_{0}} .
Ist δ f ( x 0 , v ) {\displaystyle \delta f(x_{0},v)} ein in v {\displaystyle v} stetiges lineares Funktional (d. h. die Funktion vermittelt durch v ↦ δ f ( x 0 , v ) {\displaystyle v\mapsto \delta f(x_{0},v)} ist homogen, additiv und stetig im Argument v {\displaystyle v} ), dann heißt f ′ ( x 0 ) {\displaystyle f'(x_{0})} Gâteaux-Ableitung an der Stelle x 0 {\displaystyle x_{0}} und f {\displaystyle f} Gâteaux-differenzierbar in x 0 {\displaystyle x_{0}} .
δ f ( ( 0 , 0 ) , v ) = lim ε → 0 ( ε ⋅ v 1 ) 2 ⋅ ( 1 + 1 ε ⋅ v 2 ) ε = v 1 2 v 2 {\displaystyle \delta f((0,0),v)=\lim _{\varepsilon \to 0}{\frac {(\varepsilon \cdot v_{1})^{2}\cdot \left(1+{\frac {1}{\varepsilon \cdot v_{2}}}\right)}{\varepsilon }}={\frac {v_{1}^{2}}{v_{2}}}} (wobei v = ( v 1 , v 2 ) T {\displaystyle v=(v_{1},v_{2})^{T}} )
Wie die gewöhnliche Ableitung ist das Gâteaux-Differential zum Bestimmen von Extrema und daher in der Optimierung von Nutzen. Sei f : X → R , X ⊂ D ( f ) ⊂ Ω {\displaystyle f\colon X\to \mathbb {R} ,\ X\subset D(f)\subset \Omega } offen, Ω {\displaystyle \Omega } linearer normierter Raum, x 0 ∈ int ( X ) {\displaystyle x_{0}\in \operatorname {int} (X)} (das Innere der Menge X {\displaystyle X} ), int ( X ) ≠ ∅ {\displaystyle \operatorname {int} (X)\neq \emptyset } und B ε ( x 0 ) {\displaystyle B_{\varepsilon }(x_{0})} der offene Ball um x 0 {\displaystyle x_{0}} mit Radius ε {\displaystyle \varepsilon } . Notwendige Optimalitätsbedingung: Sei x 0 {\displaystyle x_{0}} ein lokales Minimum von f {\displaystyle f} auf X {\displaystyle X} , dann ist δ + f ( x 0 , v ) ≥ 0 ∀ v ∈ Ω {\displaystyle \delta _{+}f(x_{0},v)\geq 0\ \forall v\in \Omega } , falls das einseitige Gâteaux-Differential in x 0 {\displaystyle x_{0}} existiert. Hinreichende Optimalitätsbedingung: f {\displaystyle f} besitze in B ε ( x 0 ) {\displaystyle B_{\varepsilon }(x_{0})} eine 2. Variation ∀ v ∈ Ω {\displaystyle \forall v\in \Omega } und ∀ x ∈ B ε ( x 0 ) {\displaystyle \forall x\in B_{\varepsilon }(x_{0})} . Falls gilt δ f ( x 0 , v ) = 0 ∀ v ∈ Ω {\displaystyle \delta f(x_{0},v)=0\ \forall v\in \Omega } und für ein c > 0 {\displaystyle c>0} δ 2 f ( x 0 , v ) ≥ c ⋅ ‖ v ‖ 2 ∀ v ∈ Ω {\displaystyle \delta ^{2}f(x_{0},v)\geq c\cdot \|v\|^{2}\ \forall v\in \Omega } und ∀ x ∈ B ε ( x 0 ) {\displaystyle \forall x\in B_{\varepsilon }(x_{0})} , dann ist x 0 {\displaystyle x_{0}} strenge lokale Minimalstelle von f {\displaystyle f} auf int ( X ) {\displaystyle \operatorname {int} (X)} .