Die Cauchy-Schwarz-Ungleichung, auch bekannt als schwarzsche Ungleichung oder Cauchy-Bunjakowski-Schwarz-Ungleichung, ist eine Ungleichung, die in vielen Bereichen der Mathematik verwendet wird, z. B. in der Linearen Algebra (Vektoren), in der Analysis (unendliche Reihen), in der Wahrscheinlichkeitstheorie sowie bei der Integration von Produkten. Außerdem spielt sie in der Quantenmechanik eine wichtige Rolle, wie etwa beim Beweis der heisenbergschen Unschärferelation.
Benannt ist die Ungleichung nach den Mathematikern Augustin-Louis Cauchy, Hermann Amandus Schwarz und Wiktor Jakowlewitsch Bunjakowski.
Die Ungleichung sagt aus: Wenn x {\displaystyle x} und y {\displaystyle y} Elemente eines reellen oder komplexen Vektorraums mit innerem Produkt sind, dann gilt für das Skalarprodukt bzw. innere Produkt ⟨ x , y ⟩ {\displaystyle \langle x,y\rangle } die Beziehung
| ⟨ x , y ⟩ | 2 ≤ ⟨ x , x ⟩ ⋅ ⟨ y , y ⟩ . {\displaystyle |\langle x,y\rangle |^{2}\leq \langle x,x\rangle \cdot \langle y,y\rangle .}Gleichheit gilt genau dann, wenn x {\displaystyle x} und y {\displaystyle y} linear abhängig sind.
Äquivalente Formulierungen erhält man unter Verwendung der von dem Skalarprodukt induzierten Norm ‖ x ‖ := ⟨ x , x ⟩ {\displaystyle \|x\|:={\sqrt {\langle x,x\rangle }}} :
| ⟨ x , y ⟩ | 2 ≤ ‖ x ‖ 2 ⋅ ‖ y ‖ 2 {\displaystyle |\langle x,y\rangle |^{2}\leq \|x\|^{2}\cdot \|y\|^{2}}bzw.
| ⟨ x , y ⟩ | ≤ ‖ x ‖ ⋅ ‖ y ‖ . {\displaystyle \left|\langle x,y\rangle \right|\leq \|x\|\cdot \|y\|.}Im reellen Fall kann man auf die Betragsstriche verzichten, schwächt damit aber die Aussage etwas ab, da die Ungleichung für negative Skalarprodukte trivialerweise erfüllt ist:
⟨ x , y ⟩ ≤ ‖ x ‖ ⋅ ‖ y ‖ {\displaystyle \langle x,y\rangle \leq \|x\|\cdot \|y\|}Auf den Raum R n {\displaystyle \mathbb {R} ^{n}} mit dem Standardskalarprodukt angewandt, erhält man
( ∑ i = 1 n x i ⋅ y i ) 2 ≤ ( ∑ i = 1 n x i 2 ) ⋅ ( ∑ i = 1 n y i 2 ) {\displaystyle \left(\sum _{i=1}^{n}x_{i}\cdot y_{i}\right)^{2}\leq \left(\sum _{i=1}^{n}x_{i}^{2}\right)\cdot \left(\sum _{i=1}^{n}y_{i}^{2}\right)} .Im Fall quadratisch integrierbarer komplexwertiger Funktionen erhält man
| ∫ f ( x ) ⋅ g ( x ) ¯ d x | 2 ≤ ( ∫ | f ( x ) | 2 d x ) ⋅ ( ∫ | g ( x ) | 2 d x ) {\displaystyle \left|\int f(x)\cdot {\overline {g(x)}}\,dx\right|^{2}\leq \left(\int \left|f(x)\right|^{2}\,dx\right)\cdot \left(\int \left|g(x)\right|^{2}\,dx\right)} .Für quadratisch integrierbare Zufallsvariablen erhält man
( E ( X Y ) ) 2 ≤ E ( X 2 ) ⋅ E ( Y 2 ) {\displaystyle \left(\operatorname {E} (XY)\right)^{2}\leq \operatorname {E} (X^{2})\cdot \operatorname {E} (Y^{2})} .Diese drei Ungleichungen werden durch die Hölder-Ungleichung verallgemeinert.
Auf quadratische Matrizen angewandt, erhält man für die Spur
| Spur ( A B ∗ ) | ≤ ( Spur ( A A ∗ ) ) 1 2 ( Spur ( B B ∗ ) ) 1 2 {\displaystyle \vert \operatorname {Spur} (AB^{*})\vert \leq (\operatorname {Spur} (AA^{*}))^{\frac {1}{2}}(\operatorname {Spur} (BB^{*}))^{\frac {1}{2}}} .Im R 3 {\displaystyle \mathbb {R} ^{3}} lässt sich die Aussage der Cauchy-Schwarz’schen Ungleichung in Form einer Gleichung präzisieren:
⟨ x , x ⟩ ⋅ ⟨ y , y ⟩ = | ⟨ x , y ⟩ | 2 + ‖ x × y ‖ 2 {\displaystyle \langle x,x\rangle \cdot \langle y,y\rangle =|\langle x,y\rangle |^{2}+\|x\times y\|^{2}} .Der Summand ‖ x × y ‖ 2 {\displaystyle \|x\times y\|^{2}} ist stets nicht-negativ. Er ist genau dann Null, wenn x {\displaystyle x} und y {\displaystyle y} linear abhängig sind.
Mit
b i = 1 n {\displaystyle b_{i}={\frac {1}{n}}} für i = 1 , … , n {\displaystyle i=1,\dots ,n}folgt aus dem Spezialfall
| ∑ i = 1 n a i ⋅ b i | ≤ ∑ i = 1 n a i 2 ⋅ ∑ i = 1 n b i 2 {\displaystyle \left|\sum _{i=1}^{n}a_{i}\cdot b_{i}\right|\leq {\sqrt {\sum _{i=1}^{n}a_{i}^{2}}}\cdot {\sqrt {\sum _{i=1}^{n}b_{i}^{2}}}}die Ungleichung
| ( ∑ i = 1 n a i ⋅ 1 n ) | ≤ ∑ i = 1 n a i 2 ⋅ 1 n {\displaystyle \left|\left(\sum _{i=1}^{n}a_{i}\cdot {\frac {1}{n}}\right)\right|\leq {\sqrt {\sum _{i=1}^{n}a_{i}^{2}}}\cdot {\sqrt {\frac {1}{n}}}} .Nach einer elementaren algebraischen Umformung ergibt sich
| 1 n ⋅ ( ∑ i = 1 n a i ) | ≤ 1 n ⋅ ∑ i = 1 n a i 2 {\displaystyle \left|{\frac {1}{n}}\cdot \left(\sum _{i=1}^{n}a_{i}\right)\right|\leq {\sqrt {{\frac {1}{n}}\cdot \sum _{i=1}^{n}a_{i}^{2}}}}und damit insbesondere
1 n ⋅ ( ∑ i = 1 n a i ) ≤ 1 n ⋅ ∑ i = 1 n a i 2 {\displaystyle {\frac {1}{n}}\cdot \left(\sum _{i=1}^{n}a_{i}\right)\leq {\sqrt {{\frac {1}{n}}\cdot \sum _{i=1}^{n}a_{i}^{2}}}} .Letztere Ungleichung sagt aus, dass das arithmetische Mittel stets kleiner gleich dem quadratischen Mittel ist.
Benannt ist die Ungleichung nach Augustin Louis Cauchy, Wiktor Jakowlewitsch Bunjakowski und Hermann Amandus Schwarz. Bei Cauchy findet sich die Summenform der Ungleichung in seiner Analyse algébrique (1821). Die Integralform der Ungleichung wurde erstmals 1859 von Bunjakowski in einer Arbeit über Ungleichungen zwischen Integralen veröffentlicht; Schwarz veröffentlichte seine Arbeit erst 1884 ohne Bezugnahme auf die Arbeit von Bunjakowski. Entsprechend dieser Entwicklung findet sich teilweise auch nur die Benennung als Cauchy-Ungleichung für den diskreten, endlichen Fall und als Bunjakowski-Ungleichung oder schwarzsche Ungleichung im Integral-Fall.
In einem Vektorraum mit innerem Produkt lässt sich aus der Cauchy-Schwarz’schen Ungleichung die Dreiecksungleichung für die induzierte Norm
‖ x ‖ = ⟨ x , x ⟩ {\displaystyle \|x\|={\sqrt {\langle x,x\rangle }}}ableiten, und damit in weiterer Folge zeigen, dass eine so definierte Norm die Normaxiome erfüllt.
Eine weitere Folgerung der Cauchy-Schwarz-Ungleichung ist, dass das innere Produkt eine stetige Funktion ist.
Die Cauchy-Schwarz-Ungleichung stellt sicher, dass im Ausdruck
cos φ = ⟨ x , y ⟩ ‖ x ‖ ⋅ ‖ y ‖ {\displaystyle \cos \varphi ={\frac {\langle x,y\rangle }{\|x\|\cdot \|y\|}}}der Betrag des Bruches stets kleiner oder gleich eins ist, sodass also φ {\displaystyle \varphi } wohldefiniert ist und damit der Winkel auf beliebige Räume mit innerem Produkt verallgemeinert werden kann.
In der Physik wird die Cauchy-Schwarz’sche Ungleichung bei der Herleitung der heisenbergschen Unschärferelation verwendet.
Ist einer der Vektoren der Nullvektor, so ist die Cauchy-Schwarz-Ungleichung trivialerweise erfüllt. In den folgenden Beweisen wird daher x ≠ 0 {\displaystyle x\neq 0} und y ≠ 0 {\displaystyle y\neq 0} vorausgesetzt.
Ein Beweis der Cauchy-Schwarz’schen Ungleichung kann beispielsweise mit Hilfe der Ungleichung vom arithmetischen und geometrischen Mittel erfolgen:
Definiert man für i = 1 , … , n {\displaystyle i=1,\dots ,n} die Werte
ξ i := | x i | ∑ j x j 2 {\displaystyle \xi _{i}:={\frac {|x_{i}|}{\sqrt {\sum _{j}x_{j}^{2}}}}} und η i := | y i | ∑ j y j 2 , {\displaystyle \eta _{i}:={\frac {|y_{i}|}{\sqrt {\sum _{j}y_{j}^{2}}}},}so ergibt sich aus der Ungleichung vom arithmetischen und geometrischen Mittel die Beziehung
∑ i ξ i η i = ∑ i ξ i 2 η i 2 ≤ ∑ i ( ξ i 2 2 + η i 2 2 ) = 1 {\displaystyle \sum _{i}\xi _{i}\eta _{i}=\sum _{i}{\sqrt {\xi _{i}^{2}\eta _{i}^{2}}}\leq \sum _{i}\left({\frac {\xi _{i}^{2}}{2}}+{\frac {\eta _{i}^{2}}{2}}\right)=1}Daraus folgt unmittelbar die Cauchy-Schwarz’sche Ungleichung.
Beweis aus der Umordnungs-UngleichungEin anderer Beweis der Cauchy-Schwarz’schen Ungleichung ergibt sich aus der Umordnungs-Ungleichung. Setzt man
S = ∑ i x i 2 {\displaystyle S={\sqrt {\sum _{i}x_{i}^{2}}}} und T = ∑ i y i 2 {\displaystyle T={\sqrt {\sum _{i}y_{i}^{2}}}}sowie ξ i = x i S {\displaystyle \xi _{i}={\tfrac {x_{i}}{S}}} und ξ n + i = y i T {\displaystyle \xi _{n+i}={\tfrac {y_{i}}{T}}} so gilt
2 = ∑ i = 1 n x i 2 S 2 + ∑ i = 1 n y i 2 T 2 = ∑ i = 1 2 n ξ i 2 . {\displaystyle 2=\sum _{i=1}^{n}{\frac {x_{i}^{2}}{S^{2}}}+\sum _{i=1}^{n}{\frac {y_{i}^{2}}{T^{2}}}=\sum _{i=1}^{2n}\xi _{i}^{2}.}Wegen der Umordnungs-Ungleichung ist nun
∑ i = 1 2 n ξ i 2 ≥ ξ 1 ξ n + 1 + ξ 2 ξ n + 2 + ⋯ + ξ n ξ 2 n + ξ n + 1 ξ 1 + ξ n + 2 ξ 2 + ⋯ + ξ 2 n ξ n . {\displaystyle \sum _{i=1}^{2n}\xi _{i}^{2}\geq \xi _{1}\xi _{n+1}+\xi _{2}\xi _{n+2}+\dots +\xi _{n}\xi _{2n}+\xi _{n+1}\xi _{1}+\xi _{n+2}\xi _{2}+\dots +\xi _{2n}\xi _{n}.}Zusammengefasst erhält man also
2 ≥ 2 ∑ i = 1 n x i y i S ⋅ T . {\displaystyle 2\geq {\frac {2\sum _{i=1}^{n}x_{i}y_{i}}{S\cdot T}}.}Daraus ergibt sich die Cauchy-Schwarz’sche Ungleichung.
Die oben angegebenen Beweise beweisen nur den Spezialfall der Cauchy-Schwarz’schen Ungleichung für das Standardskalarprodukt im R n {\displaystyle \mathbb {R} ^{n}} . Es folgen Beweise für den allgemeinen Fall des Skalarprodukts in einem Vektorraum mit innerem Produkt:
Reeller FallUnter der Voraussetzung y ≠ 0 {\displaystyle y\neq 0} gilt ⟨ y , y ⟩ ≠ 0 {\displaystyle \langle y,y\rangle \neq 0} . Für jedes λ ∈ R {\displaystyle \lambda \in \mathbb {R} } gilt
0 ≤ ⟨ x − λ y , x − λ y ⟩ = ⟨ x − λ y , x ⟩ − λ ⟨ x − λ y , y ⟩ = ⟨ x , x ⟩ − 2 λ ⟨ x , y ⟩ + λ 2 ⟨ y , y ⟩ . {\displaystyle 0\leq \langle x-\lambda y,x-\lambda y\rangle =\langle x-\lambda y,x\rangle -\lambda \langle x-\lambda y,y\rangle =\langle x,x\rangle -2\lambda \langle x,y\rangle +\lambda ^{2}\langle y,y\rangle .}Wählt man nun speziell λ := ⟨ x , y ⟩ ⟨ y , y ⟩ = ⟨ x , y ⟩ ⋅ ‖ y ‖ − 2 {\displaystyle \lambda :={\tfrac {\langle x,y\rangle }{\langle y,y\rangle }}=\langle x,y\rangle \cdot \|y\|^{-2}} so ergibt sich
0 ≤ ‖ x ‖ 2 − ⟨ x , y ⟩ 2 ⋅ ‖ y ‖ − 2 , {\displaystyle 0\leq \|x\|^{2}-\langle x,y\rangle ^{2}\cdot \|y\|^{-2},}also
⟨ x , y ⟩ 2 ≤ ‖ x ‖ 2 ‖ y ‖ 2 . {\displaystyle \langle x,y\rangle ^{2}\leq \|x\|^{2}\|y\|^{2}.}Ziehen der Quadratwurzel ergibt nun genau die Cauchy-Schwarz’sche Ungleichung
| ⟨ x , y ⟩ | ≤ ‖ x ‖ ‖ y ‖ . {\displaystyle {\big |}\langle x,y\rangle {\big |}\leq \|x\|\|y\|.} Komplexer FallDer Beweis im komplexen Fall verläuft ähnlich, allerdings ist zu beachten, dass das Skalarprodukt in diesem Fall keine Bilinearform, sondern eine hermitesche Form ist. Der Beweis wird für die Variante linear im ersten und semilinear im zweiten Argument geführt; wird die umgekehrte Variante gewählt, so ist an den entsprechenden Stellen die komplex Konjugierte zu nehmen.
Ist y = 0 {\displaystyle y=0} , so ist die Aussage klar. Sei y ≠ 0 {\displaystyle y\neq 0} . Für jedes λ ∈ C {\displaystyle \lambda \in \mathbb {C} } gilt
0 ≤ ⟨ x − λ y , x − λ y ⟩ = ⟨ x − λ y , x ⟩ − λ ¯ ⟨ x − λ y , y ⟩ = ⟨ x , x ⟩ − λ ⟨ y , x ⟩ − λ ¯ ⟨ x , y ⟩ + | λ | 2 ⟨ y , y ⟩ . {\displaystyle 0\leq \langle x-\lambda y,x-\lambda y\rangle =\langle x-\lambda y,x\rangle -{\overline {\lambda }}\langle x-\lambda y,y\rangle =\langle x,x\rangle -\lambda \langle y,x\rangle -{\overline {\lambda }}\langle x,y\rangle +{\big |}\lambda {\big |}^{2}\langle y,y\rangle .}Hier führt nun die spezielle Wahl λ = ⟨ x , y ⟩ ⟨ y , y ⟩ = ⟨ x , y ⟩ ⋅ ‖ y ‖ − 2 = ⟨ y , x ⟩ ¯ ⋅ ‖ y ‖ − 2 {\displaystyle \lambda ={\tfrac {\langle x,y\rangle }{\langle y,y\rangle }}={\langle x,y\rangle }\cdot \|y\|^{-2}={\overline {\langle y,x\rangle }}\cdot \|y\|^{-2}} auf
0 ≤ ⟨ x , x ⟩ − λ ⋅ λ ¯ ‖ y ‖ 2 − λ ¯ ⋅ λ ‖ y ‖ 2 + | λ | 2 ⟨ y , y ⟩ = ‖ x ‖ 2 − | ⟨ x , y ⟩ | 2 ⋅ ‖ y ‖ − 2 , {\displaystyle 0\leq \langle x,x\rangle -\lambda \cdot {\overline {\lambda }}\|y\|^{2}-{\overline {\lambda }}\cdot \lambda \,\|y\|^{2}+{\big |}\lambda {\big |}^{2}\langle y,y\rangle =\|x\|^{2}-{\big |}\langle x,y\rangle {\big |}^{2}\cdot \|y\|^{-2},}also
| ⟨ x , y ⟩ | 2 ≤ ‖ x ‖ 2 ‖ y ‖ 2 . {\displaystyle {\big |}\langle x,y\rangle {\big |}^{2}\leq \|x\|^{2}\|y\|^{2}.}Hier wurde Semilinearität im zweiten Argument und Linearität im ersten Argument vorausgesetzt. Im anderen Fall verwendet man λ = ⟨ y , x ⟩ ⟨ y , y ⟩ . {\displaystyle \lambda ={\frac {\langle y,x\rangle }{\langle y,y\rangle }}.}
Man kann den Beweis des Satzes so umformulieren, dass die positive Definitheit des Skalarprodukts nicht verwendet wird. Damit gilt die Aussage auch für jede positiv semidefinite, symmetrische Bilinearform (beziehungsweise hermitesche Sesquilinearform) b {\displaystyle b} .
Man wählt denselben Ansatz, wie im Beweis, der das Skalarprodukt verwendet, trifft hier aber die Wahl
λ = b ( x , y ) b ( y , y ) + ε . {\displaystyle \lambda ={\frac {b(x,y)}{b(y,y)+\varepsilon }}.}Damit muss man nicht mehr fordern, dass b ( y , y ) {\displaystyle b(y,y)} nicht 0 ist. Das ergibt
0 ≤ b ( x − λ y , x − λ y ) = b ( x , x ) − 2 λ b ( x , y ) + λ 2 b ( y , y ) . {\displaystyle 0\leq b(x-\lambda y,x-\lambda y)=b(x,x)-2\lambda b(x,y)+\lambda ^{2}b(y,y).}Ähnlich wie im obigen Beweis folgert man
2 b ( x , y ) 2 − b ( x , y ) 2 b ( y , y ) b ( y , y ) + ε ≤ b ( x , x ) ( b ( y , y ) + ε ) . {\displaystyle 2b(x,y)^{2}-b(x,y)^{2}{\frac {b(y,y)}{b(y,y)+\varepsilon }}\leq b(x,x)(b(y,y)+\varepsilon ).}und die Behauptung ist gezeigt, wenn ε {\displaystyle \varepsilon } gegen 0 konvergiert. Für b ( y , y ) = 0 {\displaystyle b(y,y)=0} folgt b ( x , y ) = 0 {\displaystyle b(x,y)=0} .
Auch hier ist die Situation denkbar, dass aus der Ungleichung eine Gleichheit wird, zum Beispiel wenn (wie beim Skalarprodukt) x , y {\displaystyle x,y} linear abhängig sind. Allerdings sind auch Fälle denkbar, wo die Gleichheit eintritt, ohne dass eine lineare Abhängigkeit vorliegt. Man betrachte etwa eine entartete Bilinearform b {\displaystyle b} . Dann gibt es ein x ≠ 0 {\displaystyle x\neq 0} , so dass für alle y {\displaystyle y} des Vektorraums b ( x , y ) = 0 {\displaystyle b(x,y)=0} ist. Sei nun y {\displaystyle y} aus dem Vektorraum beliebig. Man erhält dann
| b ( x , y ) | 2 = 0 {\displaystyle |b(x,y)|^{2}=0}und
b ( x , x ) b ( y , y ) = 0 ⋅ b ( y , y ) = 0 , {\displaystyle b(x,x)\,b(y,y)=0\cdot b(y,y)=0,}also
| b ( x , y ) | 2 = b ( x , x ) b ( y , y ) , {\displaystyle |b(x,y)|^{2}=b(x,x)\,b(y,y),}auch für den Fall, dass x {\displaystyle x} und y {\displaystyle y} linear unabhängig sind.