Cauchy-Schwarzsche Ungleichung

Die Cauchy-Schwarz-Ungleichung, auch bekannt als schwarzsche Ungleichung oder Cauchy-Bunjakowski-Schwarz-Ungleichung, ist eine Ungleichung, die in vielen Bereichen der Mathematik verwendet wird, z. B. in der Linearen Algebra (Vektoren), in der Analysis (unendliche Reihen), in der Wahrscheinlichkeitstheorie sowie bei der Integration von Produkten. Außerdem spielt sie in der Quantenmechanik eine wichtige Rolle, wie etwa beim Beweis der heisenbergschen Unschärferelation.

Benannt ist die Ungleichung nach den Mathematikern Augustin-Louis Cauchy, Hermann Amandus Schwarz und Wiktor Jakowlewitsch Bunjakowski.

Allgemeiner Fall

Die Ungleichung sagt aus: Wenn x {\displaystyle x} und y {\displaystyle y} Elemente eines reellen oder komplexen Vektorraums mit innerem Produkt sind, dann gilt für das Skalarprodukt bzw. innere Produkt ⟨ x , y ⟩ {\displaystyle \langle x,y\rangle } die Beziehung

| ⟨ x , y ⟩ | 2 ≤ ⟨ x , x ⟩ ⋅ ⟨ y , y ⟩ . {\displaystyle |\langle x,y\rangle |^{2}\leq \langle x,x\rangle \cdot \langle y,y\rangle .}

Gleichheit gilt genau dann, wenn x {\displaystyle x} und y {\displaystyle y} linear abhängig sind.

Äquivalente Formulierungen erhält man unter Verwendung der von dem Skalarprodukt induzierten Norm ‖ x ‖ := ⟨ x , x ⟩ {\displaystyle \|x\|:={\sqrt {\langle x,x\rangle }}} :

| ⟨ x , y ⟩ | 2 ≤ ‖ x ‖ 2 ⋅ ‖ y ‖ 2 {\displaystyle |\langle x,y\rangle |^{2}\leq \|x\|^{2}\cdot \|y\|^{2}}

bzw.

| ⟨ x , y ⟩ | ≤ ‖ x ‖ ⋅ ‖ y ‖ . {\displaystyle \left|\langle x,y\rangle \right|\leq \|x\|\cdot \|y\|.}

Im reellen Fall kann man auf die Betragsstriche verzichten, schwächt damit aber die Aussage etwas ab, da die Ungleichung für negative Skalarprodukte trivialerweise erfüllt ist:

⟨ x , y ⟩ ≤ ‖ x ‖ ⋅ ‖ y ‖ {\displaystyle \langle x,y\rangle \leq \|x\|\cdot \|y\|}

Spezialfälle

Auf den Raum R n {\displaystyle \mathbb {R} ^{n}} mit dem Standardskalarprodukt angewandt, erhält man

( ∑ i = 1 n x i ⋅ y i ) 2 ≤ ( ∑ i = 1 n x i 2 ) ⋅ ( ∑ i = 1 n y i 2 ) {\displaystyle \left(\sum _{i=1}^{n}x_{i}\cdot y_{i}\right)^{2}\leq \left(\sum _{i=1}^{n}x_{i}^{2}\right)\cdot \left(\sum _{i=1}^{n}y_{i}^{2}\right)} .

Im Fall quadratisch integrierbarer komplexwertiger Funktionen erhält man

| ∫ f ( x ) ⋅ g ( x ) ¯ d x | 2 ≤ ( ∫ | f ( x ) | 2 d x ) ⋅ ( ∫ | g ( x ) | 2 d x ) {\displaystyle \left|\int f(x)\cdot {\overline {g(x)}}\,dx\right|^{2}\leq \left(\int \left|f(x)\right|^{2}\,dx\right)\cdot \left(\int \left|g(x)\right|^{2}\,dx\right)} .

Für quadratisch integrierbare Zufallsvariablen erhält man

( E ⁡ ( X Y ) ) 2 ≤ E ⁡ ( X 2 ) ⋅ E ⁡ ( Y 2 ) {\displaystyle \left(\operatorname {E} (XY)\right)^{2}\leq \operatorname {E} (X^{2})\cdot \operatorname {E} (Y^{2})} .

Diese drei Ungleichungen werden durch die Hölder-Ungleichung verallgemeinert.

Auf quadratische Matrizen angewandt, erhält man für die Spur

| Spur ⁡ ( A B ∗ ) | ≤ ( Spur ⁡ ( A A ∗ ) ) 1 2 ( Spur ⁡ ( B B ∗ ) ) 1 2 {\displaystyle \vert \operatorname {Spur} (AB^{*})\vert \leq (\operatorname {Spur} (AA^{*}))^{\frac {1}{2}}(\operatorname {Spur} (BB^{*}))^{\frac {1}{2}}} .

Im R 3 {\displaystyle \mathbb {R} ^{3}} lässt sich die Aussage der Cauchy-Schwarz’schen Ungleichung in Form einer Gleichung präzisieren:

⟨ x , x ⟩ ⋅ ⟨ y , y ⟩ = | ⟨ x , y ⟩ | 2 + ‖ x × y ‖ 2 {\displaystyle \langle x,x\rangle \cdot \langle y,y\rangle =|\langle x,y\rangle |^{2}+\|x\times y\|^{2}} .

Der Summand ‖ x × y ‖ 2 {\displaystyle \|x\times y\|^{2}} ist stets nicht-negativ. Er ist genau dann Null, wenn x {\displaystyle x} und y {\displaystyle y} linear abhängig sind.

Ungleichung zwischen dem arithmetischen und dem quadratischen Mittel

Mit

b i = 1 n {\displaystyle b_{i}={\frac {1}{n}}} für i = 1 , … , n {\displaystyle i=1,\dots ,n}

folgt aus dem Spezialfall

| ∑ i = 1 n a i ⋅ b i | ≤ ∑ i = 1 n a i 2 ⋅ ∑ i = 1 n b i 2 {\displaystyle \left|\sum _{i=1}^{n}a_{i}\cdot b_{i}\right|\leq {\sqrt {\sum _{i=1}^{n}a_{i}^{2}}}\cdot {\sqrt {\sum _{i=1}^{n}b_{i}^{2}}}}

die Ungleichung

| ( ∑ i = 1 n a i ⋅ 1 n ) | ≤ ∑ i = 1 n a i 2 ⋅ 1 n {\displaystyle \left|\left(\sum _{i=1}^{n}a_{i}\cdot {\frac {1}{n}}\right)\right|\leq {\sqrt {\sum _{i=1}^{n}a_{i}^{2}}}\cdot {\sqrt {\frac {1}{n}}}} .

Nach einer elementaren algebraischen Umformung ergibt sich

| 1 n ⋅ ( ∑ i = 1 n a i ) | ≤ 1 n ⋅ ∑ i = 1 n a i 2 {\displaystyle \left|{\frac {1}{n}}\cdot \left(\sum _{i=1}^{n}a_{i}\right)\right|\leq {\sqrt {{\frac {1}{n}}\cdot \sum _{i=1}^{n}a_{i}^{2}}}}

und damit insbesondere

1 n ⋅ ( ∑ i = 1 n a i ) ≤ 1 n ⋅ ∑ i = 1 n a i 2 {\displaystyle {\frac {1}{n}}\cdot \left(\sum _{i=1}^{n}a_{i}\right)\leq {\sqrt {{\frac {1}{n}}\cdot \sum _{i=1}^{n}a_{i}^{2}}}} .

Letztere Ungleichung sagt aus, dass das arithmetische Mittel stets kleiner gleich dem quadratischen Mittel ist.

Geschichte

Benannt ist die Ungleichung nach Augustin Louis Cauchy, Wiktor Jakowlewitsch Bunjakowski und Hermann Amandus Schwarz. Bei Cauchy findet sich die Summenform der Ungleichung in seiner Analyse algébrique (1821). Die Integralform der Ungleichung wurde erstmals 1859 von Bunjakowski in einer Arbeit über Ungleichungen zwischen Integralen veröffentlicht; Schwarz veröffentlichte seine Arbeit erst 1884 ohne Bezugnahme auf die Arbeit von Bunjakowski. Entsprechend dieser Entwicklung findet sich teilweise auch nur die Benennung als Cauchy-Ungleichung für den diskreten, endlichen Fall und als Bunjakowski-Ungleichung oder schwarzsche Ungleichung im Integral-Fall.

Anwendungen

In einem Vektorraum mit innerem Produkt lässt sich aus der Cauchy-Schwarz’schen Ungleichung die Dreiecksungleichung für die induzierte Norm

‖ x ‖ = ⟨ x , x ⟩ {\displaystyle \|x\|={\sqrt {\langle x,x\rangle }}}

ableiten, und damit in weiterer Folge zeigen, dass eine so definierte Norm die Normaxiome erfüllt.

Eine weitere Folgerung der Cauchy-Schwarz-Ungleichung ist, dass das innere Produkt eine stetige Funktion ist.

Die Cauchy-Schwarz-Ungleichung stellt sicher, dass im Ausdruck

cos ⁡ φ = ⟨ x , y ⟩ ‖ x ‖ ⋅ ‖ y ‖ {\displaystyle \cos \varphi ={\frac {\langle x,y\rangle }{\|x\|\cdot \|y\|}}}

der Betrag des Bruches stets kleiner oder gleich eins ist, sodass also φ {\displaystyle \varphi } wohldefiniert ist und damit der Winkel auf beliebige Räume mit innerem Produkt verallgemeinert werden kann.

In der Physik wird die Cauchy-Schwarz’sche Ungleichung bei der Herleitung der heisenbergschen Unschärferelation verwendet.

Beweis der Ungleichung

Ist einer der Vektoren der Nullvektor, so ist die Cauchy-Schwarz-Ungleichung trivialerweise erfüllt. In den folgenden Beweisen wird daher x ≠ 0 {\displaystyle x\neq 0} und y ≠ 0 {\displaystyle y\neq 0} vorausgesetzt.

Spezialfall reelles Standardskalarprodukt

Beweis aus der Ungleichung vom arithmetischen und geometrischen Mittel

Ein Beweis der Cauchy-Schwarz’schen Ungleichung kann beispielsweise mit Hilfe der Ungleichung vom arithmetischen und geometrischen Mittel erfolgen:

Definiert man für i = 1 , … , n {\displaystyle i=1,\dots ,n} die Werte

ξ i := | x i | ∑ j x j 2 {\displaystyle \xi _{i}:={\frac {|x_{i}|}{\sqrt {\sum _{j}x_{j}^{2}}}}}  und  η i := | y i | ∑ j y j 2 , {\displaystyle \eta _{i}:={\frac {|y_{i}|}{\sqrt {\sum _{j}y_{j}^{2}}}},}

so ergibt sich aus der Ungleichung vom arithmetischen und geometrischen Mittel die Beziehung

∑ i ξ i η i = ∑ i ξ i 2 η i 2 ≤ ∑ i ( ξ i 2 2 + η i 2 2 ) = 1 {\displaystyle \sum _{i}\xi _{i}\eta _{i}=\sum _{i}{\sqrt {\xi _{i}^{2}\eta _{i}^{2}}}\leq \sum _{i}\left({\frac {\xi _{i}^{2}}{2}}+{\frac {\eta _{i}^{2}}{2}}\right)=1}

Daraus folgt unmittelbar die Cauchy-Schwarz’sche Ungleichung.

Beweis aus der Umordnungs-Ungleichung

Ein anderer Beweis der Cauchy-Schwarz’schen Ungleichung ergibt sich aus der Umordnungs-Ungleichung. Setzt man

S = ∑ i x i 2 {\displaystyle S={\sqrt {\sum _{i}x_{i}^{2}}}} und T = ∑ i y i 2 {\displaystyle T={\sqrt {\sum _{i}y_{i}^{2}}}}

sowie ξ i = x i S {\displaystyle \xi _{i}={\tfrac {x_{i}}{S}}} und ξ n + i = y i T {\displaystyle \xi _{n+i}={\tfrac {y_{i}}{T}}} so gilt

2 = ∑ i = 1 n x i 2 S 2 + ∑ i = 1 n y i 2 T 2 = ∑ i = 1 2 n ξ i 2 . {\displaystyle 2=\sum _{i=1}^{n}{\frac {x_{i}^{2}}{S^{2}}}+\sum _{i=1}^{n}{\frac {y_{i}^{2}}{T^{2}}}=\sum _{i=1}^{2n}\xi _{i}^{2}.}

Wegen der Umordnungs-Ungleichung ist nun

∑ i = 1 2 n ξ i 2 ≥ ξ 1 ξ n + 1 + ξ 2 ξ n + 2 + ⋯ + ξ n ξ 2 n + ξ n + 1 ξ 1 + ξ n + 2 ξ 2 + ⋯ + ξ 2 n ξ n . {\displaystyle \sum _{i=1}^{2n}\xi _{i}^{2}\geq \xi _{1}\xi _{n+1}+\xi _{2}\xi _{n+2}+\dots +\xi _{n}\xi _{2n}+\xi _{n+1}\xi _{1}+\xi _{n+2}\xi _{2}+\dots +\xi _{2n}\xi _{n}.}

Zusammengefasst erhält man also

2 ≥ 2 ∑ i = 1 n x i y i S ⋅ T . {\displaystyle 2\geq {\frac {2\sum _{i=1}^{n}x_{i}y_{i}}{S\cdot T}}.}

Daraus ergibt sich die Cauchy-Schwarz’sche Ungleichung.

Allgemeines Skalarprodukt

Die oben angegebenen Beweise beweisen nur den Spezialfall der Cauchy-Schwarz’schen Ungleichung für das Standardskalarprodukt im R n {\displaystyle \mathbb {R} ^{n}} . Es folgen Beweise für den allgemeinen Fall des Skalarprodukts in einem Vektorraum mit innerem Produkt:

Reeller Fall

Unter der Voraussetzung y ≠ 0 {\displaystyle y\neq 0} gilt ⟨ y , y ⟩ ≠ 0 {\displaystyle \langle y,y\rangle \neq 0} . Für jedes λ ∈ R {\displaystyle \lambda \in \mathbb {R} } gilt

0 ≤ ⟨ x − λ y , x − λ y ⟩ = ⟨ x − λ y , x ⟩ − λ ⟨ x − λ y , y ⟩ = ⟨ x , x ⟩ − 2 λ ⟨ x , y ⟩ + λ 2 ⟨ y , y ⟩ . {\displaystyle 0\leq \langle x-\lambda y,x-\lambda y\rangle =\langle x-\lambda y,x\rangle -\lambda \langle x-\lambda y,y\rangle =\langle x,x\rangle -2\lambda \langle x,y\rangle +\lambda ^{2}\langle y,y\rangle .}

Wählt man nun speziell λ := ⟨ x , y ⟩ ⟨ y , y ⟩ = ⟨ x , y ⟩ ⋅ ‖ y ‖ − 2 {\displaystyle \lambda :={\tfrac {\langle x,y\rangle }{\langle y,y\rangle }}=\langle x,y\rangle \cdot \|y\|^{-2}} so ergibt sich

0 ≤ ‖ x ‖ 2 − ⟨ x , y ⟩ 2 ⋅ ‖ y ‖ − 2 , {\displaystyle 0\leq \|x\|^{2}-\langle x,y\rangle ^{2}\cdot \|y\|^{-2},}

also

⟨ x , y ⟩ 2 ≤ ‖ x ‖ 2 ‖ y ‖ 2 . {\displaystyle \langle x,y\rangle ^{2}\leq \|x\|^{2}\|y\|^{2}.}

Ziehen der Quadratwurzel ergibt nun genau die Cauchy-Schwarz’sche Ungleichung

| ⟨ x , y ⟩ | ≤ ‖ x ‖ ‖ y ‖ . {\displaystyle {\big |}\langle x,y\rangle {\big |}\leq \|x\|\|y\|.} Komplexer Fall

Der Beweis im komplexen Fall verläuft ähnlich, allerdings ist zu beachten, dass das Skalarprodukt in diesem Fall keine Bilinearform, sondern eine hermitesche Form ist. Der Beweis wird für die Variante linear im ersten und semilinear im zweiten Argument geführt; wird die umgekehrte Variante gewählt, so ist an den entsprechenden Stellen die komplex Konjugierte zu nehmen.

Ist y = 0 {\displaystyle y=0} , so ist die Aussage klar. Sei y ≠ 0 {\displaystyle y\neq 0} . Für jedes λ ∈ C {\displaystyle \lambda \in \mathbb {C} } gilt

0 ≤ ⟨ x − λ y , x − λ y ⟩ = ⟨ x − λ y , x ⟩ − λ ¯ ⟨ x − λ y , y ⟩ = ⟨ x , x ⟩ − λ ⟨ y , x ⟩ − λ ¯ ⟨ x , y ⟩ + | λ | 2 ⟨ y , y ⟩ . {\displaystyle 0\leq \langle x-\lambda y,x-\lambda y\rangle =\langle x-\lambda y,x\rangle -{\overline {\lambda }}\langle x-\lambda y,y\rangle =\langle x,x\rangle -\lambda \langle y,x\rangle -{\overline {\lambda }}\langle x,y\rangle +{\big |}\lambda {\big |}^{2}\langle y,y\rangle .}

Hier führt nun die spezielle Wahl λ = ⟨ x , y ⟩ ⟨ y , y ⟩ = ⟨ x , y ⟩ ⋅ ‖ y ‖ − 2 = ⟨ y , x ⟩ ¯ ⋅ ‖ y ‖ − 2 {\displaystyle \lambda ={\tfrac {\langle x,y\rangle }{\langle y,y\rangle }}={\langle x,y\rangle }\cdot \|y\|^{-2}={\overline {\langle y,x\rangle }}\cdot \|y\|^{-2}} auf

0 ≤ ⟨ x , x ⟩ − λ ⋅ λ ¯ ‖ y ‖ 2 − λ ¯ ⋅ λ ‖ y ‖ 2 + | λ | 2 ⟨ y , y ⟩ = ‖ x ‖ 2 − | ⟨ x , y ⟩ | 2 ⋅ ‖ y ‖ − 2 , {\displaystyle 0\leq \langle x,x\rangle -\lambda \cdot {\overline {\lambda }}\|y\|^{2}-{\overline {\lambda }}\cdot \lambda \,\|y\|^{2}+{\big |}\lambda {\big |}^{2}\langle y,y\rangle =\|x\|^{2}-{\big |}\langle x,y\rangle {\big |}^{2}\cdot \|y\|^{-2},}

also

| ⟨ x , y ⟩ | 2 ≤ ‖ x ‖ 2 ‖ y ‖ 2 . {\displaystyle {\big |}\langle x,y\rangle {\big |}^{2}\leq \|x\|^{2}\|y\|^{2}.}

Hier wurde Semilinearität im zweiten Argument und Linearität im ersten Argument vorausgesetzt. Im anderen Fall verwendet man λ = ⟨ y , x ⟩ ⟨ y , y ⟩ . {\displaystyle \lambda ={\frac {\langle y,x\rangle }{\langle y,y\rangle }}.}

Verallgemeinerung für positiv semidefinite, symmetrische Bilinearformen

Man kann den Beweis des Satzes so umformulieren, dass die positive Definitheit des Skalarprodukts nicht verwendet wird. Damit gilt die Aussage auch für jede positiv semidefinite, symmetrische Bilinearform (beziehungsweise hermitesche Sesquilinearform) b {\displaystyle b} .

Beweis für den reellen Fall

Man wählt denselben Ansatz, wie im Beweis, der das Skalarprodukt verwendet, trifft hier aber die Wahl

λ = b ( x , y ) b ( y , y ) + ε . {\displaystyle \lambda ={\frac {b(x,y)}{b(y,y)+\varepsilon }}.}

Damit muss man nicht mehr fordern, dass b ( y , y ) {\displaystyle b(y,y)} nicht 0 ist. Das ergibt

0 ≤ b ( x − λ y , x − λ y ) = b ( x , x ) − 2 λ b ( x , y ) + λ 2 b ( y , y ) . {\displaystyle 0\leq b(x-\lambda y,x-\lambda y)=b(x,x)-2\lambda b(x,y)+\lambda ^{2}b(y,y).}

Ähnlich wie im obigen Beweis folgert man

2 b ( x , y ) 2 − b ( x , y ) 2 b ( y , y ) b ( y , y ) + ε ≤ b ( x , x ) ( b ( y , y ) + ε ) . {\displaystyle 2b(x,y)^{2}-b(x,y)^{2}{\frac {b(y,y)}{b(y,y)+\varepsilon }}\leq b(x,x)(b(y,y)+\varepsilon ).}

und die Behauptung ist gezeigt, wenn ε {\displaystyle \varepsilon } gegen 0 konvergiert. Für b ( y , y ) = 0 {\displaystyle b(y,y)=0} folgt b ( x , y ) = 0 {\displaystyle b(x,y)=0} .

Bedingungen für die Gleichheit

Auch hier ist die Situation denkbar, dass aus der Ungleichung eine Gleichheit wird, zum Beispiel wenn (wie beim Skalarprodukt) x , y {\displaystyle x,y} linear abhängig sind. Allerdings sind auch Fälle denkbar, wo die Gleichheit eintritt, ohne dass eine lineare Abhängigkeit vorliegt. Man betrachte etwa eine entartete Bilinearform b {\displaystyle b} . Dann gibt es ein x ≠ 0 {\displaystyle x\neq 0} , so dass für alle y {\displaystyle y} des Vektorraums b ( x , y ) = 0 {\displaystyle b(x,y)=0} ist. Sei nun y {\displaystyle y} aus dem Vektorraum beliebig. Man erhält dann

| b ( x , y ) | 2 = 0 {\displaystyle |b(x,y)|^{2}=0}

und

b ( x , x ) b ( y , y ) = 0 ⋅ b ( y , y ) = 0 , {\displaystyle b(x,x)\,b(y,y)=0\cdot b(y,y)=0,}

also

| b ( x , y ) | 2 = b ( x , x ) b ( y , y ) , {\displaystyle |b(x,y)|^{2}=b(x,x)\,b(y,y),}

auch für den Fall, dass x {\displaystyle x} und y {\displaystyle y} linear unabhängig sind.

Weblinks

Wikibooks: Beweis der Cauchy-Schwarz-Ungleichung – Lern- und Lehrmaterialien

Literatur

Quellen

  1. Claudi Alsina, Roger B. Nelsen: Perlen der Mathematik - 20 geometrische Figuren als Ausgangspunkte für mathematische Erkundungsreisen, Springer Spektrum, Springer-Verlag GmbH Berlin 2015, ISBN 978-3-662-45460-2, Seiten 20 und 262 (o. B. d. A. wird hier der Fall n = 2 {\displaystyle n=2} betrachtet.)
  2. Augustin-Louis Cauchy: Analyse algébrique. 1821, S. 455 f. (Digitalisat auf Gallica). 
  3. V.I. Bityutskov: Bunyakovskii inequality. In: Michiel Hazewinkel (Hrsg.): Encyclopedia of Mathematics. Springer-Verlag und EMS Press, Berlin 2002, ISBN 1-55608-010-7 (englisch, encyclopediaofmath.org). 
  4. Eric W. Weisstein: Schwarz's Inequality. In: MathWorld (englisch).