Positiv definite Matrix < Matrizen < Lineare Algebra < Hochschule < Mathe < Vorhilfe
|
Aufgabe | Ferner gilt der folgende einfache Satz, den der Leser leicht selbst beweist.
Satz 3.34:
Eine symmetrische (n,n)-Matrix S ist genau dann positiv definit, wenn W^tSW positiv definit ist für jede reguläre reelle (n,n)-Matrix W. |
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
Der Leser beweise folgenden leichten Satz:
Eine symmetrische (n,n)-Matrix S ist genau dann positiv definit, wenn W^TSW
positiv definit ist. W ist als regulär vorausgesetzt.
[mm] (W^T [/mm] ist W transponiert.)
Mir fehlt ein Ansatz für diesen Beweis.
Ich weiß, dass W^TSW mit S symmetrisch und n-reihig, W n-reihig und beliebig wieder eine symmetrische Matrix ist und dass positiv definite Matrizen regulär sein müssen. Deswegen müssen sowohl S als auch W regulär sein.
Wie kann man nun obigen Satz beweisen?
Viele Grüße,
Christof
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 19:23 Sa 12.06.2010 | Autor: | Marcel |
Hallo,
> Ferner gilt der folgende einfache Satz, den der Leser
> leicht selbst beweist.
>
> Satz 3.34:
>
> Eine symmetrische (n,n)-Matrix S ist genau dann positiv
> definit, wenn W^tSW positiv definit ist für jede reguläre
> reelle (n,n)-Matrix W.
> Ich habe diese Frage in keinem Forum auf anderen
> Internetseiten gestellt.
>
> Der Leser beweise folgenden leichten Satz:
>
> Eine symmetrische (n,n)-Matrix S ist genau dann positiv
> definit, wenn W^TSW
> positiv definit ist. W ist als regulär vorausgesetzt.
>
> [mm](W^T[/mm] ist W transponiert.)
>
> Mir fehlt ein Ansatz für diesen Beweis.
>
> Ich weiß, dass W^TSW mit S symmetrisch und n-reihig, W
> n-reihig und beliebig wieder eine symmetrische Matrix ist
> und dass positiv definite Matrizen regulär sein müssen.
> Deswegen müssen sowohl S als auch W regulär sein.
>
> Wie kann man nun obigen Satz beweisen?
ich denke, dass Du das mithilfe der Charakterisierung
[mm] $$\text{symm. }M \in \IR^{(n,n)} \text{p.d.} \gdw x^T [/mm] M x [mm] \blue{\;>\;} [/mm] 0 [mm] \text{ für alle }x \in \IR^n\blue{\setminus\{0\}}$$
[/mm]
schaffen solltest.
Hier der Beweis für obige Aussage, wenn man anstatt "positiv definit" positiv semidefinit schreibt (dann gilt [mm] $\text{symm. }M \in \IR^{(n,n)} \text{p.sd.} \gdw x^T [/mm] M x [mm] \ge [/mm] 0 [mm] \text{ für alle }x \in \IR^n$):
[/mm]
[mm] "$\Rightarrow$"
[/mm]
Ist $S$ p.sd. und $x [mm] \in \IR^n$, [/mm] so gilt [mm] $x^T (W^T [/mm] S [mm] W)x=y^T [/mm] S y [mm] \ge [/mm] 0$ wegen der p.sD. von [mm] $S\,,$ [/mm] wobei $y:=Wx [mm] \in \IR^n\,.$
[/mm]
(Beachte dabei: $A [mm] \in \IR^{(n,m)}$, [/mm] $B [mm] \in \IR^{(m,p)}$ $\Rightarrow$ $(A*B)^T=B^T*A^T\,.$)
[/mm]
[mm] "$\Leftarrow$"
[/mm]
Ist [mm] $W^T [/mm] S W$ p.sd., so gilt für jedes $x [mm] \in \IR^n$: $x^T*S*x=y^T (W^T [/mm] S W)y [mm] \ge 0\,,$ [/mm] wenn man [mm] $y:=W^{-1}x$ [/mm] setzt (und hier siehst Du auch, warum man die Regulärität von [mm] $W\,$ [/mm] fordert; insbesondere gilt auch $y [mm] \in \IR^n$). [/mm]
(Beachte dabei: [mm] $(W^{-1})^T=(W^T)^{-1}$ [/mm] und das Assoziativgesetz bzgl. Matrizenmultiplikation.)
P.S.:
Bei der Aussage mit p.D. beachte man: $x [mm] \not=0 \Rightarrow$ $Wx\not=0$ [/mm] (Warum?) und [mm] $W^{-1}x\not=0$ [/mm] (Warum?).
Gruß,
Marcel
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 20:52 Sa 12.06.2010 | Autor: | Peter_Pan2 |
ok also kann man es so begründen, dass [mm] x^tW^t [/mm] = [mm] (Wx)^T [/mm] = [mm] y^T [/mm] gilt und
x^tW^tSWx = y^tSy > 0 mit y [mm] \in \IR^n [/mm] ? Das folgt ja wieder aus der positiven Definitheit von S.
Die Regularität von W ist meiner Meinung nach deswegen gefordert, weil W^tSW auch regulär und damit det(W^tSW) [mm] \not= [/mm] 0 sein muss.
Vg,
Christof
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 01:48 So 13.06.2010 | Autor: | Marcel |
Hallo Christoph,
> ok also kann man es so begründen, dass [mm]x^tW^t[/mm] = [mm](Wx)^T[/mm] =
> [mm]y^T[/mm] gilt und
> x^tW^tSWx = y^tSy > 0 mit y [mm]\in \IR^n[/mm] ? Das folgt ja
> wieder aus der positiven Definitheit von S.
>
> Die Regularität von W ist meiner Meinung nach deswegen
> gefordert, weil W^tSW auch regulär und damit det(W^tSW)
> [mm]\not=[/mm] 0 sein muss.
also, wenn ich mir den Beweis direkt angucke, dann würde ich sagen, dass man bei ja mehrere Sachen berücksichtigen muss:
Damit [mm] $y:=W^{-1}x$ [/mm] überhaupt definiert ist, muss [mm] $W\,$ [/mm] schon regulär sein (wie will man sonst [mm] $W^{-1}$ [/mm] hinschreiben?). Damit man danach dann [mm] $x^TSx=y^T(W^TSW)y [/mm] > 0$ folgern kann, muss, wenn $x [mm] \not=0$ [/mm] ist, auch [mm] $W^{-1}x=y \not=0$ [/mm] sein. D.h. insbesondere auch, dass [mm] $W^{-1}$ [/mm] injektiv bzw. [mm] $W\,$ [/mm] surjektiv sein muss.
Bei $y:=Wx$ sollte auch für $x [mm] \not=0$ [/mm] dann $y [mm] \not=0$ [/mm] sein, um eine entsprechende Ungleichung mit [mm] $\,>$ [/mm] folgern zu können. D.h., dass [mm] $W\,$ [/mm] hier injektiv sein sollte.
Insgesamt sollte also [mm] $W\,$ [/mm] eine bijektive Abbildung [mm] $\IR^n \to \IR^n$ [/mm] sein, also [mm] $W\,$ [/mm] eine reguläre Matrix, denn:
Fehlt die Surjektivität, so bekommt man bei [mm] $y:=W^{-1}x$ [/mm] (wobei hier manchmal schon fragwürdig wäre, was [mm] $W^{-1}x$ [/mm] eigentlich sein soll) das Problem, dass in der zugehörigen Ungleichung im Beweis dann anstatt [mm] $>\,$ [/mm] i.a. nur noch [mm] $\ge$ [/mm] geschrieben werden darf. D.h. hier dürfte man nur noch [mm] $x^TSx=y^T(W^TSW)y \ge [/mm] 0$ schreiben, so dass man aus der positiven Definitheit von $W^TSW$ nur die positive Semidefinitheit von [mm] $S\,$ [/mm] folgern kann.
In dem anderen Beweisschritt erhält man das gleiche Problem, denn wenn $x [mm] \not=0$ [/mm] und [mm] $W\,$ [/mm] nicht injektiv ist, dann wird es [mm] $x_0 \not=0$ [/mm] mit [mm] $y_0=Wx_0=0$ [/mm] geben, so dass wir nicht mehr [mm] $(x_0)^T(W^TSW)x_0=(y_0)^T [/mm] S [mm] y_0 \red{>}0,$ [/mm] sondern nur [mm] $(x_0)^T(W^TSW)x_0=(y_0)^T [/mm] S [mm] y_0 \blue{\ge}0$ [/mm] schreiben dürfen. Also nur die positive Semidefinitheit von $W^TSW$ aus der positiven Definitheit von [mm] $S\,$ [/mm] folgern könnten.
P.S.:
Die Regulärität von $W^TSW$ folgt dann übrigens insbesondere aus der positiven Definitheit von [mm] $W^TSW\,.$ [/mm] Deswegen denke ich nicht, dass man die Regularität von [mm] $W\,$ [/mm] vorausgesetzt hat, damit $W^TSW$ eine nicht verschwindende Determinante hat, sondern dieses Ergebnis folgt sowieso, wenn man die p.D. von $W^TSW$ nachgerechnet hat.
Beste Grüße,
Marcel
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 18:30 So 13.06.2010 | Autor: | Peter_Pan2 |
ok also ich denke ich habe es soweit verstanden, und ich nehme W jetzt als regulär an und S als positiv definit.
Dann müsste man doch schlicht folgern können x^tW^tSWx = y^tSy > 0 mit y := Wx weil dann kein [mm] \ge [/mm] mehr gelten kann ?
Und mit regulärem W und S sowie W^tSW im Buch explizit als positiv definit vorausgesetzt
gilt dann auch x^tW^tSWx > 0. Da x [mm] \in \IR^n [/mm] gilt muss ja mit regulärem W auch Wx [mm] \in \IR^n [/mm] gelten und mit y := Wx dann auch y^tSy > 0 und damit die andere Richtung.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 07:38 Mo 14.06.2010 | Autor: | Marcel |
Hallo,
> ok also ich denke ich habe es soweit verstanden, und ich
> nehme W jetzt als regulär an und S als positiv definit.
> Dann müsste man doch schlicht folgern können x^tW^tSWx =
> y^tSy > 0 mit y := Wx weil dann kein [mm]\ge[/mm] mehr gelten kann ?
wieso soll kein [mm] $\ge$ [/mm] mehr gelten können? Das [mm] $\ge$ [/mm] gilt dann auch, denn beachte, dass eine Ungleichung mit [mm] $>\,$ [/mm] eine schärfere Bedingung ist:
Aus $a > [mm] 0\,$ [/mm] folgt insbesondere $a [mm] \ge 0\,.$ [/mm] (Aber aus $a [mm] \ge [/mm] 0$ folgt nicht $a > [mm] 0\,$!) [/mm] Beachte auch, dass daher jede positiv definite Matrix insbesondere positiv semidefinit ist. (Aber nicht jede positiv semidefinite Matrix ist auch positiv definit.)
Oben ist daher einfach wichtig, dass man, wenn man $x [mm] \not=0$ [/mm] hat, dann auch $y [mm] \not=0$ [/mm] hat. Bei [mm] $y:=Wx\,$ [/mm] erhält man das wegen der Injektivität von [mm] $W\,$ [/mm] (beachte: [mm] $W\,$ [/mm] ist genau dann nicht injektiv, wenn der Kern von [mm] $W\,$ [/mm] nicht nur den Nullvektor enthält).
Wäre nämlich nun [mm] $y=0\,,$ [/mm] obwohl $x [mm] \not=0$ [/mm] ist, so könnten wir i.a. nur die schwächere Ungleichung $y^TSy [mm] \;\blue{\ge\;}0$ [/mm] folgern. Wir müssen aber stets die schärfere Ungleichung [mm] $y^T [/mm] S y > 0$ folgern können (und aus dieser erhalten wir insbesondere auch $y^TSy [mm] \ge 0\,,$ [/mm] was wir aber nicht brauchen), wenn wir die positive Definitheit von [mm] $W^TSW\,$ [/mm] einsehen wollen.
> Und mit regulärem W und S sowie W^tSW im Buch explizit als
> positiv definit vorausgesetzt
> gilt dann auch x^tW^tSWx > 0. Da x [mm]\in \IR^n[/mm] gilt muss ja
> mit regulärem W auch Wx [mm]\in \IR^n[/mm] gelten und mit y := Wx
> dann auch y^tSy > 0 und damit die andere Richtung.
Wie gesagt: Es ist schon wichtig, dass man $x [mm] \in \IR^n \blue{\setminus\{0\}} \Rightarrow [/mm] Wx=:y [mm] \in \IR^n \blue{\setminus \{0\}}$ [/mm] hat. Dies folgt aus der Injektivität von [mm] $W\,$ [/mm] (welche hier gleichbedeutend mit der Surjektivität und Bijektivität ist, da $W [mm] \in \IR^{n \times n}$; [/mm] und als reguläre Matrix ist [mm] $W\,$ [/mm] natürlich bijektiv und damit insbesondere injektiv).
Also nochmal:
Nehmen wir mal an, wir lassen die Regularität und damit die Injektivität von [mm] $W\,$ [/mm] in der Voraussetzung weg, aber alles andere bleibt wie gehabt. Dann ist [mm] $W\,$ [/mm] nicht injektiv.
Sei nun [mm] $S\,$ [/mm] wie oben und positiv definit. Ist nun $x [mm] \in \IR^n \setminus \{0\}$, [/mm] so folgt "nur", dass $y=Wx [mm] \in \IR^n$ [/mm] ist. Damit erhält man "nur"
[mm] $$x^T (W^T [/mm] S [mm] W)x=y^T [/mm] S y [mm] \blue{\;\ge\;} 0\,,$$
[/mm]
also nicht mehr die postive Definitheit, sondern nur die positive Semidefinitheit von [mm] $W^TSW\,.$ [/mm] Jetzt könnte man zwar sagen, dass eine positiv semidefinite Matrix ja dennoch auch positiv definit sein könnte (man ist da ja nahe dran: wenn man $a [mm] \ge [/mm] 0$ weiß und $a > [mm] 0\,$ [/mm] "braucht", muss man ja "nur noch zeigen, dass $a=0$ nie sein kann"), aber:
Da [mm] $W\,$ [/mm] nicht injektiv ist, gibt es [mm] $x_0 \in \IR^n$, $x_0\not=0$ [/mm] mit [mm] $Wx_0=0\,.$ [/mm] Dann folgt
[mm] $$(x_0)^T(W^TSW)x_0 \blue{\;=\;}0,$$
[/mm]
weil [mm] $(x_0)^T(W^TSW)x_0=0^TS0$ [/mm] ist. (Dabei ist [mm] $0^T$ [/mm] der transponierte Nullvektor des [mm] $\IR^n\,,$ [/mm] der also [mm] $n\,$ [/mm] Spalten mit jeweils dem Eintrag $0 [mm] \in \IR$ [/mm] enthält.) Also ist dann $W^TSW$ wirklich auch nur positiv semidefinit und kann nicht positiv definit sein.
Beste Grüße,
Marcel
|
|
|
|