Umkehrfunktion?dasInverse?oder < mehrere Veränderl. < reell < Analysis < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 17:13 Sa 26.01.2008 | Autor: | Igor1 |
Zeige, dass O(n)= [mm] f^{-1}(E) [/mm] gilt.
O(n):={X [mm] \in M_{n}(\IR):X^{T}X [/mm] = E}, E ist die Einheitsmatrix in [mm] M_{n}(\IR) \cong \IR^{nxn}.
[/mm]
Hallo,
was die Matrizen betrifft, kenne ich mich nicht "bestens" damit aus. Meine Frage zur Aufgabe ist, wie das Symbol [mm] f^{-1} [/mm] hier definiert wird. Bezeichnet es eine Umkehrabbildung der Abbildung f (f: [mm] M_{n}(\IR)\to Sym_{n}(\IR), f(X):=X^{T}X [/mm] )
[mm] Sym_{n}(\IR):= [/mm] { X [mm] \in M_{n}(\IR) :X=X^{T} [/mm] } oder ist es das Inverse von einer Matrix ?
Mein Versuch mit der Umkehrfunktion zu lösen:
Wenn z.B das eine Umehrfunktion ist ( wie sie in Analysis 1 definiert wird), dann muss man eine Funktion finden, die den Wert [mm] y=X^{T}X [/mm] konsumiert und der Wert dieser Funktion muss X sein. Eine solche Funktion könnte so aussehen: [mm] dasInverse_{X^{T}}*y(= X^{T}X)=dasInverse_{X^{T}}*y(=(X^{T}X)^{T})= [/mm] EX =X . Wenn man anstatt [mm] y=X^{T}X [/mm] y=E setzt : [mm] dasInverse_{X^{T}}*y(= [/mm] E) = [mm] dasInverse_{X^{T}}.
[/mm]
Ist das gleich O(n) ?
Gruss
Igor
|
|
|
|
Ist [mm]f: \ U \to V[/mm] irgendeine Funktion und [mm]V'[/mm] irgendeine Teilmenge von [mm]V[/mm], so versteht man unter [mm]f^{-1}(V')[/mm] die Menge aller [mm]u \in U[/mm] mit [mm]f(u) \in V'[/mm]. Man nennt [mm]f^{-1}(V')[/mm] das "Urbild von [mm]V'[/mm]".
Ist beispielshalber [mm]f: \ \mathbb{R} \to \mathbb{R}[/mm] die Quadratfunktion [mm]f(x) = x^2[/mm], so ist [mm]f^{-1}([-2,-1]) = \emptyset[/mm], denn es gibt keine [mm]x[/mm] mit [mm]f(x) \in [-2,-1][/mm]. Dagegen ist [mm]f^{-1}([-1,2]) = [- \sqrt{2}, \sqrt{2}][/mm] oder [mm]f^{-1}([1,2]) = [-\sqrt{2},-1] \cup [1,\sqrt{2}][/mm].
Bei deiner Funktion handelt es sich um die Matrixfunktion [mm]f(X) = X^TX[/mm] mit dem Raum aller quadratischen [mm]n[/mm]-reihigen Matrizen über [mm]\mathbb{R}[/mm] als Definitionsbereich und dem Raum aller symmetrischen Matrizen als Zielbereich. [mm] f^{-1}(E) [/mm] ist nun eine schlampige, aber übliche Schreibweise für [mm]f^{-1}(\{E\})[/mm], und das sind definitionsgemäß gerade die orthogonalen Matrizen.
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 20:00 Sa 26.01.2008 | Autor: | Igor1 |
Hallo,
wie kann man zeigen, dass [mm] f^{-1}(E)=O(n)?
[/mm]
Ist mein Ansatz annehmbar oder geht das anders?
Gruss
Igor
|
|
|
|
|
Meiner Ansicht nach ist da nichts zu zeigen, denn [mm]X^TX = E[/mm] ist ja gerade die Definition einer orthogonalen Matrix. Es sei denn, ihr habt "orthogonale Matrix" irgendwie anders definiert. Dann mußt du halt die Gleichung [mm]X^TX = E[/mm] nachweisen. [mm]f^{-1}(E) = O(n)[/mm] ist dann nur eine andere Formulierung für diese Tatsache.
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 12:24 So 27.01.2008 | Autor: | Igor1 |
Hallo,
Ja genau, O(n) ist die orthogonale Gruppe.
In der Aufgabe stand , dass man explizit die Gleichheit zeigen musste. Ich sehe z.B das nicht direkt, dass das gilt. Das ist eine Aussage , die man beweisen muss. B.z.w , nach Deiner Argumentation sind das zwei äquivalente Aussagen, dann weiss ich nicht wie man die Äquivalenz zeigt.
Ich habe doch die Definition der 0rthogonalen Gruppe hingeschrieben : O(n)=...
Jetzt muss man nachweisen, dass [mm] O(n)=f^{-1}(E)
[/mm]
Gruss
Igor
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 12:31 So 27.01.2008 | Autor: | andreas |
hi
schreibe dir doch das urbild [mm] $f^{-1}(\{E\}) [/mm] = [mm] f^{-1}(E)$ [/mm] für die hier gegeben abbildung $f$ mal konkret hin. dann solltest du sehen, dass dann nicht mehr so viel zu tuen ist. lies am besten dazu mal den von mir verlinkten wikipedia-artikel durch, der sollte alles nötige erklären.
grüße
andreas
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 16:09 So 27.01.2008 | Autor: | Igor1 |
Hallo,
ich habe die Definition für das Urbild angewendet und tatsächlich ist O(n)= [mm] f^{-1}(E) [/mm] ( folgt unmittelbar aus der Definition des Urbildes)
Gruss
Igor
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 16:26 So 27.01.2008 | Autor: | Igor1 |
Hallo,
ich habe zu dieser "Reihe" eine weitere Frage.
Zeige, dass das Differential df(A):f: [mm] M_{n}(\IR)\to Sym_{n}(\IR) [/mm] in A [mm] \in M_{n}(\IR) [/mm] durch
[mm] df(A)H=A^{T}H [/mm] + [mm] H^{T}A [/mm] , H [mm] \in M_{n}(\IR)
[/mm]
gegeben ist.
Muss man hier auch nur die Definition des Differentials im [mm] \IR^{n} [/mm] anwenden?
Das hieße, man müsste zuerst das Differential der Funktion f an der Stelle A finden, dann das mit H multiplizieren , was als Resultat die rechte Seite der Gleichung ergeben sollte.
Wie findet man solche Differentiale?. Ich habe das früher noch nicht gemacht .
Gruss
Igor
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 17:33 So 27.01.2008 | Autor: | andreas |
hi
wie habt ihr denn differntiale bei solchen abbildungen definiert? so ähnlich wie die von mir bei deiner letzten frage verlinkte fréchet-ableitung? das heißt es muss ein $g$ geben mit $f(A + H) = f(A) + [mm] \textrm{d}f(A)H [/mm] + g(H)$ und [mm] $\|g(X)\| \in o(\|X\|)$ [/mm] für [mm] $\|X\| \to [/mm] 0$? wenn ja, dann berechne doch mal $f(A + H)$.
grüße
andreas
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 20:23 So 27.01.2008 | Autor: | Igor1 |
Hallo,
ich verlinke zum Skript
Skript
Gruss
Igor
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 22:54 So 27.01.2008 | Autor: | andreas |
hi
gut. diesmal hat es mit dem verlinken geklappt und euer differenzierbarkeits-begriff scheint im großen und ganzen mit meinem übereinzustimmen. hast du denn nun schonmal $f(A + H)$ augrechnet? tritt $f(A)$ dabei auf, welche der teile sind linear und was verschindet für $H [mm] \to [/mm] 0$ schneller als linear?
grüße
andreas
|
|
|
|
|
Status: |
(Frage) überfällig | Datum: | 20:18 Mo 28.01.2008 | Autor: | Igor1 |
Hallo ,
ich habe die Lösungshinweise zu dieser Aufgabe, die ich nachvollziehen möchte.
f(A+H)-f(A)= [mm] A^{T}*H+ H^{T}*A+H^{T}*H
[/mm]
wegen [mm] \limes_{H\rightarrow\ 0} \bruch{\parallel H^{T}*H
\parallel_{op}}{
\parallel H
\parallel_{op}} \le \limes_{H\rightarrow\ 0} \parallel H^{T} \parallel_{op} [/mm] = 0 gilt [mm] df(A)*H=A^{T}*H+ H^{T}*A
[/mm]
Ich habe das versucht, so zu verstehen:
ich habe die Definition der Differenzierbarkeit genommen:
...
[mm] \limes_{h\rightarrow\ 0}\bruch{f(a+h)-f(a)-Lh}{
\parallel h
\parallel}= [/mm] 0
Tatsächlich, wenn man für Lh:= [mm] df(A)*H=A^{T}*H+ H^{T}*A [/mm] setzt, kommt das raus:
[mm] \limes_{H\rightarrow\ 0} \bruch{
H^{T}*H
}{
\parallel H
\parallel_{op}}
[/mm]
Dies muss gegen 0 konvergieren.
Zuerst habe ich eine Frage, warum hier(im Lösungshinweis) die Operatornorm verwendet wird und folgt daraus , dass
der letztere Ausdruck auch gegen 0 konvergiert?
Bei der Ungleichung der Grenzwerte steht größer gleich 0 , also ist die linke Seite gleich Null? (weil die Norm positiv ist).
Gruss
Igor
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 22:42 Mo 28.01.2008 | Autor: | Igor1 |
Hallo,
ich muss bei einer der Teilaufgaben folgendes zeigen:
die Gleichung df(A)*H=S S [mm] \in Sym_{n} \IR [/mm] besitzt eine Lösung.
Das ist wahr, zu jedem S gibt es eine Lösung H= [mm] \bruch{1}{2}AS. [/mm] (in den Lösungshinweisen nachgeschaut)
Wenn man jetzt für H den Wert einsetzt : [mm] df(A)*\bruch{1}{2}AS=S [/mm] muss gelten.
Wie kann ich die Gleichung genauer ausschreiben, um sie zu beweisen
Man kennt den Wert von df(A)H , jedoch nicht von df(A).Wie wird hier gerechnet (Rechenregeln für Matrizen).
Die vollständige Teilaufgabe lautete:
Zeige, dass E ein regulärer Wert von f ist,d.h., df(A)ist für jede orthogonale Matrix A surjektiv. Zeige hierfür, dass die Gleichung df(A)H=S , S [mm] \in Sym_{n} \IR [/mm] eine Lösung besitzt.
Warum wird hier die Surjektivität von df(A)H und nicht von
df(A) verwendet ?
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 10:50 Fr 01.02.2008 | Autor: | SEcki |
> Wenn man jetzt für H den Wert einsetzt :
> [mm]df(A)*\bruch{1}{2}AS=S[/mm] muss gelten.
>
> Wie kann ich die Gleichung genauer ausschreiben, um sie zu
> beweisen
Für das H oben musst du den Ausdruck [m]\bruch{1}{2}AS[/m] einsetzen und dann [m]A^{t}A=E[/m] beachten.
> Man kennt den Wert von df(A)H , jedoch nicht von df(A).
Das ist falsch - die lineare Abbildung wurde oben genau angegeben! Es kommt drauf an, was du mit Wert meinst, für mein Empfinden steht alles da.
> Warum wird hier die Surjektivität von df(A)H und nicht von
> df(A) verwendet ?
Das stimmt auch nicht - man soll die Surjektivität von [m]df(A)[/m] zeigen, das heisst also für jedes S muss man ein x finden mit [m]df(A)(x)=S[/m]. Das wurde dort gemacht.
SEcki
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 20:20 Do 31.01.2008 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|