Skalarprodukt < Analysis < Hochschule < Mathe < Vorhilfe
|
|
Status: |
(Antwort) fertig | Datum: | 08:28 Di 05.10.2004 | Autor: | Stefan |
Eingabefehler: "\left" und "\right" müssen immer paarweise auftreten, es wurde aber ein Teil ohne Entsprechung gefunden (siehe rote Markierung)
Lieber Micha!
Ich gehe mal davon aus, dass dir in der Musterlösung ab
"Damit erhält man für das Taylorpolynom 2. Grades von $f$im Punkt $p$"
alles klar ist, denn ab da wird ja nur noch eingesetzt. Sollte das nicht der Fall sein, dann melde dich bitte unbedingt noch einmal.
So, jetzt zu dem ersten Teil: Wir haben ja:
(*) $f(x) = c + \langle a,x \rangle + \langle x,x \rangle = c + \sum\limits_{i=1}^n a_i \cdot x_i + \sum\limits_{i=1}^n x_i^2$.
Zunächst berechnen wir den Gradienten. Dort stehen die ersten partiellen Ableitungen nach den $x_i$. Wie du siehst, taucht jedes $x_i$ zweimal auf: In beiden Summen jeweils einmal. Nur diese beiden Summanden tragen etwas zur partiellen Ableitung nach $x_i$ bei, alle anderen Summanden sind jeweils als Konstanten zu behandeln und fallen bei der partiellen Ableitung weg. Wir haben also die beiden Ausdrücke $a_i \cdot x_i$ und $x_i^2$, die beide nach $x_i$ abgeleitet werden müssen, woraus man $a_i$ und $2x_i$ erhält, also:
$\frac{\partial f}{\partial x_i}(x) = a_i + 2x_i$.
Daher ist (an der Stelle $x=p$, daher $p_i$ statt $x_i$!):
$J_pf = (\frac{\partial f}{\partial x_1}(p), \frac{\partial f}{\partial x_2}(p),\ldots, \frac{\partial f}{\partial x_n}(p)) = (a_1 + 2p_1, a_2 + 2p_2, \ldots , a_n + 2 p_n)$.
Nun wollen wir die Hesse-Matrix bilden, also die jeweils zweifachen partiellen Ableitungen berechnen. Wenn wir nun (*) erst partiell nach $x_i$ und dann partiell nach $x_j$ ableiten, ist dies auf jeden Fall $0$. Warum? Wenn ich partiell nach $x_i$ ableite, dann bleiben nur die Ableitungen der Summanden übrig, in denen ein $x_i$ steht. In diesen Ableitungen taucht aber ein $x_j$ gar nicht mehr auf. Somit stehen außerhalb der Diagonalen der Hesse-Matrix auf jeden Fall Nullen.
Was ist nun mit den Diagonalelementen, also mit
$\frac{\partial^2 f}{\partial x_i^2}(p)$?
Dazu müssen wir
$\frac{\partial f}{\partial x_i}(x) = a_i + 2x_i$
noch einmal nach $x_i$ ableiten (und dann den Punkt $p$ einsetzen).
Es ist aber:
$\frac{\partial^2 f}{\partial x_i^2}(x) = \frac{\partial}{\partial x_i} \left( a_i + 2x_i) = 2$.
(Hier kann man dann kein $p$ mehr einsetzen. )
Daher stehen auf der Diagonalen der Hesse-Matrix nur $2$en , und wir erhalten:
$\mbox{Hess}_pf = \begin{pmatrix} 2 & 0 & 0 & \ldots & 0 \\ 0 & 2 & 0 & \ldots & 0 \\ \vdots & \ddots & \ddots & \ddots & \vdots \\ 0 & \ldots & 0 & 2 & 0 \\ 0 & \ldots & 0 & 0 & 2 \end{pmatrix}$.
Ich hoffe ich konnte dir weiterhelfen. Oder ist noch etwas unklar geblieben?
Liebe Grüße
Stefan
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 10:58 Di 05.10.2004 | Autor: | Micha |
Hallo nochmal!
> [mm]J_pf = (\frac{\partial f}{\partial x_1}(p), \frac{\partial f}{\partial x_2}(p),\ldots, \frac{\partial f}{\partial x_n}(p)) = (a_1 + 2p_1, a_2 + 2p_2, \ldots , a_n + 2 p_n)[/mm].
Ok Stefan, das habe ich jetzt verstanden. Ich wollte da in der Arbeit wohl irgendwie alles zusammen ableiten oder auch nich, bzw. unter dem Druck war mir gar nicht klar, was ich überhaupt machen soll.
Nur wie kommen die in der Musterlösung darauf, dass das [mm] D_pf(y)= \left + 2 \left [/mm]? Wo kommt hier das y auf einmal her? Und warum sieht das meiner Jacobimatrix nich im Geringsten ähnlich?
>
> Nun wollen wir die Hesse-Matrix bilden, also die jeweils
> zweifachen partiellen Ableitungen berechnen. Wenn wir nun
> (*) erst partiell nach [mm]x_i[/mm] und dann partiell nach [mm]x_j[/mm]
> ableiten, ist dies auf jeden Fall [mm]0[/mm]. Warum? Wenn ich
> partiell nach [mm]x_i[/mm] ableite, dann bleiben nur die Ableitungen
> der Summanden übrig, in denen ein [mm]x_i[/mm] steht. In diesen
> Ableitungen taucht aber ein [mm]x_j[/mm] gar nicht mehr auf. Somit
> stehen außerhalb der Diagonalen der Hesse-Matrix auf jeden
> Fall Nullen.
>
> Was ist nun mit den Diagonalelementen, also mit
>
> [mm]\frac{\partial^2 f}{\partial x_i^2}(p)[/mm]?
>
> Dazu müssen wir
>
> [mm]\frac{\partial f}{\partial x_i}(x) = a_i + 2x_i[/mm]
>
> noch einmal nach [mm]x_i[/mm] ableiten (und dann den Punkt [mm]p[/mm]
> einsetzen).
>
> Es ist aber:
>
> [mm]\frac{\partial^2 f}{\partial x_i^2}(x) = \frac{\partial}{\partial x_i} \left( a_i + 2x_i) = 2[/mm].
>
>
> (Hier kann man dann kein [mm]p[/mm] mehr einsetzen. )
>
> Daher stehen auf der Diagonalen der Hesse-Matrix nur [mm]2[/mm]en ,
> und wir erhalten:
>
> [mm]\mbox{Hess}_pf = \begin{pmatrix} 2 & 0 & 0 & \ldots & 0 \\ 0 & 2 & 0 & \ldots & 0 \\ \vdots & \ddots & \ddots & \ddots & \vdots \\ 0 & \ldots & 0 & 2 & 0 \\ 0 & \ldots & 0 & 0 & 2 \end{pmatrix}[/mm].
Ok das habe ich jetzt nach genauem Hinsehen und mit der Herleitung auch verstanden, danke. Nur auch hier wieder die Frage, warum da noch steht "oder [mm] $D_p^2f= 2\left$ [/mm] ?
Ich fühle mich etwas verschaukelt, weil wir in der Vorlesung und in den Übungen auf so ein schwieriges Beispiel nicht eingegangen sind und nun wird einem so eine Minilösung angeboten und man kann sehen wie man damit zurecht kommt. Ich wette 95% der Leute, die die Aufgabe nicht hatten, werden aus der Musterlösung auch nich schlau! *hier mal seinem Ärger etwas Luft machen muss*
Vielleicht kannst du mir die 2 Nachfragen noch beantworten, ansonsten hast du mir schon sehr geholfen Stefan (jeder andere darf natürlich auch antworten, wenn er mag! )
Gruß Micha
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 11:23 Di 05.10.2004 | Autor: | Stefan |
Lieber Micha!
> > [mm]J_pf = (\frac{\partial f}{\partial x_1}(p), \frac{\partial f}{\partial x_2}(p),\ldots, \frac{\partial f}{\partial x_n}(p)) = (a_1 + 2p_1, a_2 + 2p_2, \ldots , a_n + 2 p_n)[/mm].
>
>
> Ok Stefan, das habe ich jetzt verstanden. Ich wollte da in
> der Arbeit wohl irgendwie alles zusammen ableiten oder auch
> nich, bzw. unter dem Druck war mir gar nicht klar, was ich
> überhaupt machen soll.
> Nur wie kommen die in der Musterlösung darauf, dass das
> [mm]D_pf(y)= \left + 2 \left [/mm]? Wo kommt
> hier das y auf einmal her? Und warum sieht das meiner
> Jacobimatrix nich im Geringsten ähnlich?
Was ist denn $D_pf(y)$? Das ist gerade
$J_pf [mm] \cdot [/mm] y$,
also das Produkt des Gradienten mit dem Vektor $y$. Nun schauen wir uns $J_pf$ oben mal genauer an. Wir können [mm] $(a_1 [/mm] + [mm] 2p_1, a_2 [/mm] + [mm] 2p_2, \ldots [/mm] , [mm] a_n [/mm] + 2 [mm] p_n)$ [/mm] ja auch so schreiben:
$(a + [mm] 2p)^T [/mm] = [mm] a^T [/mm] + [mm] 2p^T$,
[/mm]
wobei $a$ und $p$ Spaltenvektoren des [mm] $\IR^n$ [/mm] sind.
Dann ist also zu berechnen:
$J_pf [mm] \cdot [/mm] y = [mm] (a^T [/mm] + [mm] 2p^T) \cdot [/mm] y = [mm] a^T \cdot [/mm] y + [mm] 2p^T \cdot [/mm] y$.
Es gilt aber allgemein für zwei Spaltenvektoren:
[mm] $x^T \cdot [/mm] y = [mm] \langle [/mm] x,y [mm] \rangle$.
[/mm]
Daher ist insgesamt:
$D_pf(y) = J_pf [mm] \cdot [/mm] y = [mm] \langle [/mm] a,y [mm] \rangle [/mm] + 2 [mm] \langle [/mm] p,y [mm] \rangle$.
[/mm]
Jetzt klarer?
> Ok das habe ich jetzt nach genauem Hinsehen und mit der
> Herleitung auch verstanden, danke. Nur auch hier wieder die
> Frage, warum da noch steht "oder [mm]D_p^2f= 2\left[/mm]
> ?
Gleiches Spielchen wie oben:
Was ist denn [mm] $D_p^2f(y)$?
[/mm]
Es gilt:
[mm] $D_p^2f(y) [/mm] = [mm] \langle [/mm] y, [mm] \mbox{Hess}_p(f) \cdot [/mm] y [mm] \rangle$,
[/mm]
wobei [mm] $\mbox{Hess}_p(f)$ [/mm] nach dem schon berechneten eine Diagonalmatrix ist, auf deren Diagonale lauter $2$en stehen. Daher gilt:
[mm] $\mbox{Hess}_p(f) \cdot [/mm] y = 2y$,
und insgesamt:
[mm] $D_p^2f(y) [/mm] = [mm] \langle [/mm] y, [mm] \mbox{Hess}_p(f) \cdot [/mm] y [mm] \rangle [/mm] = [mm] \langle [/mm] y, 2y [mm] \rangle [/mm] = 2 [mm] \langle [/mm] y,y [mm] \rangle$.
[/mm]
Ist es jetzt klar? Wenn nicht, dann frage bitte nach.
Liebe Grüße
Stefan
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 11:39 Di 05.10.2004 | Autor: | Micha |
Hallo!
> Was ist denn [mm]D_pf(y)[/mm]? Das ist gerade
>
> [mm]J_pf \cdot y[/mm],
Ok das hätte ich wissen sollen. ^^ *an Kopf klatsch*
>
>...
>
> [mm]J_pf \cdot y = (a^T + 2p^T) \cdot y = a^T \cdot y + 2p^T \cdot y[/mm].
>
>
> Es gilt aber allgemein für zwei Spaltenvektoren:
>
> [mm]x^T \cdot y = \langle x,y \rangle[/mm].
>
> Daher ist insgesamt:
>
> [mm]D_pf(y) = J_pf \cdot y = \langle a,y \rangle + 2 \langle p,y \rangle[/mm].
>
>
> Jetzt klarer?
Ja, danke!
>
...
>
> und insgesamt:
>
> [mm]D_p^2f(y) = \langle y, \mbox{Hess}_p(f) \cdot y \rangle = \langle y, 2y \rangle = 2 \langle y,y \rangle[/mm].
>
Hier nutzt du die Bilinearität vom Skalarprodukt aus, oder? Gilt dann nicht auch:
[mm]\langle \lambda \cdot a, b \rangle = \lambda \langle a,b,\rangle = \langle a, \lambda \cdot b \rangle [/mm] ???
Dieser Zusammenhang wird mir erst jetzt irgendwie bewusst. Ich hoffe es stimmt.
Gruß Micha
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 11:48 Di 05.10.2004 | Autor: | Stefan |
Lieber Micha!
> Hier nutzt du die Bilinearität vom Skalarprodukt aus, oder?
> Gilt dann nicht auch:
> [mm]\langle \lambda \cdot a, b \rangle = \lambda \langle a,b,\rangle = \langle a, \lambda \cdot b \rangle[/mm]
> ???
, sehr schön.
Ich denke damit ist jetzt alles klar, oder?
Liebe Grüße
Stefan
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 12:02 Di 05.10.2004 | Autor: | Micha |
Hallo Stefan!
>
> Ich denke damit ist jetzt alles klar, oder?
>
Ich hoffe doch mal, aber bei der nächsten Aufgabe mit Skalarprodukt werd ich wieder gucken wien Auto. xD
LG Micha
|
|
|
|