Ableiten nach Transponiertem V < Matrizen < Lineare Algebra < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 22:05 Mo 23.07.2012 | Autor: | Drno |
Aufgabe | In der Herleitung eines Kleinste-Quadrate-Schätzers soll
[mm] $\left \| \mathbf{b} - A\mathbf{x} \right \|_2$ [/mm] minimiert werden.
Das Problem ist äquivalent zur Minimierung von
[mm] $(\mathbf{b} [/mm] - [mm] A\mathbf{x} )^T (\mathbf{b} [/mm] - [mm] A\mathbf{x} [/mm] )$.
Multipliziert man das aus, kommt man auf
[mm] $\mathbf{b}^T\mathbf{b} [/mm] - [mm] 2\mathbf{b}^TA\mathbf{x} [/mm] + [mm] \mathbf{x}^TA^TA\mathbf{x}$
[/mm]
Nun löst man:
[mm] \frac{d}{d\mathbf{x}} [/mm] ... = 0 |
Meine Frage:
wie leitet man diesen Ausdruck [mm] $\mathbf{x}^TA^TA\mathbf{x}$ [/mm] richtig ab?
Im Skalaren fall wäre es einfach, aber da man nach einem Vektor [mm] $\mathbf{x}$ [/mm] ableitet ist das nicht ganz so einfach. Nun habe ich mir folgendes überlegt.
Ich könnte [mm] $\mathbf{x}^TA^TA\mathbf{x} [/mm] = [mm] F(\mathbf{x})\mathbf{x}$ [/mm]
schreiben, wobei [mm] $F(\mathbf{x}) [/mm] = [mm] (A^TA\mathbf{x})^T$ [/mm] wäre. Allerdings ist mir nicht ganz klar, wie ich das mit der Produktregel ableiten soll.
Kurz gefasst: Wie leite ich eine Gleichung nach [mm] \mathbf{x} [/mm] ab, die auch [mm] \mathbf{x}^T [/mm] enthält?
(und zwar mathematisch sauber)
Vielen Dank!
|
|
|
|
Hallo,
> In der Herleitung eines Kleinste-Quadrate-Schätzers soll
>
> [mm]\left \| \mathbf{b} - A\mathbf{x} \right \|_2[/mm] minimiert
> werden.
>
> Das Problem ist äquivalent zur Minimierung von
>
> [mm](\mathbf{b} - A\mathbf{x} )^T (\mathbf{b} - A\mathbf{x} )[/mm].
>
> Multipliziert man das aus, kommt man auf
>
> [mm]\mathbf{b}^T\mathbf{b} - 2\mathbf{b}^TA\mathbf{x} + \mathbf{x}^TA^TA\mathbf{x}[/mm]
>
> Nun löst man:
>
> [mm]\frac{d}{d\mathbf{x}}[/mm] ... = 0
> Meine Frage:
>
> wie leitet man diesen Ausdruck [mm]\mathbf{x}^TA^TA\mathbf{x}[/mm] richtig ab?
Sei [mm] f:\IR^n\to\IR, x\mapsto\mathbf{x}^TA^TA\mathbf{x}
[/mm]
Bilde mal [mm] \frac{\partial f(x)}{\partial x_i}, [/mm] wobei [mm] x=(x_1,\ldots,x_n) [/mm] und [mm] $1\le i\le [/mm] n$.
Aus allen partiellen Ableitungen kannst Du dann den Gradienten zusammensetzen.
Herauskommen sollte: [mm] $\nabla f(x)=\red{2}x^TA^TA$.
[/mm]
LG
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 23:05 Mo 23.07.2012 | Autor: | Drno |
Danke für die Antwort. Es müsste aber $ [mm] \nabla [/mm] f(x)=2 x^TA^TA $ sein weil das Problem quadratisch ist, oder?
Gibt es einen Namen oder Fachbegriff für diese Art von Ableitung?
|
|
|
|
|
> Danke für die Antwort. Es müsste aber [mm]\nabla f(x)=2 x^TA^TA[/mm]
> sein weil das Problem quadratisch ist, oder?
Stimmt! Ich korrigiere es gleich noch.
>
> Gibt es einen Namen oder Fachbegriff für diese Art von Ableitung?
Nö, ist das ganz normal der Gradient für eine Funktion [mm] f:\IR^n\to\IR [/mm]
LG
|
|
|
|