Allgemeine, lineare Regression < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Aufgabe | Betrachten Sie das Regressionsmodell [mm] y_{i}=\beta_{1}+\beta_{2}x_{i}+u_{i}. [/mm] Es seien die Beobachtungsvektoren [mm] y=(4,4,2,2)^{T} [/mm] und [mm] x=(1,2,1,2)^{T} [/mm] gegeben. Nehmen Sie an, dass die Residualvarianz der ersten und vierten Beobachtung doppelt so groß ist wie die der beiden anderen Beobachtungen.
a) Erläutern Sie, welches Problem in diesem Modell vorliegt und welche Auswirkungen es auf den OLS-Schätzer hat.
b) Berechnen Sie für dieses Modell den GLS-Schätzer [mm] \hat\beta_{GLS}
[/mm]
c) Ermitteln Sie die Kovarianzmatrix für [mm] \hat\beta_{GLS}
[/mm]
d) Geben Sie die t-Statistik für [mm] \hat\beta_{2,GLS} [/mm] an und testen Sie, ob der Koeffizient auf dem 5%-Nivau statistisch signifikant von Null verschieden ist.
e) Berechnen Sie den Wert des zugehörigen [mm] R^{2}. [/mm] Was fällt Ihnen dabei auf? |
Hallo!
Zunächst poste ich mal, zwecks Korrekturlesung, die Ergebnisse meiner Berechnungen. Danach hätte ich noch eine Frage, insbesonere zum Ergebnis im Aufgabenteil e).
zu a)
Ist soweit klar. Entsprechende Konsequenzen sind auch an den nachfolgend verwendeten Formeln zu erkennen.
zu b)
gemäß [mm] \hat\beta_{GLS}=(X^{T}\Omega^{-1}X)^{-1}X^{T}\Omega^{-1}y, [/mm] mit [mm] X=\pmat{ 1 & 1 \\ 1 & 2 \\ 1 & 1 \\ 1 & 2 }, y=\vektor{ 4 \\ 4 \\ 2 \\ 2 \\ } [/mm] und [mm] \Omega=\pmat{ 2 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 2 }
[/mm]
erhalte ich [mm] \hat\beta_{GLS}=\vektor{ 2 \\ \bruch{2}{3} }
[/mm]
zu c)
Im Allgemeinen hat man
[mm] \hat{V}(\hat\beta_{GLS})=\hat\sigma^{2}(X^{T}\Omega^{-1}X)^{-1}, [/mm] mit [mm] \hat\sigma^{2}=\bruch{(y-X\hat\beta_{GLS})^{T}\Omega^{-1}(y-X\hat\beta_{GLS})}{n-k}
[/mm]
Mit n=4 und k=2 erhalte ich
[mm] \hat\sigma^{2}=\bruch{4}{3} [/mm] und
[mm] \hat{V}(\hat\beta_{GLS})=\pmat{ \bruch{40}{9} & -\bruch{8}{3} \\ -\bruch{8}{3} & \bruch{16}{9} }
[/mm]
zu d)
t- Statistik: [mm] t_{2}=\bruch{\hat\beta_{2,GLS}}{\wurzel{\hat{V}(\hat\beta_{GLS})_{22}}}=\bruch{1}{2}
[/mm]
kritischer Wert: [mm] t_{0,975}(2)=4,303
[/mm]
[mm] \hat\beta_{2,GLS} [/mm] ist also auf dem 5%-Niveau statistisch signifikant von Null verschieden.
zu e)
Man hat im Allgemeinen
[mm] R^{2}=1-\bruch{(y-X\hat\beta_{GLS})^{T}(y-X\hat\beta_{GLS})}{\summe_{i=1}^{n}(y_{i}-\overline{y})^{2}}
[/mm]
Mit [mm] \summe_{i=1}^{n}(y_{i}-\overline{y})^{2}=4 [/mm] erhalte ich
[mm] R^{2}=-\bruch{1}{9}
[/mm]
Frage:
Ich habe die ganze Geschichte nun schon zweimal durchgerechnet und kann Rechenfehler eigentlich schon ausschließen. Wenn ich mich nicht irgendwo vertan habe, wieso erhalte ich ein negatives Bestimmtheitsmaß? Was sagt mir dieser Wert dann? Bisher hatte ich immer [mm] R^{2}\in[0,1] [/mm] vermutet.
Über eine Korrekturlesung und über eine Beantwortung der Frage würde ich mich freuen. Vielen Dank!
Gruß, Marcel
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 20:20 Di 06.07.2010 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|
|
Eine Antwort würde mich nach wie vor interessieren. Vielen Dank!
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 23:20 Do 08.07.2010 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 20:53 Fr 09.07.2010 | Autor: | Marcel08 |
Interesse besteht nach wie vor. Danke!
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 00:33 Sa 10.07.2010 | Autor: | Blech |
Hi,
ich glaub Dir einfach mal bei den numerischen Werten, die klingen plausibel.
zu d:
Du hast einen Parameter mit Wert [mm] $\frac23$ [/mm] und Standardabweichung [mm] $\sqrt{\frac{16}9}=\frac43$ [/mm] (da kommt das [mm] $\frac12$ [/mm] her). Das allein sollte Dir sagen, daß es kaum zu so einem Niveau signifikant sein kann. Du müßtest größer als der kritische Wert sein.
zu e:
Was Dir der negative Wert sagt, ist daß Deine Parameter den Response schlechter schätzen als [mm] $\bar [/mm] y$. Das ist auch nicht weiter verwunderlich. Du hast vier Punkte, die die Ecken eines Quadrats bilden, natürlich ist der beste lineare Schätzer eine horizontale Linie durch die Mitte. Nur wird seitens der Aufgabenstellung die Verläßlichkeit der Punkte auf der linken oberen und rechten unteren Ecke in Zweifel gezogen (d.h. größere Varianz), also kommt eine leicht steigende Linie raus, weil die beiden weniger gewichtet werden.
Bei der Berechnung von [mm] $R^2$ [/mm] werden aber alle Punkte gleich behandelt, die unterschiedlichen Unsicherheiten bleiben unberücksichtigt. Normalerweise ist der LSE immer maximal so schlecht wie ein bloßer intercept (das wäre dann [mm] $\bar [/mm] y$, also der Nenner), dementsprechend kann [mm] $R^2$ [/mm] auch nicht negativ werden. Aber hier beantwortet der GLSE eine andere Frage, also die, die von Deiner Formel für [mm] $R^2$ [/mm] dann gestellt wird.
ciao
Stefan
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 10:28 Sa 10.07.2010 | Autor: | Marcel08 |
Vielen Dank für die ausführliche Erklärung.
|
|
|
|