(Punkt-) Schätzung < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 12:01 Mi 12.10.2005 | Autor: | Didi |
Hallo,
Ich habe ein riesen Problem mit einer Aufgabe. Ich denke, dass ich a) beantworten konnte, b) sieht glaube ich auch ganz gut aus, aber mit c) komme ich gar nicht klar :( . Ich muss auch anmerken, dass ich die Schätztheorie noch nicht wirklich verstehe.
Hier die Aufgabe:
Ein Verleger will die Druckfehler in einem Buch abschätzen. Dazu wählt er n Seiten zufällig aus und zählt die Anzahl X [mm] \_{1} [/mm] ,..., X [mm] \_{n}
[/mm]
a) Begründe, warum jedes X [mm] \_{i} [/mm] bei einem gut durchgesehenen Buch näherungsweise als Poissonverteilt angesehen werden können.
b) X [mm] \_{1} [/mm] ,..., X [mm] \_{n} [/mm] sind unabhängig und Poissonverteilt.
[mm] \lambda' \_{1} [/mm] = 1/n * [mm] \summe_{i=1}^{n} [/mm] X [mm] \_i
[/mm]
[mm] \lambda' \_{2} [/mm] = 1/2n * [mm] \summe_{i=1}^{n} [/mm] X [mm] \_i
[/mm]
Diese beiden Schätzer werden zur Schätzung des Poissonparameters [mm] \lambda [/mm] >0 vorgeschlagen. Sind sie erwartungstreu?
c) Hier soll man den mittleren quadratischen Fehler R [mm] \_1 (\lambda) [/mm] := [mm] E[(\lambda' \_1 [/mm] - [mm] \lambda)^{2}] [/mm] von [mm] \lambda' \_1 [/mm] bestimmen und nachweisen, dass dieser die untere Schranke aus der Cramer-Rao-Ungleichung erreicht.
Außerdem soll man den mittleren quadratischen Fehler R [mm] \_2 (\lambda) [/mm] von [mm] ^\lambda \_2 [/mm] berechnen und das Vorzeichen von [mm] R\_2 (\lambda) [/mm] - [mm] R\_1 (\lambda) [/mm] anhand der Bias-Varianz-Zerlegung erklären.
Cramer-Rao-Ungleichung: [mm] Var\_v [/mm] (v') [mm] \ge [/mm] 1/I(v) (I(v) = Fisher-Information)
Bias-Varianz-Zerlegung: [mm] E[(v'-v)^2] [/mm] = [mm] (E[v']-v]^2+Var(v')
[/mm]
Nun zu meinen Lösungsversuchen:
a) X [mm] \_1 [/mm] ... X [mm] \_2 [/mm] sind unabhängige Zufallsvariablen.
Die Anzahl der Druckfehler ist diskret verteilt.
Die Anzahl der gefundenen Druckfehler kann man als unabhängige Einzelexperimente auffassen.
=> es würde eigentlich eine Binomialverteilung vorliegen.
Bei einem gut durchgesehenen Manuskript ist die Anzahl der Seiten jedoch weit größer als die ANzahl der Fehler. Daher geht die Binomialverteilung in eine Poissonverteilung über.
b) Ein Schätzer heißt erwartungstreu, wenn [mm] E[\lambda'] [/mm] = [mm] \lambda
[/mm]
[mm] \lambda' \_1 [/mm] := 1/n * [mm] \summe_{i=1}^{n} [/mm] X [mm] \_i
[/mm]
[mm] E[\lambda' \_1] [/mm] = E[1/n* [mm] \summe_{i=1}^{n} [/mm] X [mm] \_i [/mm] ] = 1/n * [mm] \summe_{i=1}^{n} [/mm] E[X [mm] \_i [/mm] ] = 1/n * np = p (Kann ich jetzt einfach sagen, dass p= [mm] \lambda [/mm] ???)
Dann wäre der Schätzer erwartungstreu.
Für den anderen analog => [mm] E[\lambda' \_2] [/mm] = 1/2n * np = 1/2 p = 1/2 [mm] \lambda [/mm] (falls das letzte= stimmt) ???
Der Schätzer ist nicht erwartungstreu.
c) Hier habe ich eigentlich überhaupt keine Ahnung. Und brauche wirklich dringend Hilfe!
Ich habe nur eingesetzt.
R [mm] \_1 (\lambda) [/mm] := E [mm] \_\lambda [/mm] [{(1/n * [mm] \summe_{i=1}^{n} [/mm] X [mm] \_i) [/mm] - E(1/n * [mm] \summe_{i=1}^{n} [/mm] X [mm] \_i)}^2] [/mm] = ... ???
R [mm] \_2 (\lambda) [/mm] := E [mm] \_\lambda [/mm] [{(1/2n * [mm] \summe_{i=1}^{n} [/mm] X [mm] \_i) [/mm] - E(1/2n * [mm] \summe_{i=1}^{n} [/mm] X [mm] \_i)}^2] [/mm] = ...???
Für jede Hilfe bin ich wirklich dankbar.
Ich habe die Frage in keinen anderen Foren gestellt.
(Ich hoffe, dass keine Tippfehler drin sind)
|
|
|
|
Hallo Didi!
> a) X [mm]\_1[/mm] ... X [mm]\_2[/mm] sind unabhängige Zufallsvariablen.
> Die Anzahl der Druckfehler ist diskret verteilt.
> Die Anzahl der gefundenen Druckfehler kann man als
> unabhängige Einzelexperimente auffassen.
> => es würde eigentlich eine Binomialverteilung vorliegen.
Hier solltest Du noch angeben, mit welchen Parametern. [mm] $X_1$ [/mm] ist ja die Anzahl der Fehler, die er auf der ersten rausgegriffenen Seite entdeckt. Ich finde es nicht offensichtlich, warum dort eine Obergrenze (Parameter $n$ der Binomialverteilung, nicht zu verwechseln mit der Anzahl $n$ an Seiten, die hier geprüft wurden) an Fehlern vorliegen muss. Man könnte für $n$ die Anzahl an Zeichen auf der Seite nehmen und dann für jedes Zeichen prüfen, ob es richtig dargestellt ist oder nicht. So kommt man auf eine Binomialverteilung für die Fehlerzahl auf dieser Seite, wenn $p$ die Wahrscheinlichkeit dafür ist, ein bel. Zeichen falsch darzustellen.
> Bei einem gut durchgesehenen Manuskript ist die Anzahl
> der Seiten jedoch weit größer als die ANzahl der Fehler.
> Daher geht die Binomialverteilung in eine Poissonverteilung
> über.
Mit der Anzahl der Seiten des Manuskripts hat das meines Erachtens nach nichts zu tun. Da die Zahl der Zeichen auf einer Seite (das $n$ aus der Binomialverteilung) sehr groß ist, kann man näherungsweise von einer Poissonverteilung ausgehen.
> b) Ein Schätzer heißt erwartungstreu, wenn [mm]E[\lambda'][/mm] =
> [mm]\lambda[/mm]
> [mm]\lambda' \_1[/mm] := 1/n * [mm]\summe_{i=1}^{n}[/mm] X [mm]\_i[/mm]
>
> [mm]E[\lambda' \_1][/mm] = E[1/n* [mm]\summe_{i=1}^{n}[/mm] X [mm]\_i[/mm] ] = 1/n *
> [mm]\summe_{i=1}^{n}[/mm] E[X [mm]\_i[/mm] ] = 1/n * np = p (Kann ich jetzt
> einfach sagen, dass p= [mm]\lambda[/mm] ???)
> Dann wäre der Schätzer erwartungstreu.
Moment. Es wird doch davon ausgegangen, dass [mm] $X_1,\ldots,X_n$ [/mm] identisch poissonverteilt sind mit Parameter [mm] $\lambda$. [/mm] Das $p$ aus der Binomialverteilung brauchst Du also gar nicht mehr. Es gilt [mm] $E(X_i)=\lambda$ [/mm] sowie [mm] $Var(X_i)=\lambda$, $i=1,\ldots,n$ [/mm] (für später).
> Für den anderen analog => [mm]E[\lambda' \_2][/mm] = 1/2n * np =
> 1/2 p = 1/2 [mm]\lambda[/mm] (falls das letzte= stimmt) ???
> Der Schätzer ist nicht erwartungstreu.
Auch hier kommt also direkt [mm] $E[\lambda' \_2]=\frac{1}{2}\lambda$ [/mm] heraus.
> c) Hier habe ich eigentlich überhaupt keine Ahnung. Und
> brauche wirklich dringend Hilfe!
Nach der von Dir angegebenen Formel für den mittleren quadratischen Fehler gilt
[mm] $R_1(\lambda)=[E(\lambda_1')-\lambda]^2+Var(\lambda_1')$
[/mm]
[mm] $=(\lambda-\lambda)^2 [/mm] + [mm] \frac{1}{n^2}Var\left(\sum_i X_i\right)$
[/mm]
[mm] $=0+\frac{n}{n^2} Var(X_1)=\frac{\lambda}{n}$
[/mm]
[mm] $R_2$ [/mm] überlasse ich mal Dir. Nun kümmern wir uns noch um die Informationsungleichung. Es gilt ja
[mm] $I(\lambda)=E\left(\left[\frac{\partial}{\partial \lambda} \log \prod_{i=1}^n f(X_i;\lambda)\right]^2\right),$
[/mm]
wobei $f$ die Zähldichte der Poissonverteilung ist, d.h.
[mm] $\prod_{i=1}^n f(X_i;\lambda) [/mm] = [mm] \prod_{i=1}^n \frac{\lambda^{X_i}}{X_i !}e^{-\lambda}$
[/mm]
[mm] $=\lambda^{\sum_i X_i}\cdot\left(\prod_{i=1}^n X_i !\right)^{-1}\cdot e^{-n\lambda}$
[/mm]
Damit folgt
[mm] $\log \prod_{i=1}^n f(X_i;\lambda) =-n\lambda+\sum_{i=1}^n X_i\log(\lambda)-\log\left(\prod_{i=1}^n X_i !\right)$
[/mm]
Differentiation dieses Ausdrucks nach [mm] $\lambda$ [/mm] ergibt [mm] $-n+\sum_{i=1}^n X_i/\lambda$, [/mm] also
[mm] $I(\lambda)=E \left(\left[\sum_{i=1}^n X_i/\lambda-n\right]^2\right).$
[/mm]
Mit
[mm] $E\left(\sum_{i=1}^n X_i/\lambda\right)=\frac{n\lambda}{\lambda}=n$ [/mm] folgt wegen [mm] $Var(Y)=E([Y-E(Y)]^2)$ [/mm] aber gerade
[mm]I(\lambda)=E \left(\left[\sum_{i=1}^n X_i/\lambda-E\left(\sum_{i=1}^n X_i/\lambda\right)\right]^2\right)=Var\left(\sum_{i=1}^n X_i/\lambda\right)
=\frac{nVar(X_1)}{\lambda^2}=\frac{n\lambda}{\lambda^2}=\frac{n}{\lambda}.[/mm]
Dies entspricht exakt dem Kehrwert von [mm] $R_1(\lambda)$, [/mm] dem mittleren quadratischen Fehler von [mm] $\lambda_1'$. [/mm]
Was genau mit dem Vorzeichen von [mm] $R_2$ [/mm] und [mm] $R_1$ [/mm] gemeint ist, weiß ich gerade nicht, weil man nicht einfach sagen kann, dass beide Summanden bei [mm] $R_2$ [/mm] größer sind als die entsprechenden bei [mm] $R_1$, [/mm] aber vielleicht fällt Dir dazu ja nun selbst noch was Schlaues ein.
Hoffe, ich konnte Dir helfen. Frag nach, wenn was unklar ist.
Viele Grüße
Brigitte
|
|
|
|