Kolmogorov-Smirnov-Anpassungst < math. Statistik < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 19:46 Sa 08.06.2013 | Autor: | Ellie123 |
Hallo,
ich beschäftige mich gerade mit dem Kolmogorov-Smirnov-Anpassungstest und habe dazu eine Verständnisfrage.
Wenn ich testen will, ob eine gegebene Messreihe tatsächlich aus einer vorgegebenen Verteilung [mm] F_0(x) [/mm] stammen
kann, dann bildet man ja die empirische Verteilungsfunktion [mm] F_n(x)
[/mm]
und vergleicht diese mit den Werten der hypothetischen Verteilungsfunktion [mm] F_0(x). [/mm] Und wenn dann der folgende Wert
[mm] D_n [/mm] = sup| [mm] F_n(x)-F_0(x)|
[/mm]
einen bestimmten kritischen Wert nicht überschreitet, wird die Nullhypothese akzeptiert. Das heißt ja nichts anderes als dass die maximale Differenz der beiden Funktionswerte [mm] F_n(x) [/mm] und [mm] F_0(x) [/mm] einen kritischen Wert nicht überschreiten darf.
Bis hierhin habe ich es, glaube ich noch richtig verstanden, oder?
Aber, dann beginnen meine Probleme:
Es ist doch richtig, dass man [mm] D_n [/mm] als Stichprobenverteilung auffassen kann, oder?
Nur weiß ich leider nicht, wie genau diese Verteilung aussieht bzw. wie man die entsprechenden Quantile dazu bestimmt??
Dann ist bei mir im Buch noch von dieser folgenden Verteilung die Rede,welche man wohl eher verwendet, weil man bei ihr besser die Quantilwerte bestimmen kann, oder so ähnlich:
[mm] \wurzel{n}D_n
[/mm]
Das verstehe ich nicht. Wieso multipliziert man das [mm] D_n [/mm] jetzt mit [mm] \wurzel{n} [/mm] ? Wie verändert sich dadurch die ursprüngliche Verteilung [mm] D_n? [/mm] Kann man diese beiden Verteilungen auch irgendwie graphisch Darstellen, weil ich finde dazu irgendwie nirgends etwas?
Wenn mir jemand weiterhelfen würde, wäre ich wirklich sehr, sehr froh und dankbar!
Lieben Gruß,
Ellie.
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 09:51 So 09.06.2013 | Autor: | luis52 |
Moin Elii123
> Hallo,
>
> ich beschäftige mich gerade mit dem
> Kolmogorov-Smirnov-Anpassungstest und habe dazu eine
> Verständnisfrage.
> Wenn ich testen will, ob eine gegebene Messreihe
> tatsächlich aus einer vorgegebenen Verteilung [mm]F_0(x)[/mm]
> stammen
> kann, dann bildet man ja die empirische
> Verteilungsfunktion [mm]F_n(x)[/mm]
> und vergleicht diese mit den Werten der hypothetischen
> Verteilungsfunktion [mm]F_0(x).[/mm] Und wenn dann der folgende
> Wert
>
> [mm]D_n[/mm] = sup| [mm]F_n(x)-F_0(x)|[/mm]
>
> einen bestimmten kritischen Wert nicht überschreitet, wird
> die Nullhypothese akzeptiert. Das heißt ja nichts anderes
> als dass die maximale Differenz der beiden Funktionswerte
> [mm]F_n(x)[/mm] und [mm]F_0(x)[/mm] einen kritischen Wert nicht
> überschreiten darf.
> Bis hierhin habe ich es, glaube ich noch richtig
> verstanden, oder?
Ja.
>
> Aber, dann beginnen meine Probleme:
> Es ist doch richtig, dass man [mm]D_n[/mm] als
> Stichprobenverteilung auffassen kann, oder?
Das ist nicht das korrekte Wort, sie *besitzt* eine Verteilung unter der Nullhypothese.
> Nur weiß ich leider nicht, wie genau diese Verteilung
> aussieht bzw. wie man die entsprechenden Quantile dazu
> bestimmt??
> Dann ist bei mir im Buch noch von dieser folgenden
> Verteilung die Rede,welche man wohl eher verwendet, weil
> man bei ihr besser die Quantilwerte bestimmen kann, oder so
> ähnlich:
> [mm]\wurzel{n}D_n[/mm]
>
> Das verstehe ich nicht. Wieso multipliziert man das [mm]D_n[/mm]
> jetzt mit [mm]\wurzel{n}[/mm] ? Wie verändert sich dadurch die
> ursprüngliche Verteilung [mm]D_n?[/mm] Kann man diese beiden
> Verteilungen auch irgendwie graphisch Darstellen, weil ich
> finde dazu irgendwie nirgends etwas?
Nirgends? Im Zeitalter des Internets? Das kann nicht sein. Z.B. steht hier etwas. Der Faktor [mm] $\sqrt{n}$ [/mm] dient dazu, eine Grenzverteilung angeben zu koennen (auch beim Zentralen Grenzwertsatz braucht man diesen Faktor). Die Bestimmung der Verteilung [mm] $D_n$ [/mm] ist sehr schwierig, so dass sie m.W. nicht so einfach gezeichnet werden kann. Weiteres findest du in Buechern zu nichtparametrischen Verfahren.
vg Luis
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 19:41 Mi 19.06.2013 | Autor: | Ellie123 |
Hallo nochmal,
vielen Dank für die Antwort. Leider bin ich nach wie vor verwirrt. Was nun daran liegt, dass ich nun bei einer Aufgabe die Dichte der KS-Prüfstatistik angeben soll. Und ich weiß leider überhaupt nicht, was damit gemeint ist??
Kann mir da jemand weiterhelfen?
Viele Grüße,
ellie123
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 21:14 Mi 19.06.2013 | Autor: | luis52 |
Gib mal bitte den genauen Wortlaut der Aufgabe an.
vg Luis
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 11:30 Do 20.06.2013 | Autor: | Ellie123 |
Hallo Luis,
leider kann ich keinen genauen Wortlaut der Aufgabe angeben. Es geht nämlich darum, dass eine Ausarbeitung im Rahmen eines Praktikums geschrieben werden sollte. Darin habe ich sinngemäß geschrieben, dass beim KS Anpassungstest der betragsmäßig größte Abstand zwischen der empirischen Verteilungsfunktion und der hypothetischen Verteilungsfunktion bestimmt wird:
[mm] \sup_{x} |F_e_m_p(x) [/mm] - [mm] F_h_y_p(x)|
[/mm]
Dieser betragsmäßig größte Abstand darf , abhängig vom Signifikanzniveau [mm] \alpha, [/mm] bestimmte kritische Werte nicht überschreiten. Diese kritischen Werte sind für große Stichproben näherungsweise gegeben durch folgende Formel:
[mm] \bruch{\wurzel{ln(2/\alpha)}}{\wurzel{2n}}
[/mm]
Nun hat der Praktikumsbetreuer mir geschrieben und meinte ich sollte doch die "Dichte der KS-Prüfstatistik" mit angeben. Und ich weiß nicht was er damit meint. Bei anderen Prüfstatistiken, die z.B. eine Chi-Quadrat Verteilung besitzen, gibt es eine geschlossene Formel. Aber in dem Fall finde ich nichts....
Was kann er also damit meinen???
Bin sehr, sehr dankbar für weitere Infos.
LG, ellie123
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 14:14 Do 20.06.2013 | Autor: | luis52 |
Moin Ellie,
ich weiss nicht, was sich dein Praktikumsbetreuer hier denkt, denn das ist eine harte Nuss. Schau mal hier
http://www.jstatsoft.org/v08/i18/paper
In
@book{gibbons2003nonparametric,
title={Nonparametric statistical inference},
author={Gibbons, Jean Dickinson and Chakraborti, Subhabrata},
volume={168},
year={2003},
publisher={CRC press}
}
findest du ein ein Beispiel fuer $n=2$.
vg Luis
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 17:47 Do 20.06.2013 | Autor: | Ellie123 |
Hallo Luis,
vielen Dank für deine Antwort. Ich glaube ich werde einfach nochmal nachfragen.
Vielleicht hat er sich ja auch irgendwie verschrieben und meinte was ganz anderes?`
Viele Grüße,
Ellie123
|
|
|
|
|
Hallo Luis und alle zusammen,
ich habe nun den Kursbetreuer danach gefragt, was er mit der Dichtefunktion der KS Prüfstatistik meint.
Und er hat mich auf diesen englischen Wikipedia Eintrag verwiesen:
http://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test
Aber eine richtige Dichtefunktion, wie man es zb von der Normalverteilung her kennt, ist hier ja auch nicht gegeben, oder?
Ich meine, der Ausdruck mit dem Summenzeichen und der e-Funktion drin, wäre dann ja wohl die Verteilungsfunktion der Kolmogorov-Verteilung oder? Ich hab ja so im Gefühl, dass man bei der Kolmogorov Verteilung solch eine Dichtefunktion als Formel, wie man das zB von der normalverteilung her kennt, gar nicht angeben kann, oder? Und irgendwie betrachtet man ja wohl auch statt der eigentlichen Verteilung die Grenzverteilung [mm] \limes_{n\rightarrow\infty} \sqrt(n) D_n; [/mm] oder?
Was ich leider auch nicht weiß, ist was es mit dieser Brownschen Brücke aus dem Wikipediaeintrag auf sich hat. Das habe ich noch nie gehört und was ich mir bisher darüber angeschaut habe, hat mich auch nicht schlauer gemacht. Leider fehlt mir auch die Zeit dazu mich näher damit zu beschäftigen.
Logischerweise verstehe ich dann auch nicht,was diese Brownsche Brücke mit der Kolmogorov Verteilung zu tun hat.
Vielleicht kann mir das jemand (oder du Luis) in einfachen Worten erklären. Auch wenns nur eine oberflächliche Erklärung ist, das reicht mir im Augenblick nämlich schon.
MfG,
Ellie123
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 15:49 Di 25.06.2013 | Autor: | luis52 |
Moin Ellie,
ich teile deine Eindruecke ganz und gar, denke nur, dass nicht wir sondern der Kursbetreuer dein Ansprechpartner sein sollte. Hast du schon einmal in die Literaturstelle geschaut?
vg Luis
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 16:20 Sa 29.06.2013 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|