Bestimmung Verwerfungsbereich < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 09:02 Do 02.08.2007 | Autor: | mathe26 |
Aufgabe | Überprüfung meiner empirischen Studie auf statistische Signifikanz mit dem Kontigenztest. |
Wie komme ich auf den Verwerfungsbereich B?
Meine Vorgehensweise:
Ein Signifikanzniveau Alpha von 0,05 wird angenommen.
Zuerst habe ich eine Kontigenztabelle mit Randhäufigkeiten und den Werten p und q erstellt. Die Tabelle habe ich mit den absoluten Häufigkeiten der Ausprägungen x und y befüllt (2 Spalten und 3 Zeilen mit absoluten Häufigkeiten). Anschließend habe ich eine weitere Tabelle aufgestellt mit den Werten ~hij (die Welle steht über dem h). Danach habe ich aus dieser Tabelle den Testfunktionswert (v) errechnet.
Mein Ergebnis war v = 5,90.
Fraktilswert: 1 - Alpha = 1 - 0,05 = 0,95
Verwerfungsbereich B habe ich aus den Anhang-Seiten des Statistik-Buches von Bamberg et al. entnommen.
0,95-Fraktile der F-Verteilung mit m und n Freiheitsgraden
m = 2 und n = 7 -> B = 4,74
m = 7 und n = 2 -> B = 19,35
B = (4,74; [mm] \infty) [/mm] oder B = [mm] (19,35;\infty)
[/mm]
Mir ist nur nicht klar für was m und n steht? Welcher Wert steht für Spalte und welcher für Zeile? Liege ich mit meiner Vermutung richtig, dass diese Anhangs-Seite mir weiterhilft?
Für was steht eigentlich dieses Symbol [mm] \infty [/mm] ? Dieses wird in dem Statistik-Buch immer in der Klammer des Verwerfungsbereiches dargestellt.
Viele Grüße
mathe 26
Ich habe diese Frage auch in folgenden Foren auf anderen Internetseiten gestellt:
http://www.matheboard.de/thread.php?threadid=135087
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 12:01 Do 02.08.2007 | Autor: | luis52 |
Moin mathe26,
zunaecht einmal ein herzliches
> Meine Vorgehensweise:
>
> Ein Signifikanzniveau Alpha von 0,05 wird angenommen.
>
> Zuerst habe ich eine Kontigenztabelle mit Randhäufigkeiten
> und den Werten p und q erstellt. Die Tabelle habe ich mit
> den absoluten Häufigkeiten der Ausprägungen x und y befüllt
> (2 Spalten und 3 Zeilen mit absoluten Häufigkeiten).
> Anschließend habe ich eine weitere Tabelle aufgestellt mit
> den Werten ~hij (die Welle steht über dem h). Danach habe
> ich aus dieser Tabelle den Testfunktionswert (v)
> errechnet.
>
> Mein Ergebnis war v = 5,90.
>
> Fraktilswert: 1 - Alpha = 1 - 0,05 = 0,95
Deine Frage verwirrt mich. Du willst anscheinend einen Test im
Zusammenhang mit einer Kontingenztabelle durchfuehren. Dabei ist mir
zunaechst unklar, was deine Werte $p$ und $q$ bedeuten. Gehen die in
deinen Testfunktionswert $v$ ein? Was fuer eine Hypothese testet du
denn ueberhaupt? Ich vermute die der Unabhaengigkeit von zwei Merkmalen. Wenn dem
so ist, so musst du den Wert von $v$ mit den Prozentpunkten einer
Chi-Quadrat- und nicht einer F-Verteilung vergleichen, in deinem Fall mit
einer Chi-Quadrat-Verteilung mit [mm] $(2-1)\times(3-1)=2$ [/mm] Freiheitsgraden.
>
> Verwerfungsbereich B habe ich aus den Anhang-Seiten des
> Statistik-Buches von Bamberg et al. entnommen.
>
> 0,95-Fraktile der F-Verteilung mit m und n Freiheitsgraden
>
> m = 2 und n = 7 -> B = 4,74
> m = 7 und n = 2 -> B = 19,35
>
> B = (4,74; [mm]\infty)[/mm] oder B = [mm](19,35;\infty)[/mm]
Wo kommt den auf einmal $n=7$ her?
>
> Mir ist nur nicht klar für was m und n steht? Welcher Wert
> steht für Spalte und welcher für Zeile?
In der Legende einer jeden Tabelle zur $F(m,n)$-Verteilung
ist erklaert, wo der erste Parameter (hier $m$) und wo der zweite
Parameter (hier $n$) zu finden ist. Im Buch von Bamberg/Baur (12.
Auflage) steht $m$ in den Zeilen $n$ in den Spalten.
> Liege ich mit
> meiner Vermutung richtig, dass diese Anhangs-Seite mir
> weiterhilft?
Was denn fuer eine Anhangsseite?
>
> Für was steht eigentlich dieses Symbol [mm]\infty[/mm] ? Dieses wird
> in dem Statistik-Buch immer in der Klammer des
> Verwerfungsbereiches dargestellt.
[mm] $\infty$ [/mm] steht fuer Unendlich. Dein Verwerfbereich [mm] $B=(4.74,\infty)$ [/mm] kannst du auch so schreiben:
[mm] $B=\{v\mid v\in\IR, v>4.74\}$, [/mm] also das unbeschraenkte Intervall aller reellen Zahlen $>4.74$. Das bedeutet, dass du die Hypothese verwirfst, wenn $v>4.74$ eintritt.
LG Luis
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 14:31 Do 02.08.2007 | Autor: | mathe26 |
Hallo Luis!
Vielen Dank für den schönen Willkommensgruß und Deine Antwort.
Mir ist jetzt doch vieles klarer.
Ich hab eine Hypothese aufgestellt, dass das Vorwissen von Kunden vom Involvement abhängt. Spalten sind High/Low-Involvement und die Zeilen bestehen aus dem Items zum Vorwissen (d.h. wie sich die Kunden informieren).
Ergibt 2 Spalten und 7 Zeilen: m = 2; n = 7
Meine Hypothese muss ich auf statistische Signifikanz überprüfen. x und y sollten für die Hypothesenerfüllung in Zusammenhang stehen.
Die Häufigkeiten der von x und y habe ich in eine Kontigenztabelle eingetragen mit Randhäufigkeiten und die Werte p und q errechnet. Die Bezeichnung für p und q ist mir selber nicht klar. p und q gehen aber indirekt in den Testfunktionswert v ein.
Den Wert q für die erste Spalte habe ich errechnet indem ich die Randhäufigkeit der ersten Spalte durch die Summe der Randhäufigkeiten aller Zeilen dividiert habe.
Den Wert habe p für die erste Zeile habe ich errechnet indem ich die Randhäufigkeit der ersten Zeile durch die Summe aller Randhäufigkeiten aller Zeilen dividiert habe.
Die Summe der Randhäufigkeiten der Zeilen stimmt mit der Summe der Summe Randhäufigkeiten der Spalten überein. Wenn ich das richtig verstanden habe, ist dies bei einer Kontigenztabelle normal.
Die einzelnen Häufigkeitswerte der Kontigenztablle habe ich anschließend mit q multipliziert und in eine neue Tabelle übertragen. Wieder eine Tabelle mit 2 Spalten und 7 Zeilen.
Danach habe ich den Testfunktionswert v in einer aufwendigen Excel-Rechnung ermittelt.
Von der Häufigkeit der ersten Tabelle (Zeile 1, Spalte 1) habe ich den errechneten Wert aus der zweiten Tabelle (Zeile 1, Spalte 1) subtrahiert. Das Ergebnis quadriert. Dieses Ergebnis habe ich dann nochmals durch den errechneten Wert der zweiten Tabelle (Zeile 1, Spalte 1) dividiert.
Für alle 14 Häufigkeiten der Tabelle habe ich diese Rechnung vorgenommen und alle Ergebnisse miteinander summiert.
Dies ergab meinen Wert v = 5,90
Den Fraktilswert kann ich ja selber festlegen, indem ich 1 - Alpha rechne. Alpha kann ich auch selber festlegen (umso höher Alpha ist, desto höher ist die Wahrscheinlichkeit, dass die Hypothese auf einen größeren Personenkreis nicht zutrifft).
Wenn ich Alpha mit 0,05 festlegt, liegt der Fraktilswert bei 1-0,05 = 0,95
Beim Vergleich mit den Prozentpunkten einer Chi-Quadrat-Verteilung bekomme ich folgendes Ergebnis:
(2 - 1) x (7 - 1) = 6
In der Tabelle habe ich dann n = 6 ausgewählt und Alpha = 0,95. In Bamberg et al. (Tabellenanhang, S. 322, Auflage 13, Tabelle 5; Alpha-Fraktile der ChiQuadrat-Verteilung mit n Freiheitsgraden) steht der Wert 12,59.
Dies bedeutet, dass mein errechneter Wert v = 5,90 innerhalb dieses Bereichs liegt. (v < 12,59). Die beiden Werte sind damit abhängig voneinander und die Hypothese bestätigt.
Wann macht es Sinn Gruppenunterschiede auf statistische Signifikanz zu überprüfen?
Was bedeutet das Wort Fraktile?
Gibt es in Excel ein Funktion mit der ich den Wert v errechnen kann?
Viele Grüße
mathe26
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 16:02 Do 02.08.2007 | Autor: | luis52 |
Hallo mathe26,
>
> Meine Hypothese muss ich auf statistische Signifikanz
> überprüfen. x und y sollten für die Hypothesenerfüllung in
> Zusammenhang stehen.
>
> Die Häufigkeiten der von x und y habe ich in eine
> Kontigenztabelle eingetragen mit Randhäufigkeiten und die
> Werte p und q errechnet. Die Bezeichnung für p und q ist
> mir selber nicht klar. p und q gehen aber indirekt in den
> Testfunktionswert v ein.
langsam kommt auch bei mir Licht ins Dunkle. Du scheinst dich an BB,
13. Auflage Seite 202-204 zu orientieren. Da werden die Symbole [mm] $p_i$ [/mm] und
[mm] $q_j$ [/mm] verwendet...
>
> Den Wert q für die erste Spalte habe ich errechnet indem
> ich die Randhäufigkeit der ersten Spalte durch die Summe
> der Randhäufigkeiten aller Zeilen dividiert habe.
>
> Den Wert habe p für die erste Zeile habe ich errechnet
> indem ich die Randhäufigkeit der ersten Zeile durch die
> Summe aller Randhäufigkeiten aller Zeilen dividiert habe.
>
> Die Summe der Randhäufigkeiten der Zeilen stimmt mit der
> Summe der Summe Randhäufigkeiten der Spalten überein. Wenn
> ich das richtig verstanden habe, ist dies bei einer
> Kontigenztabelle normal.
>
> Die einzelnen Häufigkeitswerte der Kontigenztablle habe ich
> anschließend mit q multipliziert und in eine neue Tabelle
> übertragen. Wieder eine Tabelle mit 2 Spalten und 7
> Zeilen.
>
> Danach habe ich den Testfunktionswert v in einer
> aufwendigen Excel-Rechnung ermittelt.
>
> Von der Häufigkeit der ersten Tabelle (Zeile 1, Spalte 1)
> habe ich den errechneten Wert aus der zweiten Tabelle
> (Zeile 1, Spalte 1) subtrahiert. Das Ergebnis quadriert.
> Dieses Ergebnis habe ich dann nochmals durch den
> errechneten Wert der zweiten Tabelle (Zeile 1, Spalte 1)
> dividiert.
> Für alle 14 Häufigkeiten der Tabelle habe ich diese
> Rechnung vorgenommen und alle Ergebnisse miteinander
> summiert.
>
> Dies ergab meinen Wert v = 5,90
Du errechnest [mm] $v=\sum_{i=1}^k\sum_{j=1}^l(h_{ij}-\tilde h_{ij})^2/\tilde h_{ij}$ [/mm] fuer deine Daten (die [mm] $p_i$ [/mm] und [mm] $q_j$ [/mm] brauchst du hierfuer nicht). $v$ ist ein Mass dafuer, wie stark die tatsaechlich beobachteten Werte [mm] $h_{ij}$ [/mm] von den theoretischen Werten [mm] $\tilde h_{ij}$ [/mm] abweichen, wenn die Hypothese der Unabhaengigkeit zutrifft. Ist $v$ "zu gross", so spricht das gegen die Hypothese.
>
> Den Fraktilswert kann ich ja selber festlegen, indem ich 1
> - Alpha rechne. Alpha kann ich auch selber festlegen (umso
> höher Alpha ist, desto höher ist die Wahrscheinlichkeit,
> dass die Hypothese auf einen größeren Personenkreis nicht
> zutrifft).
>
> Wenn ich Alpha mit 0,05 festlegt, liegt der Fraktilswert
> bei 1-0,05 = 0,95
>
> Beim Vergleich mit den Prozentpunkten einer
> Chi-Quadrat-Verteilung bekomme ich folgendes Ergebnis:
>
> (2 - 1) x (7 - 1) = 6
>
> In der Tabelle habe ich dann n = 6 ausgewählt und Alpha =
> 0,95. In Bamberg et al. (Tabellenanhang, S. 322, Auflage
> 13, Tabelle 5; Alpha-Fraktile der ChiQuadrat-Verteilung mit
> n Freiheitsgraden) steht der Wert 12,59.
Was ist "gross"? Durch die Vorgabe des Signifikanzniveaus [mm] $\alpha$ [/mm] legst
du das fest. Wenn du [mm] $\alpha=0.05$ [/mm] waehlst, so definierst du "gross" als
einen Wert von $v$ der groesser ist 12.59, naemlich der 95%-Punkt der
Chi-Quadrat(6)-Verteilung (Prozentpunkt ist dasselbe wie Fraktil, siehe
BB Seite 119)
>
> Dies bedeutet, dass mein errechneter Wert v = 5,90
> innerhalb dieses Bereichs liegt. (v < 12,59). Die beiden
> Werte sind damit abhängig voneinander und die Hypothese
> bestätigt.
Hier irrst du dich. Dein $v$-Wert ist *nicht* groesser als 12.59. Deswegen
lehnst du die Hypothese der Unabanbhaengigkeit *nicht* ab.
>
> Wann macht es Sinn Gruppenunterschiede auf statistische
> Signifikanz zu überprüfen?
???
>
> Was bedeutet das Wort Fraktile?
s.o.
>
> Gibt es in Excel ein Funktion mit der ich den Wert v
> errechnen kann?
Das weiss ich nicht. In einem alten Buch zu Statistik und EXCEL finde ich
das Stichwort CHITEST...
lg
Luis
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 18:59 Do 02.08.2007 | Autor: | mathe26 |
Hallo Luis,
vielen Dank für Deine ausführliche Antwort!
Jetzt sehe ich einiges klarer. Den Kontigenztest habe ich jetzt verstanden. Nur die Interpretation noch nicht ganz.
Hypothese der Unabhängigkeit, bedeutet dass meine beiden Variablen nichts miteinander zu tun haben? Dies bedeutet, dass meine Ursprungs-Hypothese (Vorwissen hängt vom Involvement ab) nicht zutrifft und nur ein Zufallsergebnis ist.
Die Frage "Wann macht es Sinn Gruppenunterschiede auf statistische
Signifikanz zu überprüfen? " zielt, darauf ab wann es empfehlenswert ist einen Kontigenztest zu machen. Bei der Überprüfung aller Hypothesen die ich in meiner empirischen Studie gestellt habe oder nur bei bestimmten Hypothesen? Wie erkenne ich dies, wenn ich problemorientiert an eine solche Überprüfung herangehen soll?
Viele Grüße
mathe26
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 20:15 Do 02.08.2007 | Autor: | luis52 |
Hallo mathe26,
>
> Jetzt sehe ich einiges klarer. Den Kontigenztest habe ich
> jetzt verstanden. Nur die Interpretation noch nicht ganz.
>
> Hypothese der Unabhängigkeit, bedeutet dass meine beiden
> Variablen nichts miteinander zu tun haben? Dies bedeutet,
> dass meine Ursprungs-Hypothese (Vorwissen hängt vom
> Involvement ab) nicht zutrifft und nur ein Zufallsergebnis
> ist.
Ja, so kann man das sagen.
>
> Die Frage "Wann macht es Sinn Gruppenunterschiede auf
> statistische
> Signifikanz zu überprüfen? " zielt, darauf ab wann es
> empfehlenswert ist einen Kontigenztest zu machen. Bei der
> Überprüfung aller Hypothesen die ich in meiner empirischen
> Studie gestellt habe oder nur bei bestimmten Hypothesen?
> Wie erkenne ich dies, wenn ich problemorientiert an eine
> solche Überprüfung herangehen soll?
>
Das kommt darauf an. Ein Kontingenztest unterstellt nur ein relativ
schwaches Messniveau der Daten (nominal). Werden die Daten auf einer
hoeherwertigen Skala gemessen, so kann man schaerfere Methoden benutzen. Leider kann ich dir hier nicht allgemein raten. Am besten liest du einmal das Kapitel ueber Signifikanztests im BB. So als Start...
lg
Luis
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 23:06 Do 02.08.2007 | Autor: | mathe26 |
Hallo Luis,
vielen Dank für Deine Hilfe.
Mir ist jetzt schon vieles klarer geworden. An einer tiefgründigen Studium der notwendigen Literatur werde ich für eine problemorientierte Anwendung von Signifikanztests wohl nicht vorbeikommen.
Viele Grüße
mathe26
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 07:44 Fr 03.08.2007 | Autor: | luis52 |
> An einer
> tiefgründigen Studium der notwendigen Literatur werde ich
> für eine problemorientierte Anwendung von Signifikanztests
> wohl nicht vorbeikommen.
>
lg luis
|
|
|
|