Standardabweichungen < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 13:02 Fr 13.08.2004 | Autor: | tramp |
Ich habe diese Frage in keinem weiteren Forum gestellt
Bin beim Auswerten von Fragebögen.
100 Betriebe (Verteilung ca 20 Großbetriebe 80 Kleinbetriebe)
Stichprobe: 50 Betriebe mit unproportionale Verleilung, 20 Groß- und 30 Kleinbetriebe, da Umsatz in Großbetriebe mit großer Streuung.
Ich kann nun Mittelwert des Umsatzes der Stichprobe aus Mittelwert von Groß- u. Kleinbetriebe u. Wichtung aus Verteilung der Betriebe vornehmen. Wie kann ich die Standardabweichung der gesamten Stichprobe ermitteln?
Ist die Frage blöde, weil trivial ???
|
|
|
|
hallo
verstehe ich deine frage richtig ??
wir haben eine Grundgesamtheit von 100 ... 20grosse und 80 kleine
wir ziehen eine stichprobe von 50... 20 große und 30 kleine
okay. stimmt das ?
du willst die unbekannte standardabweichung der grundgesamtheit wissen?
falls das obige alles stimmt, dann werde ich dir im laufe der woche lösungstips posten, da ich momentan nicht daheim bin und auf meine unterlagen zugreifen kann.
nicht verzagen,
magister fragen
lg
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 12:01 So 15.08.2004 | Autor: | tramp |
Hallo magister, genau so,
ich berechne den Umsatz der Gesamtheit aus der Stichprobe mit den Wichtungen aus der Grundgesamtheit, wie aber kann ich die Standardabweichung der Grundgesamtheit berechnen?
Gruß Peter
|
|
|
|
|
Hallo Peter!
> ich berechne den Umsatz der Gesamtheit aus der Stichprobe
> mit den Wichtungen aus der Grundgesamtheit, wie aber kann
> ich die Standardabweichung der Grundgesamtheit berechnen?
Vielleicht noch mal eine grundsätzliche Verständnisfrage: wenn Du nur eine Stichprobe betrachtest, kannst Du doch die Standardabweichung nicht berechnen, sondern kannst sie höchstens schätzen, oder?
Ansonsten verstehe ich Deine Frage so: Du hast eine Stichprobe [mm] $x_1,\ldots,x_m$ [/mm] und eine Stichprobe [mm] $y_1,\ldots,y_n$ [/mm] sowie deren Standardabweichungen [mm] $s_x$ [/mm] und [mm] $s_y$. [/mm] Du möchtest nun aber die Standardabweichung der gesamten Stichprobe [mm] $x_1,\ldots,x_m,y_1,\ldots,y_n$, [/mm] die ich mit [mm] $z_1,\ldots,z_{m+n}$ [/mm] bezeichnen möchte. Nun gilt für die empirische Varianz (um die Wurzeln zu sparen):
[mm] s_z^2=\frac{1}{m+n-1}\sum\limits_{k=1}^{m+n}(z_k-\bar{z})^2
=\frac{1}{m+n-1}\left(\sum\limits_{i=1}^{m}(x_i-\bar{z})^2 + \sum\limits_{j=1}^{n}(y_j-\bar{z})^2\right)
=\frac{1}{m+n-1}\left(\sum\limits_{i=1}^{m}(x_i-\bar{x}+\bar{x}-\bar{z})^2 + \sum\limits_{j=1}^{n}(y_j-\bar{y}+\bar{y}-\bar{z})^2\right)
=\frac{1}{m+n-1}\left((m-1)s_x^2+2(\bar{x}-\bar{z})\sum\limits_{i=1}^{m}(x_i-\bar{x}) +m(\bar{x}-\bar{z})^2
+ (n-1)s_y^2+2(\bar{y}-\bar{z})\sum\limits_{j=1}^{n}(y_j-\bar{y})^2+n(\bar{y}-\bar{z})^2\right).[/mm]
Wegen
[mm] \bar{z}=\frac{1}{m+n}\sum\limits_{k=1}^{m+n}z_k=
\frac{1}{m+n}\left(\sum\limits_{i=1}^{m}x_i+\sum\limits_{j=1}^{n}y_j\right)
=\frac{m\bar{x}+n\bar{y}}{m+n}[/mm]
folgt zunächst
[mm] \bar{x}-\bar{z}=\left( 1-\frac{m}{m+n}\right)\bar{x}-\frac{n}{m+n}\bar{y}=
\frac{n}{m+n}(\bar{x}-\bar{y})[/mm]
und analog
[mm] \bar{y}-\bar{z}=\frac{m}{m+n}(\bar{y}-\bar{x}).[/mm]
Außerdem gilt
[mm]\sum\limits_{i=1}^{m}(x_i-\bar{x}) = \sum\limits_{i=1}^{m}x_i-m\bar{x}=0[/mm]
und analog
[mm]\sum\limits_{j=1}^{n}(y_j-\bar{y}) = 0,[/mm]
so dass sich insgesamt ergibt:
[mm] s_z^2=\frac{1}{m+n-1}\left((m-1)s_x^2+m\frac{n^2}{(m+n)^2}(\bar{x}-\bar{y})^2
+ (n-1)s_y^2+n\frac{m^2}{(m+n)^2}(\bar{y}-\bar{x})^2\right)
=\frac{1}{m+n-1}\left((m-1)s_x^2+ (n-1)s_y^2+\frac{mn^2+nm^2}{(m+n)^2}(\bar{x}-\bar{y})^2\right)
=\frac{1}{m+n-1}\left((m-1)s_x^2+ (n-1)s_y^2+\frac{mn}{(m+n)}(\bar{x}-\bar{y})^2\right)
[/mm]
Damit hast Du eine Formel für die Standardabweichung der insgesamten Messreihe, wenn Du nur die Kennzahlen der einzelnen Messreihen vorliegen hast. Übrigens sieht man auch schön, dass der hintere Teil als Korrekturterm wegfällt, wenn [mm] $\bar{x}=\bar{y}$ [/mm] gilt. Dann ist die Formel nur eine Gewichtung der einzelnen Varianzen.
Wäre aber gut, wenn da noch mal jemand drüber schauen könnte, weil es ja doch recht spät geworden ist mittlerweile...
Hoffe, das bringt Dich weiter.
Viele Grüße
Brigitte
|
|
|
|
|
Ich hab's durchgerechnet und halte es für richtig ;)
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 01:29 Mo 16.08.2004 | Autor: | tramp |
Hallo Brigitte, erst mal vielen Dank, melde mich morgen noch mal wenn ich alles geprüft habe
Gruß Peter von der Ostseeküste
|
|
|
|
|
Status: |
(Frage) reagiert/warte auf Reaktion | Datum: | 13:39 Mo 16.08.2004 | Autor: | tramp |
Hallo Super-Brigitte,
vielen Dank für Deine tolle Hilfe, hat mir sehr geholfen. Klappt mit Testrechnungen super !!
Noch mal kurz meine Gedanken mit einer Zusatzfrage (wenn ich schon mal mit einem Genie rede).
In einer Stichprobe ist anzunehmen, dass in einer Schicht (Untermenge) eine größere Abweichung bei einen bestimmten Merkmal auftritt. Nun nehme ich für eine geschichtete Stichprobenauswahl überproportional viel Elemente aus dieser Schicht. Ich berechne dann die Mittelwerte und Abweichungen aus der Stichprobe u. ermittle den geschätzten Mittelwert der Grundgesamtheit mit der "richtigen" Verteilung bzw die Abweichung mit Deiner Formel. (Auch mit den m und n-Werten aus der Grundgesamtheit) Das klappt mit meinem Zahlenbeispiel u. Deiner Hilfe so, dass die Ergebnisse völlig plausibel sind. Nun meine Frage: wenn das so ist, dass mit einer Erhöhung der Elemente aus der Schicht mit der größeren Streuung eine verbesserte Schätzung der Werte für die Grundgesamtheit erreicht wird, steht für mich die Frage nach einer optimal geschichteten disproportionalen Zufallsauswahl. Kannst Du hierzu etwas sagen ( nur, bei vertretbaren Aufwand)
Nochmals vielen Dank, ich denke nur, ich kann in diesem Forum nicht mit "gleicher Münze" zurückzahlen, meine (geringen) Stärken liegen woanders.
Viele herzliche Grüße von der Ostseeküste - Peter
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 14:10 Mo 16.08.2004 | Autor: | Brigitte |
> Hallo Super-Brigitte,
Nur nicht übertreiben, bitte...
> vielen Dank für Deine tolle Hilfe, hat mir sehr geholfen.
> Klappt mit Testrechnungen super !!
Na prima. Das lässt mich hoffe, dass die Rechnung stimmt.
> In einer Stichprobe ist anzunehmen, dass in einer Schicht
> (Untermenge) eine größere Abweichung bei einen bestimmten
> Merkmal auftritt. Nun nehme ich für eine geschichtete
> Stichprobenauswahl überproportional viel Elemente aus
> dieser Schicht. Ich berechne dann die Mittelwerte und
> Abweichungen aus der Stichprobe u. ermittle den geschätzten
> Mittelwert der Grundgesamtheit mit der "richtigen"
> Verteilung bzw die Abweichung mit Deiner Formel. (Auch mit
> den m und n-Werten aus der Grundgesamtheit) Das klappt mit
> meinem Zahlenbeispiel u. Deiner Hilfe so, dass die
> Ergebnisse völlig plausibel sind. Nun meine Frage: wenn das
> so ist, dass mit einer Erhöhung der Elemente aus der
> Schicht mit der größeren Streuung eine verbesserte
> Schätzung der Werte für die Grundgesamtheit erreicht wird,
> steht für mich die Frage nach einer optimal geschichteten
> disproportionalen Zufallsauswahl. Kannst Du hierzu etwas
> sagen ( nur, bei vertretbaren Aufwand)
Hm. Die Frage ist, was Du mit einer verbesserten Schätzung meinst. Eine Schätzung wird natürlich besser (im Sinne von geringerer Varianz), wenn Du den Stichprobenumfang erhöhst (sollte jedenfalls). Mir scheint, es gibt noch ein paar Schwierigkeiten mit der empirischen Standardabweichung und der theoretischen Varianz. Aber ich weiß nicht, wie gut Du Dich mit Statistik auskennst und wie tief Du da einsteigen möchtest. Zu der disproportionalen Zufallsauswahl fällt mir deshalb nicht so viel ein. Dazu müsstest Du wohl noch mal genau das Problem beschreiben.
Aber vielleicht fällt ja jemand anderem etwas Gescheites ein. Sorry!
Viele Grüße
Brigitte
> Nochmals vielen Dank, ich denke nur, ich kann in diesem
> Forum nicht mit "gleicher Münze" zurückzahlen, meine
> (geringen) Stärken liegen woanders.
>
> Viele herzliche Grüße von der Ostseeküste - Peter
>
>
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 21:26 Mi 14.01.2015 | Autor: | SaV86 |
Hi Brigitte!
Ich habe eine Frage an dich bzgl. eines Posts und der Formel um die Standardabweichung aus zwei Stichproben zu berechnen.
Ich möchte die Formel gern anwenden jedoch mit der Erweiterung, dass die Stichprobe $ [mm] x_1,\ldots,x_m [/mm] $ mit einem Faktor gewichtet wird genau wie die Stichprobe $ [mm] y_1,\ldots,y_n [/mm] $ . Ich möchte somit eine gewichtete Standardabweichung $ [mm] s_z^2 [/mm] $ erhalten.
Könntest du mir da weiterhelfen wie dies umsetzbar wäre?
Viele Grüße
Christoph
|
|
|
|
|
Antwort siehe unten, bei Deinem anderen Post.
|
|
|
|
|
Hallo zusammen,
ja, mir fällt etwas ein: in diesem Fall kannst Du aus der Formel der Standardabweichung nichts schliessen, weil die Verteilung der Gesamtheit der Daten keine Normalverteilung mehr ist. Selbst wenn beide Gruppen in sich ganz genau normalverteilt wären, dann würde es sich bei der Verteilung der Gesamtheit bereits um eine sog. kontaminierte Normalverteilung handeln, für welche die Standardabweichung etwa so aussagekräftig ist wie Deine Hausnummer.
Mit anderen Worten: in Deinem Fall kannst Du mit Mittelwert-Varianz-Statistik keine Schlussfolgerungen ziehen, und Du musst Dich tiefer in Statistik reinknien.
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 17:12 Do 15.01.2015 | Autor: | SaV86 |
Hallo HP,
danke für deine Antwort. Ich habe mir versucht die Formel sowie die Gewichtung zu visualisieren um zu sehen, was genau passieren würde.
Paint-Skizze
Ist die Skizze ungefähr zutreffen und ich würde eine schiefe Normalverteilung erhalten oder ggf. auch einen Einbruch der Kurve sehen?
Die aktuelle Formel entspricht doch im wesentlichen einer Gewichtung von 50/50 % beider Standardabweichungen oder sehe ich das falsch? Wobei, angenommen die Stichprobenumfänge sind extrem unterschiedlich, so würde der Einfluss der einen Standardabweichung mit kleinem Umfang doch extrem gering sein.
Ergeben die ggf. unterschiedlichen Stichprobenumfänge m und n nicht so etwas wie eine Gewichtung?
Formel aus Brigittes Antwort:
[mm] s_z^2=\frac{1}{m+n-1}\left((m-1)s_x^2+ (n-1)s_y^2+\frac{mn}{(m+n)}(\bar{x}-\bar{y})^2\right) [/mm]
|
|
|
|
|
> Ergeben die ggf. unterschiedlichen Stichprobenumfänge m
> und n nicht so etwas wie eine Gewichtung?
Nein, tun sie nicht. Die Lösung ist aber einfach. Wenn Du statt der Zufallsvarable $X$ die Zufallsvariable $k_xX$ anschaust, dann substituiere in Brigittes Formel ganz einfach [mm] $\bar{x}\longrightarrow k_x\bar{x}$ [/mm] und [mm] $s_x\longrightarrow k_x s_x$. [/mm] Dito mit $Y$.
Wenn Du mit "Gewichtung" was anderes meinst, dann sag es mir ;)
> Formel aus Brigittes Antwort:
> [mm]s_z^2=\frac{1}{m+n-1}\left((m-1)s_x^2+ (n-1)s_y^2+\frac{mn}{(m+n)}(\bar{x}-\bar{y})^2\right)[/mm]
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 12:41 Do 22.01.2015 | Autor: | SaV86 |
Hi HP!
Mit Gewichtung meine ich, dass die Stichprobe mit einem höheren Umfang die resultierende Standardabweichung stärker beeinflusst als die Stichprobe mit dem geringeren Umfang.
Ich komm hier gedanklich nicht weiter. Ich werde jetzt erstmal jedoch mit meiner Lösung weiterarbeiten die jedoch eine Ungenauigkeit von ca 4% enthält. Danke für deine Hilfe!
|
|
|
|