matheraum.de
Raum für Mathematik
Offene Informations- und Nachhilfegemeinschaft

Für Schüler, Studenten, Lehrer, Mathematik-Interessierte.
Hallo Gast!einloggen | registrieren ]
Startseite · Forum · Wissen · Kurse · Mitglieder · Team · Impressum
Navigation
 Startseite...
 Neuerdings beta neu
 Forum...
 vorwissen...
 vorkurse...
 Werkzeuge...
 Nachhilfevermittlung beta...
 Online-Spiele beta
 Suchen
 Verein...
 Impressum
Forenbaum
^ Forenbaum
Status Mathe
  Status Schulmathe
    Status Primarstufe
    Status Mathe Klassen 5-7
    Status Mathe Klassen 8-10
    Status Oberstufenmathe
    Status Mathe-Wettbewerbe
    Status Sonstiges
  Status Hochschulmathe
    Status Uni-Analysis
    Status Uni-Lin. Algebra
    Status Algebra+Zahlentheo.
    Status Diskrete Mathematik
    Status Fachdidaktik
    Status Finanz+Versicherung
    Status Logik+Mengenlehre
    Status Numerik
    Status Uni-Stochastik
    Status Topologie+Geometrie
    Status Uni-Sonstiges
  Status Mathe-Vorkurse
    Status Organisatorisches
    Status Schule
    Status Universität
  Status Mathe-Software
    Status Derive
    Status DynaGeo
    Status FunkyPlot
    Status GeoGebra
    Status LaTeX
    Status Maple
    Status MathCad
    Status Mathematica
    Status Matlab
    Status Maxima
    Status MuPad
    Status Taschenrechner

Gezeigt werden alle Foren bis zur Tiefe 2

Das Projekt
Server und Internetanbindung werden durch Spenden finanziert.
Organisiert wird das Projekt von unserem Koordinatorenteam.
Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.
Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".
Partnerseiten
Dt. Schulen im Ausland: Mathe-Seiten:Weitere Fächer:

Open Source FunktionenplotterFunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme
StartseiteMatheForenStatistik (Anwendungen)Test auf Lognormal-Vert.
Foren für weitere Schulfächer findest Du auf www.vorhilfe.de z.B. Deutsch • Englisch • Französisch • Latein • Spanisch • Russisch • Griechisch
Forum "Statistik (Anwendungen)" - Test auf Lognormal-Vert.
Test auf Lognormal-Vert. < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
Ansicht: [ geschachtelt ] | ^ Forum "Statistik (Anwendungen)"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien

Test auf Lognormal-Vert.: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 17:12 Di 08.01.2019
Autor: Thomas_Aut

Hallo,

ich würde gerne an einen relativ großen Datensatz (ca. 100.000 Einträge) eine Verteilung anpassen.

Wünschenswert wäre, wenn es sich um eine Lognormalverteilung handelt (der Grund hierfür: in Versicherungen arbeitet man oft mit einem Standardmodell, das von lognormalverteilten Schadenshöhen ausgeht).

Als erstes habe ich mir in R einen QQ-Plot angesehen - Datensatz gegen Lognormalverteilung.

Das sieht alles andere als Lognormalverteilt aus.... statistische Tests (z.B. Cramer-Mises-Test) verwerfen aber nicht die Hypothese, dass die Daten normalverteilt sind.

Was würdet ihr sagen?


LG

Thomas

PS: im Anhang der Screenshot vom QQ Plot.

QQ-Plot

Dateianhänge:
Anhang Nr. 1 (Typ: PNG) [nicht öffentlich]
        
Bezug
Test auf Lognormal-Vert.: Antwort
Status: (Antwort) fertig Status 
Datum: 17:02 Mi 09.01.2019
Autor: luis52

Moin, ich kann nicht erkennen, wie dein Plot entstanden ist. Aber versuch es doch einmal so: Logarithmiere die Daten und verwende qqnorm() bzw. teste mit mit einem Shapiro-Wilk-Test, ?shapiro.test.



Bezug
                
Bezug
Test auf Lognormal-Vert.: Frage (überfällig)
Status: (Frage) überfällig Status 
Datum: 23:08 Sa 12.01.2019
Autor: Thomas_Aut

Hallo Luis und danke für die Antwort.

Es ist folgender Sachverhalt:

Es wäre sehr wünschenswert, wenn die Lognormalverteilung am besten passen würde (egal, ob sie nun wirklich gut passt).

Was meinst du dazu, wenn ich mir beim Verteilungsfit jeweils die LogLikelihood ausgeben lasse und jene Verteilung als am Besten ansehe, die die größe Likelihood hat?


Wenn ich einen sehr großen Datensatz habe (z.B. 100000 Daten) und davon sind einige sehr groß - sagen wir 300 Datenpunkte sind zwischen 100000 und 1000000 -- 99800 sind allerdings zwischen 0,01 und 99999 ...

meinst du es ist sinnvoll den Datensatz zu teilen? Gäbe es eine vernünftige Grenze, dass z.B. auf kleine Cluster dieses Datensatzes verschiedene Lognormalverteilungen passen?

LG und Dank

Thomas

Bezug
                        
Bezug
Test auf Lognormal-Vert.: Fälligkeit abgelaufen
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 23:20 Mo 14.01.2019
Autor: matux

$MATUXTEXT(ueberfaellige_frage)
Bezug
Ansicht: [ geschachtelt ] | ^ Forum "Statistik (Anwendungen)"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien


^ Seitenanfang ^
www.matheraum.de
[ Startseite | Forum | Wissen | Kurse | Mitglieder | Team | Impressum ]