Mann Kendall Test < Stochastik < Hochschule < Mathe < Vorhilfe
|
Aufgabe | Gegeben eine Datenmatrix n [mm] \times [/mm] m mit Messwerten.
n die Jahresanzahl und m die Messtationenanzahl.
Die Daten sollen auf einen Trend überprüft werden. |
Hallo, alle zusammen.
Vorneweg, ich studiere angewandte Mathematik und habe bis jetzt nur Maß- und Integrationstheorie, sowie Wahrscheinlichkeitstheorie und Wahrscheinlichkeitsrechnung gehört.
Derzeit absolviere ich ein Praktikum und nun wurde mir folgende Aufgabe gegeben:
In einem bestimmten Gebiet sind Messstationen verteilt, für welche die gemessenen Jahresmittelwerte vorliegen. Der Zeitraum erstreckt sich über ca. 15 Jahre.
Je nach gemessener Substanz, haben nur eine handvoll Stationen den gesamten Zeitraum durch gemessen, also für jedes Jahr einen Wert geliefert. Der weitaus größere Teil des Datensatzes ist unvollständig. Des weiteren unterliegen die Messungen meteorologischen Schwankungen von Jahr zu Jahr.
Auch sind die Daten aus der frühen Hälfte per Hand ermittelt und übertragen worden, weswegen man dort mit Fehlern und Ausreißern rechnet.
Aus früheren Tests hat sich gezeigt, dass eine Trendanalyse über alle zur Verfügung stehenden Daten durchaus von einer Trendanalyse über die durchgängigen Daten abweichen kann und gegenteilige Ergebnisse liefert.
Diese früheren Tests wurden ohne vorheriger Datenprüfung mit dem Mann-Kendall-Test durchgeführt.
Nun gilt es Verfügbarkeitsanforderungen aufzustellen, um eine Trendanalyse mit hoher Aussagekraft zu erhalten.
Beachtet man nur die durchgängig messenden Stationen, so werden Teile des untersuchten Gebietes nicht genügend abgedeckt.
Die Mitarbeiter und ich haben weder eine stochastische Ausbildung, noch stehen uns Statistikprogramme zur Verfügung.
Die Fragen lauten nun:
Wie stark ist der Mann-Kendall-Test anfällig für unvollständige Daten?
Lässt sich diese Fragestellung überhaupt in angemessenem Aufwand beantworten und vor allem technisch umsetzen (Excel, Python, ...)?
Gibt es eventuell Freeware, die so etwas leistet kann?
Meine ersten Gedanken hierzu waren folgende:
Eine Ausreißerprobe über mehrere Jahre macht wahrscheinlich, aufgrund der meteorologischen Schwankungen, keinen Sinn. Über die Stationen in einem Jahr schon.
Da sich gezeigt hat, dass die durchgängig messenden Stationen die zuverlässigsten Daten liefern, könnte man diese als Referenz verwenden. Wobei hier das Problem auftritt, dass keine oder zu wenige durchgängig messen.
Als konkreten Test dachte ich, könnte man die Erwartungswerte der durchgängigen Stationen berechnen und dann die Standartabweichung aller dieser Erwartungswerte.
Nun berechnet man die Erwartungswerte der anderen Stationen und vergleicht mit der Abweichung. Liegen sie drin, dann sind sie zulässig, liegen sie außerhalb, dann werden sie verworfen.
Ich habe versucht den Sachverhalt so verständlich wie möglich darzustellen. Sollte irgendetwas unklar sein, bitte ich dies zu entschuldigen. Einen Datensatz posten kann ich aus betrieblichen Gründen nicht. Es sollte noch erwähnt werden, das hieraus kein kommerzieller Nutzen gezogen wird.
Danke schon einmal.
Ich habe diese Fragen in keinem anderen Forum gestellt.
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 20:48 Do 14.04.2011 | Autor: | luis52 |
> Gibt es eventuell Freeware, die so etwas leistet kann?
>
Mit R sollte das kein Problem sein.
vg Luis
|
|
|
|