Welche statistische Methoden? < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 19:44 Mo 03.04.2023 | Autor: | Gooly |
Ein Optimierungsprogramm liefert eine Tabelle mit den Parametereinstellungen und den daraus resultierenden Ergebnissen eines Programms.
Das sieht dann zB. so aus:
Pass Result Strikes Items Half Stop Target Coeff useOpp nTrack cTrack
row 0 - [371 301,0 3790 1000 5 18 8 1,2 false 9 1,1]
row 1 - [489 300,0 4659 1500 5 22 6,5 1,1 false 0 1,3]
row 2 - [484 293,0 2679 1300 7 12 5,5 0,8 false 9 1,6]
row 3 - [171 288,0 4688 900 5 22 4,5 0,9 false 3 1,2]
...
row 508 - [298 -408,0 1089 1000 9 22 5 1,1 true 9 1,9]
row 509 - [213 -453,0 2125 800 5 12 5,5 1,1 true 9 1,6]
Die Parameter sind: Items, Half, Stop, Target, Coeff, useOpp, nTrack und cTrack.
Die Ergebnisse der jew. Ausprägung sind Result und Strikes.
Ziel ist, das Result so groß wie möglich ist, wobei Strikes eher klein sein soll.
Welche statistische Verfahren könnte ich anwenden, um:
1.) die Ausprägungen der Parameter sinnvoll zu gruppieren: Gruppenanzahl, Gruppengröße, ... im Hinblick auf die Ergebnisse?
2.) wie könnte ich im Hinblick auf die Ergebnisse zwei oder mehr Parameter zusammenfassen und/oder auf Abhängigkeit prüfen?
Danke erst einmal!
|
|
|
|
zu 2:
> 2.) wie könnte ich im Hinblick auf die Ergebnisse zwei
> oder mehr Parameter zusammenfassen und/oder auf
> Abhängigkeit prüfen?
Parameter auf Korrelation untersuchen, Korrelationskoeffizient und Bestimmtheitsmaß feststellen.
bei nur zwei Parametern geht es noch mit Excel, mehrdimensional brauchst du was anderes.
Parameter zusammenfassen? dazu musst du wissen, welche du überhaupt zus.fassen darfst und wie.
ist nur sinncoll, wenn sie voneinander abhängig sind. aber wenn das der fall ist, kannst du auch nur einen von ihnen betrachten. also nix mit zus.fassen
|
|
|
|
|
Status: |
(Frage) überfällig | Datum: | 11:02 Mo 17.04.2023 | Autor: | Gooly |
Danke! Mittlerweile bin ich, um Gruppen innerhalb eines Parameters zu erzeugen, jetzt so vorgegangen: Ich bestimme eine Höchstzahl an Gruppen zB. 8, dann weise ich die Parameterwerte, die ja durch eine Schrittweite eine überschaubare Anzahl haben, einem Array zu, sortiere ich den 'Parameter-Array' nach der Schiefe und beginne auf der 'kleinem´n' Seite zwei Zellen ineinander zu schieben, immer (wieder) von klein nach groß, bis ich innerhalb der Höchstgrenze gelandet bin. Somit habe ich die Parameterbandbreite auf ein überschaubares Maß reduziert.
Jetzt versuche ich mal zwei Parameter in Relation zu Result zu setzen - ginge das so, oder gäbe etwas besseres?
Bei einem Parameter und 'Result' kann ich ein NxM Array bilden und dann für jede Zelle im Array die Häufigkeit ermitteln (jew. Anzahl/Gesamtzahl) mit den Randsummen ...
Ich will so ein Häufigkeits-Array von zwei Parametern erstellen und in die Zellen jetzt die jew. Durchschnitte (mit StdAbw,Max,Min,...) eintrage - macht das Sinn?
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 11:20 Di 02.05.2023 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|
|
> Ziel ist, das Result so groß wie möglich ist, wobei
> Strikes eher klein sein soll.
das ist mir nicht scharrf genug formuliert. wie ist die gewichtung verteilt, warum "so groß wie möglich", aber nur "eher klein"? allein aus den 6 daten ergibt sich, dass result=301 so groß wie mög.ist; berücksichtige ich, dass strikes durchaus "eher klein" sein soll, so nehme ich das paar 293 / 2679 als lösung. punkt.
> Welche statistische Verfahren könnte ich anwenden, um:
> 1.) die Ausprägungen der Parameter sinnvoll zu
> gruppieren: Gruppenanzahl, Gruppengröße, ... im Hinblick
> auf die Ergebnisse?
vllt. musst du erstmal die gesamte verteilung betrachten, um zu sehen, ob es gruppen mit gleichmäßigen abständen oder gruppen aufgrund von clusterbildungen gibt.
und wenn diese parms voneinander abhängig sind, solltest du erstmal 2.) bearbeiten.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 11:15 Mo 17.04.2023 | Autor: | Gooly |
Diese Tabelle und ihre Verteilung besitzt noch eine zusätzliche Herausforderung ;)
Sie ist das Ergebnis einer Optimierung, die sich zum Ende immer mehr auf die Parameterausprägungen konzentriert und viel öfter berechnet, was dem Ziel, hier die Maximierung von Result, entspricht. D.h. die Anzahl der erfolgreichen Ausprägungen sind viel größer als die weniger oder nicht erfolgreichen. So gesehen ist die Tabelle etwas 'schief', was man aber natürlich auch auswerten kann aber berücksichtigen muss - denke ich.
Ist halt nicht so, wie man das normalerweise bei Wiki oder den Lehrbüchern vorfindet.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 22:24 Di 18.04.2023 | Autor: | Eisfisch |
> Diese Tabelle und ihre Verteilung besitzt noch eine
> zusätzliche Herausforderung ;)
> Sie ist das Ergebnis einer Optimierung, die sich zum Ende
> immer mehr auf die Parameterausprägungen konzentriert und
> viel öfter berechnet, was dem Ziel, hier die Maximierung
> von Result, entspricht. D.h. die Anzahl der erfolgreichen
> Ausprägungen sind viel größer als die weniger oder nicht
> erfolgreichen. So gesehen ist die Tabelle etwas 'schief',
> was man aber natürlich auch auswerten kann aber
> berücksichtigen muss - denke ich.
dass die Tabelle etwas 'schief' ist, ist evtl. egal. bei meiner bemerkung zu result und strikes wollte ich nur "meckern",dass die vorgaben "so groß wie möglich" bzw. "eher klein" sehr frei aufgefasst werden können.
ein berechenbares kriterium könnte das verhältnis der beiden ergebnisse zueinander sein, also der quotient.
.
|
|
|
|