Clusteranalyse < math. Statistik < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 11:25 Do 09.07.2009 | Autor: | Marcel08 |
Aufgabe | [Dateianhang nicht öffentlich] |
Hallo Community,
über eine Korrekturlesung meiner nachfolgenden Lösung würde ich mich freuen.
Gemäß der euklidischen Distanz [mm] d_{ij}=\wurzel{\summe_{k=1}^{p}(x_{ik}-x_{jk})^{2}} [/mm] erhalten wir die Einträge der Distanzmatrix D
[mm] d_{12}=\wurzel{(x_{11}-x_{21})^{2}+(x_{12}+x_{22})^{2}}=1.00 [/mm]
[mm] d_{13}=\wurzel{(x_{31}-x_{11})^{2}+(x_{32}+x_{12})^{2}}=4.24
[/mm]
[mm] d_{14}= \vdots [/mm] =5.65
[mm] d_{23}= \vdots [/mm] =3.61
[mm] d_{24}= \vdots [/mm] =5.00
[mm] d_{34}= \vdots [/mm] =1.41
Daraus ergibt sich
[mm] D=\pmat{ 0 & 1 & 4.24 & 5.65 \\ 1 & 0 & 3.61 & 5 \\ 4.24 & 3.61 & 0 & 1.41 \\ 5.65 & 5 & 1.41 & 0 }
[/mm]
Die City-Block-Distanz [mm] d_{ij}=\summe_{k=1}^{p}|x_{ik}-x_{jk}| [/mm] liefert
[mm] d_{23}=\summe_{k=1}^{2}|x_{2k}-x_{3k}|=|2-5|+|2-4|=5
[/mm]
Wir haben [mm] D=\pmat{ 0 & 1 & 4.24 & 5.65 \\ 1 & 0 & 3.61 & 5 \\ 4.24 & 3.61 & 0 & 1.41 \\ 5.65 & 5 & 1.41 & 0 }
[/mm]
Fusionsschritt 1: Die kleinste Distanz (ausgenommen die Einträge der Hauptdiagonalen) ist [mm] d_{12}=1
[/mm]
[mm] \Rightarrow [/mm] (1) und (2) werden verschmolzen.
[mm] \Rightarrow P_{3}=((1,2),(3),(4))
[/mm]
[mm] \Rightarrow D_{(1,2),(3)}=max(4.24,3.61)=4.24
[/mm]
[mm] \Rightarrow D_{(1,2),(4)}=max(5.65,5.00)=5.65
[/mm]
Es ergibt sich die folgende Distanzmatrix
[mm] \pmat{ 0 & 4.24 & 5.65 \\ 4.24 & 0 & 1.41 \\ 5.65 & 1.41 & 0 }
[/mm]
Fusionsschritt 2: Die kleinste Distanz der Distanzmatrix (ausgenommen der Einträge der Hauptdiagonalen) ist [mm] d_{34}=1.41
[/mm]
[mm] \Rightarrow [/mm] (3) und (4) werden verschmolzen.
[mm] \Rightarrow P_{2}=((1,2),(3,4))
[/mm]
[mm] \Rightarrow D_{(1,2),(3,4)}=max(4.24,5.65)=5.65
[/mm]
Wir erhalten die letzte Distanzmatrix
[mm] \pmat{ 0 & 5.65 \\ 5.65 & 0 }
[/mm]
Fusionsschritt 3: (1,2) und (3,4) werden verschmolzen.
[mm] \Rightarrow P_{1}=(1,2,3,4)
[/mm]
Meine Lösungen:
zu a) 1.00
zu b) 5.65
zu c) 5.00
zu d) Objekte: (1) und (2), Klassen: (1,2),(3),(4)
zu e) 5.65
zu f) Objekte: (3) und (4), Klassen: (1,2),(3,4)
zu g) 5.65
zu h) Objekte: (1,2) und (3,4), Klassen: (1,2,3,4)
zu i) 1.00
Vielen Dank im Voraus!
Gruß, Marcel
Dateianhänge: Anhang Nr. 1 (Typ: jpg) [nicht öffentlich]
|
|
|
|
Hallo Marcel,
das scheint alles zu stimmen. Für die Kon-
trolle brauchte ich keinen Rechner. Ich habe
mir dazu die Punkte A,B,C,D auf kariertem
Papier skizziert. Da sieht man sofort, dass
AB die kürzeste und AD die längste Ver-
bindungsstrecke ist. Ihre Längen bekommt
man mit Pythagoras. Auch die City-Block-
Distanzen zwischen den verschiedenen
Punkten sind leicht ersichtlich.
LG
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 12:49 Do 09.07.2009 | Autor: | Marcel08 |
Okay, vielen Dank soweit. Ich habe in der Zwischenzeit meinen Eintrag nochmal erweitert. Für weitere Korrekturhinweise wäre ich sehr dankbar.
Gruß, Marcel
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 12:47 Do 09.07.2009 | Autor: | Marcel08 |
Ein erweitertes Aufgabenblatt liegt dem ersten Eintrag als Anhang bei.
|
|
|
|
|
> Wir haben [mm]D=\pmat{ 0 & 1 & 4.24 & 5.65 \\ 1 & 0 & 3.61 & 5 \\ 4.24 & 3.61 & 0 & 1.41 \\ 5.65 & 5 & 1.41 & 0 }[/mm]
Dies ist die euklidische Distanzmatrix.
Wenn ich richtig gelesen habe, soll die
Clusteranalyse aber aufgrund der
City-Block-Metrik erfolgen ...
> Fusionsschritt 1: Die kleinste Distanz (ausgenommen die
> Einträge der Hauptdiagonalen) ist [mm]d_{12}=1[/mm]
>
>
> [mm]\Rightarrow[/mm] (1) und (2) werden verschmolzen.
>
> [mm]\Rightarrow P_{3}=((1,2),(3),(4))[/mm]
>
> [mm]\Rightarrow D_{(1,2),(3)}=max(4.24,3.61)=4.24[/mm]
>
> [mm]\Rightarrow D_{(1,2),(4)}=max(5.65,5.00)=5.65[/mm]
>
>
>
> Es ergibt sich die folgende Distanzmatrix
>
>
> [mm]\pmat{ 0 & 4.24 & 5.65 \\ 4.24 & 0 & 1.41 \\ 5.65 & 1.41 & 0 }[/mm]
>
>
> Fusionsschritt 2: Die kleinste Distanz der Distanzmatrix
> (ausgenommen der Einträge der Hauptdiagonalen) ist
> [mm]d_{34}=1.41[/mm]
>
>
> [mm]\Rightarrow[/mm] (3) und (4) werden verschmolzen.
>
> [mm]\Rightarrow P_{2}=((1,2),(3,4))[/mm]
>
> [mm]\Rightarrow D_{(1,2),(3,4)}=max(4.24,5.65)=5.65[/mm]
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 15:47 Do 09.07.2009 | Autor: | oLman |
So, habe die Aufgabe jetzt nochmal nach City Metrix Distanzmatrix durchgerechnet:
A B C D
$ [mm] D=\pmat{ 0 & 1 & 6 & 8 \\ 1 & 0 & 5 & 7 \\ 6 & 5 & 0 & 2 \\ 8 & 7 & 2 & 0 } [/mm] $
1. Fusions Schritt:
--> 8 wählen {A,D} verschmelzen
[mm] D*=\pmat{ 0 & 7 & 6 \\ 7 & 0 & 6 \\ 6 & 2 & 0 }
[/mm]
Rechenbeispiel:
[mm] d_{AD,C}= max{(d_{AC},d_{DC}}) [/mm] = 6
2. Fusions Schritt:
-> 7 wählen {AD,B} verschmelzen
[mm] D*=\pmat{ 0 & 6 \\ 6 & 0 }
[/mm]
3 Fusions Schritt:
-> 6 wählen { ADB,C} verschmelzen
Ergebnis = 6
Ist das so korrekt?
lg
olman
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 16:21 Do 09.07.2009 | Autor: | Marcel08 |
> > So, habe die Aufgabe jetzt nochmal nach City Metrix
> > Distanzmatrix durchgerechnet:
> >
> > A B C D
> > [mm]D=\pmat{ 0 & 1 & 6 & 8 \\ 1 & 0 & 5 & 7 \\ 6 & 5 & 0 & 2 \\ 8 & 7 & 2 & 0 }[/mm]
>
> >
1. Fusions Schritt:
Hier würde ich [mm] d_{12}=1 [/mm] wählen als kleinste Distanz.
[mm] \Rightarrow [/mm] (1) und (2) verschmelzen.
[mm] \Rightarrow P_{3}=((1,2),(3),(4))
[/mm]
[mm] \Rightarrow D_{(1,2)(3)}=max(6,5)=6
[/mm]
[mm] \Rightarrow D_{(1,2)(4)}=max(8,7)=8
[/mm]
Die neue Distanzmatrix sähe dann wie folgt aus:
[mm] D=\pmat{ 0 & 6 & 8 \\ 6 & 0 & 2 \\ 8 & 2 & 0}
[/mm]
2. Fusionsschritt:
Kleinste Distanz mit [mm] d_{34}=2 [/mm] wählen.
[mm] \Rightarrow [/mm] (3) und (4) verschmelzen.
[mm] \Rightarrow P_{2}=(1,2)(3,4)
[/mm]
[mm] \Rightarrow D_{1,2)(3,4)}=max(6,8)=8
[/mm]
Die neue Matrix würden dann lauten:
[mm] \pmat{ 0 & 8 \\ 8 & 0 }
[/mm]
3. Fusionsschritt: Kleinste Distanz mit [mm] d_{(1,2)(3,4)}=8 [/mm] wählen.
[mm] \Rightarrow [/mm] (1,2) und (3,4) verschmelzen.
[mm] \Rightarrow P_{1}=(1,2,3,4)
[/mm]
Das wäre mein Vorschlag dazu.
Gruß, Marcel
Vielleicht noch eine kleine Frage dazu:
Ist es denn nicht von vornherein klar, welche Distanzmatrix man nach dem 2. Fusionsschritt erhalten würde? Wenn man im Zuge des Complete-Linkage-Verfahrens bei der Neubestimmung der Distanzmatrix eh immer das Maximum nimmt, ist es doch klar, dass am Ende die 8 (in diesem Beispiel) übrig bleibt, oder sehe ich das falsch?
Analog auch zum Single-Linkage-Verfahren, wo ich mal schätze würde, dass im Zuge des vorliegenden Beispiels die Matrix
[mm] \pmat{ 0 & 1 \\ 1 & 0 }
[/mm]
herauskommen würde.
Im Average-Linkage-Verfahren würde ich mal tippen
[mm] \pmat{ 0 & 5 \\ 5 & 0 }
[/mm]
Wie gesagt, eine reine Vermutung. Über eine Aufklärung wäre ich sehr dankbar.
> > --> 8 wählen {A,D} verschmelzen
>
> >
> > [mm]D*=\pmat{ 0 & 7 & 6 \\ 7 & 0 & 6 \\ 6 & 2 & 0 }[/mm]
> >
> > Rechenbeispiel:
> >
> > [mm]d_{AD,C}= max{(d_{AC},d_{DC}})[/mm] = 6
> >
> > 2. Fusions Schritt:
> >
> > -> 7 wählen {AD,B} verschmelzen
> >
> > [mm]D*=\pmat{ 0 & 6 \\ 6 & 0 }[/mm]
> >
> > 3 Fusions Schritt:
> >
> > -> 6 wählen { ADB,C} verschmelzen
> >
> > Ergebnis = 6
> >
> > Ist das so korrekt?
> >
> > lg
> > olman
>
>
>
> Ich denke, die Reihenfolge der Fusionen sollte
> doch bei der kleinsten Distanz beginnen,
> nicht bei der größten !
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 16:28 Do 09.07.2009 | Autor: | Marcel08 |
> > > So, habe die Aufgabe jetzt nochmal nach City Metrix
> > > Distanzmatrix durchgerechnet:
> > >
> > > A B C D
> > > [mm]D=\pmat{ 0 & 1 & 6 & 8 \\ 1 & 0 & 5 & 7 \\ 6 & 5 & 0 & 2 \\ 8 & 7 & 2 & 0 }[/mm]
> >
> > >
>
>
>
> 1. Fusions Schritt:
>
>
> Hier würde ich [mm]d_{12}=1[/mm] wählen als kleinste Distanz.
>
>
> [mm]\Rightarrow[/mm] (1) und (2) verschmelzen.
>
> [mm]\Rightarrow P_{3}=((1,2),(3),(4))[/mm]
>
> [mm]\Rightarrow D_{(1,2)(3)}=max(6,5)=6[/mm]
>
> [mm]\Rightarrow D_{(1,2)(4)}=max(8,7)=8[/mm]
>
>
>
> Die neue Distanzmatrix sähe dann wie folgt aus:
>
>
> [mm]D=\pmat{ 0 & 6 & 8 \\ 6 & 0 & 2 \\ 8 & 2 & 0}[/mm]
>
>
>
> 2. Fusionsschritt:
>
>
> Kleinste Distanz mit [mm]d_{34}=2[/mm] wählen.
>
>
> [mm]\Rightarrow[/mm] (3) und (4) verschmelzen.
>
> [mm]\Rightarrow P_{2}=(1,2)(3,4)[/mm]
>
> [mm]\Rightarrow D_{1,2)(3,4)}=max(6,8)=8[/mm]
>
>
>
> Die neue Matrix würden dann lauten:
>
>
> [mm]\pmat{ 0 & 8 \\ 8 & 0 }[/mm]
>
>
>
> 3. Fusionsschritt: Kleinste Distanz mit [mm]d_{(1,2)(3,4)}=8[/mm]
> wählen.
>
>
> [mm]\Rightarrow[/mm] (1,2) und (3,4) verschmelzen.
>
> [mm]\Rightarrow P_{1}=(1,2,3,4)[/mm]
>
>
>
>
> Das wäre mein Vorschlag dazu.
>
>
>
>
>
> Gruß, Marcel
>
>
>
> Vielleicht noch eine kleine Frage dazu:
>
>
> Ist es denn nicht von vornherein klar, welche Distanzmatrix
> man nach dem 2. Fusionsschritt erhalten würde? Wenn man im
> Zuge des Complete-Linkage-Verfahrens bei der Neubestimmung
> der Distanzmatrix eh immer das Maximum nimmt, ist es doch
> klar, dass am Ende die 8 (in diesem Beispiel) übrig
> bleibt, oder sehe ich das falsch?
>
> Analog auch zum Single-Linkage-Verfahren, wo ich mal
> schätze würde, dass im Zuge des vorliegenden Beispiels
> die Matrix
>
>
> [mm]\pmat{ 0 & 1 \\ 1 & 0 }[/mm]
>
>
> herauskommen würde.
>
>
>
> Im Average-Linkage-Verfahren würde ich mal tippen
>
>
> [mm]\pmat{ 0 & 5 \\ 5 & 0 }[/mm]
>
>
> Wie gesagt, eine reine Vermutung. Über eine Aufklärung
> wäre ich sehr dankbar.
>
Hat sich erledigt.
>
> > > --> 8 wählen {A,D} verschmelzen
> >
> > >
> > > [mm]D*=\pmat{ 0 & 7 & 6 \\ 7 & 0 & 6 \\ 6 & 2 & 0 }[/mm]
> > >
> > > Rechenbeispiel:
> > >
> > > [mm]d_{AD,C}= max{(d_{AC},d_{DC}})[/mm] = 6
> > >
> > > 2. Fusions Schritt:
> > >
> > > -> 7 wählen {AD,B} verschmelzen
> > >
> > > [mm]D*=\pmat{ 0 & 6 \\ 6 & 0 }[/mm]
> > >
> > > 3 Fusions Schritt:
> > >
> > > -> 6 wählen { ADB,C} verschmelzen
> > >
> > > Ergebnis = 6
> > >
> > > Ist das so korrekt?
> > >
> > > lg
> > > olman
> >
> >
> >
> > Ich denke, die Reihenfolge der Fusionen sollte
> > doch bei der kleinsten Distanz beginnen,
> > nicht bei der größten !
>
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 16:32 Do 09.07.2009 | Autor: | oLman |
Alles klar, hab jetzt auch 8 raus, mir war nicht bewusst dass immer die kleinste Distanz gewählt werden muss, ich dachte das ist vom verfahren abhängig (single linkage, complete linkage oder average linkage).
Besten Dank!
|
|
|
|