matheraum.de
Raum für Mathematik
Offene Informations- und Nachhilfegemeinschaft

Für Schüler, Studenten, Lehrer, Mathematik-Interessierte.
Hallo Gast!einloggen | registrieren ]
Startseite · Forum · Wissen · Kurse · Mitglieder · Team · Impressum
Forenbaum
^ Forenbaum
Status Mathe
  Status Schulmathe
    Status Primarstufe
    Status Mathe Klassen 5-7
    Status Mathe Klassen 8-10
    Status Oberstufenmathe
    Status Mathe-Wettbewerbe
    Status Sonstiges
  Status Hochschulmathe
    Status Uni-Analysis
    Status Uni-Lin. Algebra
    Status Algebra+Zahlentheo.
    Status Diskrete Mathematik
    Status Fachdidaktik
    Status Finanz+Versicherung
    Status Logik+Mengenlehre
    Status Numerik
    Status Uni-Stochastik
    Status Topologie+Geometrie
    Status Uni-Sonstiges
  Status Mathe-Vorkurse
    Status Organisatorisches
    Status Schule
    Status Universität
  Status Mathe-Software
    Status Derive
    Status DynaGeo
    Status FunkyPlot
    Status GeoGebra
    Status LaTeX
    Status Maple
    Status MathCad
    Status Mathematica
    Status Matlab
    Status Maxima
    Status MuPad
    Status Taschenrechner

Gezeigt werden alle Foren bis zur Tiefe 2

Navigation
 Startseite...
 Neuerdings beta neu
 Forum...
 vorwissen...
 vorkurse...
 Werkzeuge...
 Nachhilfevermittlung beta...
 Online-Spiele beta
 Suchen
 Verein...
 Impressum
Das Projekt
Server und Internetanbindung werden durch Spenden finanziert.
Organisiert wird das Projekt von unserem Koordinatorenteam.
Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.
Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".
Partnerseiten
Dt. Schulen im Ausland: Mathe-Seiten:Weitere Fächer:

Open Source FunktionenplotterFunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme
StartseiteMatheForenmathematische StatistikClusteranalyse
Foren für weitere Schulfächer findest Du auf www.vorhilfe.de z.B. Deutsch • Englisch • Französisch • Latein • Spanisch • Russisch • Griechisch
Forum "mathematische Statistik" - Clusteranalyse
Clusteranalyse < math. Statistik < Stochastik < Hochschule < Mathe < Vorhilfe
Ansicht: [ geschachtelt ] | ^ Forum "mathematische Statistik"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien

Clusteranalyse: Korrekturlesung
Status: (Frage) beantwortet Status 
Datum: 11:25 Do 09.07.2009
Autor: Marcel08

Aufgabe
[Dateianhang nicht öffentlich]

Hallo Community,


über eine Korrekturlesung meiner nachfolgenden Lösung würde ich mich freuen.



Gemäß der euklidischen Distanz [mm] d_{ij}=\wurzel{\summe_{k=1}^{p}(x_{ik}-x_{jk})^{2}} [/mm] erhalten wir die Einträge der Distanzmatrix D


[mm] d_{12}=\wurzel{(x_{11}-x_{21})^{2}+(x_{12}+x_{22})^{2}}=1.00 [/mm]      
    

[mm] d_{13}=\wurzel{(x_{31}-x_{11})^{2}+(x_{32}+x_{12})^{2}}=4.24 [/mm]

[mm] d_{14}= \vdots [/mm]                   =5.65

[mm] d_{23}= \vdots [/mm]                   =3.61

[mm] d_{24}= \vdots [/mm]                   =5.00

[mm] d_{34}= \vdots [/mm]                   =1.41



Daraus ergibt sich


[mm] D=\pmat{ 0 & 1 & 4.24 & 5.65 \\ 1 & 0 & 3.61 & 5 \\ 4.24 & 3.61 & 0 & 1.41 \\ 5.65 & 5 & 1.41 & 0 } [/mm]



Die City-Block-Distanz [mm] d_{ij}=\summe_{k=1}^{p}|x_{ik}-x_{jk}| [/mm] liefert


[mm] d_{23}=\summe_{k=1}^{2}|x_{2k}-x_{3k}|=|2-5|+|2-4|=5 [/mm]



Wir haben [mm] D=\pmat{ 0 & 1 & 4.24 & 5.65 \\ 1 & 0 & 3.61 & 5 \\ 4.24 & 3.61 & 0 & 1.41 \\ 5.65 & 5 & 1.41 & 0 } [/mm]


Fusionsschritt 1: Die kleinste Distanz (ausgenommen die Einträge der Hauptdiagonalen) ist [mm] d_{12}=1 [/mm]


[mm] \Rightarrow [/mm] (1) und (2) werden verschmolzen.

[mm] \Rightarrow P_{3}=((1,2),(3),(4)) [/mm]

[mm] \Rightarrow D_{(1,2),(3)}=max(4.24,3.61)=4.24 [/mm]

[mm] \Rightarrow D_{(1,2),(4)}=max(5.65,5.00)=5.65 [/mm]



Es ergibt sich die folgende Distanzmatrix


[mm] \pmat{ 0 & 4.24 & 5.65 \\ 4.24 & 0 & 1.41 \\ 5.65 & 1.41 & 0 } [/mm]


Fusionsschritt 2: Die kleinste Distanz der Distanzmatrix (ausgenommen der Einträge der Hauptdiagonalen) ist [mm] d_{34}=1.41 [/mm]


[mm] \Rightarrow [/mm] (3) und (4) werden verschmolzen.

[mm] \Rightarrow P_{2}=((1,2),(3,4)) [/mm]

[mm] \Rightarrow D_{(1,2),(3,4)}=max(4.24,5.65)=5.65 [/mm]



Wir erhalten die letzte Distanzmatrix


[mm] \pmat{ 0 & 5.65 \\ 5.65 & 0 } [/mm]


Fusionsschritt 3: (1,2) und (3,4) werden verschmolzen.


[mm] \Rightarrow P_{1}=(1,2,3,4) [/mm]



Meine Lösungen:


zu a) 1.00

zu b) 5.65

zu c) 5.00

zu d) Objekte: (1) und (2), Klassen: (1,2),(3),(4)

zu e) 5.65

zu f) Objekte: (3) und (4), Klassen: (1,2),(3,4)

zu g) 5.65

zu h) Objekte: (1,2) und (3,4), Klassen: (1,2,3,4)

zu i) 1.00




Vielen Dank im Voraus!





Gruß, Marcel

Dateianhänge:
Anhang Nr. 1 (Typ: jpg) [nicht öffentlich]
        
Bezug
Clusteranalyse: Skizze
Status: (Antwort) fertig Status 
Datum: 12:41 Do 09.07.2009
Autor: Al-Chwarizmi

Hallo Marcel,

das scheint alles zu stimmen. Für die Kon-
trolle brauchte ich keinen Rechner. Ich habe
mir dazu die Punkte A,B,C,D auf kariertem
Papier skizziert. Da sieht man sofort, dass
AB die kürzeste und AD die längste Ver-
bindungsstrecke ist. Ihre Längen bekommt
man mit Pythagoras. Auch die City-Block-
Distanzen zwischen den verschiedenen
Punkten sind leicht ersichtlich.

LG    

Bezug
                
Bezug
Clusteranalyse: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 12:49 Do 09.07.2009
Autor: Marcel08

Okay, vielen Dank soweit. Ich habe in der Zwischenzeit meinen Eintrag nochmal erweitert. Für weitere Korrekturhinweise wäre ich sehr dankbar.



Gruß, Marcel

Bezug
        
Bezug
Clusteranalyse: Aufgabenblatt
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 12:47 Do 09.07.2009
Autor: Marcel08

Ein erweitertes Aufgabenblatt liegt dem ersten Eintrag als Anhang bei.

Bezug
        
Bezug
Clusteranalyse: Antwort
Status: (Antwort) fertig Status 
Datum: 13:17 Do 09.07.2009
Autor: Al-Chwarizmi


> Wir haben [mm]D=\pmat{ 0 & 1 & 4.24 & 5.65 \\ 1 & 0 & 3.61 & 5 \\ 4.24 & 3.61 & 0 & 1.41 \\ 5.65 & 5 & 1.41 & 0 }[/mm]


Dies ist die euklidische Distanzmatrix.
Wenn ich richtig gelesen habe, soll die
Clusteranalyse aber aufgrund der
City-Block-Metrik erfolgen ...


> Fusionsschritt 1: Die kleinste Distanz (ausgenommen die
> Einträge der Hauptdiagonalen) ist [mm]d_{12}=1[/mm]
>  
>
> [mm]\Rightarrow[/mm] (1) und (2) werden verschmolzen.
>  
> [mm]\Rightarrow P_{3}=((1,2),(3),(4))[/mm]
>  
> [mm]\Rightarrow D_{(1,2),(3)}=max(4.24,3.61)=4.24[/mm]
>  
> [mm]\Rightarrow D_{(1,2),(4)}=max(5.65,5.00)=5.65[/mm]
>  
>
>
> Es ergibt sich die folgende Distanzmatrix
>  
>
> [mm]\pmat{ 0 & 4.24 & 5.65 \\ 4.24 & 0 & 1.41 \\ 5.65 & 1.41 & 0 }[/mm]
>  
>
> Fusionsschritt 2: Die kleinste Distanz der Distanzmatrix
> (ausgenommen der Einträge der Hauptdiagonalen) ist
> [mm]d_{34}=1.41[/mm]
>  
>
> [mm]\Rightarrow[/mm] (3) und (4) werden verschmolzen.
>  
> [mm]\Rightarrow P_{2}=((1,2),(3,4))[/mm]
>  
> [mm]\Rightarrow D_{(1,2),(3,4)}=max(4.24,5.65)=5.65[/mm]


Bezug
                
Bezug
Clusteranalyse: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 15:47 Do 09.07.2009
Autor: oLman

So, habe die Aufgabe jetzt nochmal nach City Metrix Distanzmatrix durchgerechnet:

     A B C D
$ [mm] D=\pmat{ 0 & 1 & 6 & 8 \\ 1 & 0 & 5 & 7 \\ 6 & 5 & 0 & 2 \\ 8 & 7 & 2 & 0 } [/mm] $

1. Fusions Schritt:

--> 8 wählen {A,D} verschmelzen

[mm] D*=\pmat{ 0 & 7 & 6 \\ 7 & 0 & 6 \\ 6 & 2 & 0 } [/mm]

Rechenbeispiel:

[mm] d_{AD,C}= max{(d_{AC},d_{DC}}) [/mm] = 6

2. Fusions Schritt:

-> 7 wählen {AD,B} verschmelzen

[mm] D*=\pmat{ 0 & 6 \\ 6 & 0 } [/mm]

3 Fusions Schritt:

-> 6 wählen { ADB,C} verschmelzen

Ergebnis = 6

Ist das so korrekt?

lg
olman



Bezug
                        
Bezug
Clusteranalyse: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 15:58 Do 09.07.2009
Autor: Al-Chwarizmi


> So, habe die Aufgabe jetzt nochmal nach City Metrix
> Distanzmatrix durchgerechnet:
>  
> A B C D
>  [mm]D=\pmat{ 0 & 1 & 6 & 8 \\ 1 & 0 & 5 & 7 \\ 6 & 5 & 0 & 2 \\ 8 & 7 & 2 & 0 }[/mm]     [ok]
>  
> 1. Fusions Schritt:
>  
> --> 8 wählen {A,D} verschmelzen       [verwirrt]    [kopfschuettel]
>  
> [mm]D*=\pmat{ 0 & 7 & 6 \\ 7 & 0 & 6 \\ 6 & 2 & 0 }[/mm]
>  
> Rechenbeispiel:
>  
> [mm]d_{AD,C}= max{(d_{AC},d_{DC}})[/mm] = 6
>  
> 2. Fusions Schritt:
>  
> -> 7 wählen {AD,B} verschmelzen
>  
> [mm]D*=\pmat{ 0 & 6 \\ 6 & 0 }[/mm]
>  
> 3 Fusions Schritt:
>  
> -> 6 wählen { ADB,C} verschmelzen
>  
> Ergebnis = 6
>  
> Ist das so korrekt?
>  
> lg
>  olman



Ich denke, die Reihenfolge der Fusionen sollte
doch bei der kleinsten Distanz beginnen,
nicht bei der größten !

Bezug
                                
Bezug
Clusteranalyse: Verbesserungsvorschlag
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 16:21 Do 09.07.2009
Autor: Marcel08


> > So, habe die Aufgabe jetzt nochmal nach City Metrix
> > Distanzmatrix durchgerechnet:
>  >  
> > A B C D
>  >  [mm]D=\pmat{ 0 & 1 & 6 & 8 \\ 1 & 0 & 5 & 7 \\ 6 & 5 & 0 & 2 \\ 8 & 7 & 2 & 0 }[/mm]
>     [ok]
>  >  



1. Fusions Schritt:


Hier würde ich [mm] d_{12}=1 [/mm] wählen als kleinste Distanz.


[mm] \Rightarrow [/mm] (1) und (2) verschmelzen.

[mm] \Rightarrow P_{3}=((1,2),(3),(4)) [/mm]

[mm] \Rightarrow D_{(1,2)(3)}=max(6,5)=6 [/mm]

[mm] \Rightarrow D_{(1,2)(4)}=max(8,7)=8 [/mm]



Die neue Distanzmatrix sähe dann wie folgt aus:


[mm] D=\pmat{ 0 & 6 & 8 \\ 6 & 0 & 2 \\ 8 & 2 & 0} [/mm]



2. Fusionsschritt:


Kleinste Distanz mit [mm] d_{34}=2 [/mm] wählen.


[mm] \Rightarrow [/mm] (3) und (4) verschmelzen.

[mm] \Rightarrow P_{2}=(1,2)(3,4) [/mm]

[mm] \Rightarrow D_{1,2)(3,4)}=max(6,8)=8 [/mm]



Die neue Matrix würden dann lauten:


[mm] \pmat{ 0 & 8 \\ 8 & 0 } [/mm]



3. Fusionsschritt: Kleinste Distanz mit [mm] d_{(1,2)(3,4)}=8 [/mm] wählen.


[mm] \Rightarrow [/mm] (1,2) und (3,4) verschmelzen.

[mm] \Rightarrow P_{1}=(1,2,3,4) [/mm]




Das wäre mein Vorschlag dazu.





Gruß, Marcel



Vielleicht noch eine kleine Frage dazu:


Ist es denn nicht von vornherein klar, welche Distanzmatrix man nach dem 2. Fusionsschritt erhalten würde? Wenn man im Zuge des Complete-Linkage-Verfahrens bei der Neubestimmung der Distanzmatrix eh immer das Maximum nimmt, ist es doch klar, dass am Ende die 8 (in diesem Beispiel) übrig bleibt, oder sehe ich das falsch?

Analog auch zum Single-Linkage-Verfahren, wo ich mal schätze würde, dass im Zuge des vorliegenden Beispiels die Matrix


[mm] \pmat{ 0 & 1 \\ 1 & 0 } [/mm]


herauskommen würde.



Im Average-Linkage-Verfahren würde ich mal tippen


[mm] \pmat{ 0 & 5 \\ 5 & 0 } [/mm]


Wie gesagt, eine reine Vermutung. Über eine Aufklärung wäre ich sehr dankbar.





> > --> 8 wählen {A,D} verschmelzen       [verwirrt]    
> [kopfschuettel]
>  >  
> > [mm]D*=\pmat{ 0 & 7 & 6 \\ 7 & 0 & 6 \\ 6 & 2 & 0 }[/mm]
>  >  
> > Rechenbeispiel:
>  >  
> > [mm]d_{AD,C}= max{(d_{AC},d_{DC}})[/mm] = 6
>  >  
> > 2. Fusions Schritt:
>  >  
> > -> 7 wählen {AD,B} verschmelzen
>  >  
> > [mm]D*=\pmat{ 0 & 6 \\ 6 & 0 }[/mm]
>  >  
> > 3 Fusions Schritt:
>  >  
> > -> 6 wählen { ADB,C} verschmelzen
>  >  
> > Ergebnis = 6
>  >  
> > Ist das so korrekt?
>  >  
> > lg
>  >  olman
>  
>
>
> Ich denke, die Reihenfolge der Fusionen sollte
>  doch bei der kleinsten Distanz beginnen,
>  nicht bei der größten !


Bezug
                                        
Bezug
Clusteranalyse: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 16:28 Do 09.07.2009
Autor: Marcel08


> > > So, habe die Aufgabe jetzt nochmal nach City Metrix
> > > Distanzmatrix durchgerechnet:
>  >  >  
> > > A B C D
>  >  >  [mm]D=\pmat{ 0 & 1 & 6 & 8 \\ 1 & 0 & 5 & 7 \\ 6 & 5 & 0 & 2 \\ 8 & 7 & 2 & 0 }[/mm]
> >     [ok]

>  >  >  
>
>
>
> 1. Fusions Schritt:
>  
>
> Hier würde ich [mm]d_{12}=1[/mm] wählen als kleinste Distanz.
>  
>
> [mm]\Rightarrow[/mm] (1) und (2) verschmelzen.
>  
> [mm]\Rightarrow P_{3}=((1,2),(3),(4))[/mm]
>  
> [mm]\Rightarrow D_{(1,2)(3)}=max(6,5)=6[/mm]
>  
> [mm]\Rightarrow D_{(1,2)(4)}=max(8,7)=8[/mm]
>  
>
>
> Die neue Distanzmatrix sähe dann wie folgt aus:
>  
>
> [mm]D=\pmat{ 0 & 6 & 8 \\ 6 & 0 & 2 \\ 8 & 2 & 0}[/mm]
>  
>
>
> 2. Fusionsschritt:
>
>
> Kleinste Distanz mit [mm]d_{34}=2[/mm] wählen.
>  
>
> [mm]\Rightarrow[/mm] (3) und (4) verschmelzen.
>  
> [mm]\Rightarrow P_{2}=(1,2)(3,4)[/mm]
>  
> [mm]\Rightarrow D_{1,2)(3,4)}=max(6,8)=8[/mm]
>  
>
>
> Die neue Matrix würden dann lauten:
>  
>
> [mm]\pmat{ 0 & 8 \\ 8 & 0 }[/mm]
>  
>
>
> 3. Fusionsschritt: Kleinste Distanz mit [mm]d_{(1,2)(3,4)}=8[/mm]
> wählen.
>  
>
> [mm]\Rightarrow[/mm] (1,2) und (3,4) verschmelzen.
>  
> [mm]\Rightarrow P_{1}=(1,2,3,4)[/mm]
>  
>
>
>
> Das wäre mein Vorschlag dazu.
>  
>
>
>
>
> Gruß, Marcel
>  
>
>
> Vielleicht noch eine kleine Frage dazu:
>  
>
> Ist es denn nicht von vornherein klar, welche Distanzmatrix
> man nach dem 2. Fusionsschritt erhalten würde? Wenn man im
> Zuge des Complete-Linkage-Verfahrens bei der Neubestimmung
> der Distanzmatrix eh immer das Maximum nimmt, ist es doch
> klar, dass am Ende die 8 (in diesem Beispiel) übrig
> bleibt, oder sehe ich das falsch?
>  
> Analog auch zum Single-Linkage-Verfahren, wo ich mal
> schätze würde, dass im Zuge des vorliegenden Beispiels
> die Matrix
>  
>
> [mm]\pmat{ 0 & 1 \\ 1 & 0 }[/mm]
>  
>
> herauskommen würde.
>  
>
>
> Im Average-Linkage-Verfahren würde ich mal tippen
>  
>
> [mm]\pmat{ 0 & 5 \\ 5 & 0 }[/mm]
>  
>
> Wie gesagt, eine reine Vermutung. Über eine Aufklärung
> wäre ich sehr dankbar.
>  

Hat sich erledigt. :-)

>
> > > --> 8 wählen {A,D} verschmelzen       [verwirrt]    
> > [kopfschuettel]
>  >  >  
> > > [mm]D*=\pmat{ 0 & 7 & 6 \\ 7 & 0 & 6 \\ 6 & 2 & 0 }[/mm]
>  >  >  
> > > Rechenbeispiel:
>  >  >  
> > > [mm]d_{AD,C}= max{(d_{AC},d_{DC}})[/mm] = 6
>  >  >  
> > > 2. Fusions Schritt:
>  >  >  
> > > -> 7 wählen {AD,B} verschmelzen
>  >  >  
> > > [mm]D*=\pmat{ 0 & 6 \\ 6 & 0 }[/mm]
>  >  >  
> > > 3 Fusions Schritt:
>  >  >  
> > > -> 6 wählen { ADB,C} verschmelzen
>  >  >  
> > > Ergebnis = 6
>  >  >  
> > > Ist das so korrekt?
>  >  >  
> > > lg
>  >  >  olman
>  >  
> >
> >
> > Ich denke, die Reihenfolge der Fusionen sollte
>  >  doch bei der kleinsten Distanz beginnen,
>  >  nicht bei der größten !
>  


Bezug
                                
Bezug
Clusteranalyse: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 16:32 Do 09.07.2009
Autor: oLman

Alles klar, hab jetzt auch 8 raus, mir war nicht bewusst dass immer die kleinste Distanz gewählt werden muss, ich dachte das ist vom verfahren abhängig (single linkage, complete linkage oder average linkage).

Besten Dank!

Bezug
Ansicht: [ geschachtelt ] | ^ Forum "mathematische Statistik"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien


^ Seitenanfang ^
www.matheraum.de
[ Startseite | Forum | Wissen | Kurse | Mitglieder | Team | Impressum ]