Zusammenhänge/Beziehungen mit Graphen visualisieren

Targa

Lieutenant
Registriert
Apr. 2008
Beiträge
995
Hallöchen,

ich möchte Zusammenhänge bzw. Beziehungen mit einem Graphen darstellen.

Bsp. Graph:
12312.jpg

Nun hab ich da einen verallgemeinerten Auszug aus den mir vorliegenden Daten.
- Die ID ist eindeutig
- Die Klasse geht von 1 bis 10, wobei > besser ist.
- Stichworte sind mit der ID verbunden, wobei eine ID theoretisch unendlich viele Stichworte haben kann. Ein Stichwort kann natürlich mit verschiedenen Klassen in Verbindung stehen.

[table="width: 500, class: grid, align: left"]
[tr]
[td]ID[/td]
[td]Klasse[/td]
[/tr]
[tr]
[td]1[/td]
[td]9[/td]
[/tr]
[tr]
[td]2[/td]
[td]8[/td]
[/tr]
[tr]
[td]3[/td]
[td]5[/td]
[/tr]
[tr]
[td]4[/td]
[td]6[/td]
[/tr]
[tr]
[td]5[/td]
[td]8[/td]
[/tr]
[tr]
[td]...[/td]
[td]...[/td]
[/tr]
[/table]

[table="width: 500, class: grid, align: left"]
[tr]
[td]ID[/td]
[td]Stichwort[/td]
[/tr]
[tr]
[td]1[/td]
[td]Stichwort 2[/td]
[/tr]
[tr]
[td]1[/td]
[td]Stichwort 1[/td]
[/tr]
[tr]
[td]3[/td]
[td]Stichwort 2[/td]
[/tr]
[tr]
[td]3[/td]
[td]Stichwort 1[/td]
[/tr]
[tr]
[td]3[/td]
[td]Stichwort 5[/td]
[/tr]
[tr]
[td]5[/td]
[td]Stichwort 5[/td]
[/tr]
[tr]
[td]4[/td]
[td]Stichwort 5[/td]
[/tr]
[tr]
[td]...[/td]
[td]...[/td]
[/tr]
[/table]

Nun möchte ich herausfinden ob es einen Zusammenhang zwischen bestimmten Stichwörtern und einer bestimmten Klasse gibt. Dabei hab ich mir das so gedacht, dass wenn ein Stichwort sehr oft mit einer Klasse zusammenhängt die Linie dicker wird.

Also hätte ich 10 Klassen und beliebig viele Stichwörter (Zehntausende) die logischerweise auch mit mehreren Klassen verbunden sein können.

Laienhaft mal mit Viso veranschaulicht:
Zeichnung1.png

Stichwort 2 und 3 würden nun sehr oft mit Klasse 2 in Verbindung stehen. Stichwort 5 noch relativ oft mit Klasse 3 etc. pp.



So nun habe ich etwas recherchiert und bin auf Gephi gestoßen. Nur scheint mir das für den Einsteig relativ komplex zu sein. Hat da jemand Erfahrungen mit dem Tool oder allgemein mit dem Typ der Visualisierung? Macht es überhaupt Sinn was ich da vorhabe oder gibt es bessere Möglichkeiten die Beziehungen/Zusammenhänge zu visualisieren?
 
  • Gefällt mir
Reaktionen: commandobot
Du suchst also nach Korrelationen? Das wäre mein Stichwort bei der Suche.
Ob das sinnvoll ist? Eigentlich ja, nur leider wird es oft missbraucht um Kausalitäten dort zu finden wo keine sind.
 
Bei vielen Klassen und Stichwörtern wird dein Ansatz extrem unübersichtlich. du bekommst n*10 Linien -> nach ein paar Dutzen Stichwörter siehst du kaum mehr was...

​Ich würde empfehlen Stichwörter, die sehr mit einer Klasse zusammenhängen, nah beim Stichwort hinzuzeichnen. Hier ist aber das Problem, dass man hier 9 Dimensionen bräuchte, sodass eine zweidimensionale Abbildung nur ungefähr repräsentiert was du in deinen Daten hast.

​Geht anscheinend auch mit Gephi. Ich kenn mich damit aber genauso wenig aus ;)

 
Danke euch zwei.
Ja, dass es unübersichtlich wird, damit hab ich eig. gerechnet. Allerdings kann man sicherlich auch filtern im Sinne von mindestens x-mal muss ein Stichwort generell vorkommen, damit es überhaupt angezeigt wird. Außerdem hat man ja eine Zoomfunktion mit der man sich vermutlich bestimmte Bereiche einzeln ansehen kann.

Das Datenmodell, wenn man es überhaupt so nennen kann ist ja ziemlich einfach. Was ich eig. brauche sind in der Tat Tipps wie ich anfangen soll. Bzgl. einer möglichen Aufbereitung der Daten, oder wie ich die Daten generell umbauen muss damit ich sie in z.B Gephi importieren kann.
 
  • Gefällt mir
Reaktionen: commandobot
Wenn Du Denkanstöße suchst, auf dem 33. CCC hat David Kriesel eine Auswertung von fast 100000 Spiegel-Artikeln präsentiert, mit den verschiedensten Arten graphischen Darstellungen: https://www.youtube.com/watch?v=QqVFEP3_BtY, bzw. die entsprechende Seite aus seinem Blog: http://www.dkriesel.com/blog/2016/1028_spiegelmining_think_big._die_artikellandschaft_der_letzten_zwei_jahre_zum_selberforschen
Für den eindrucksvollsten Teil der Darstellungen hat er Gephi verwendet. Für die Unterscheidung von wichtigen und unwichtigen Verbindungen hat er dabei den Jaccard-Koeffizient benutzt.
 
  • Gefällt mir
Reaktionen: commandobot
Zurück
Oben