15 - VL_08_Dijkstra [ID:30314]

50 von 536 angezeigt

Hallo, wir haben jetzt eine ganze Weile mit Graphen gearbeitet, aber vermutlich ist es

erstmal an der Zeit, dass wir uns darüber unterhalten, wie man einen Graphen erzeugt.

Denn nicht immer hat man bereits einen Graphen gegeben, also eine Menge von Knoten und wohl

definierte Kanten und Gewichte darauf, sondern oft startet man mit einem Datensatz, also

etwas der Form von D, ist eine Menge von Punkten, x1, xm und diese xi sind Daten und Datenpunkte

mit verschiedenen Einträgen, also zum Beispiel könnte es jetzt zwar sein, wie bei diesem

Beispiel mit den gebrauchten Autos, dann ist der erste Eintrag von diesem xi eventuell

die Marke, der zweite ist das Baujahr, der dritte ist der Preis, das vierte ist vielleicht

ein Textfeld, wo Mängel beschrieben werden, zum Beispiel, das heißt es ist ein kompensiertes

Objekt und die Frage ist, wie baut man aus so einem Datensatz einen Graphen?

Und die Idee ist hier die folgende, also wir formulieren das Ganze erstmal in einem Datentraum,

das heißt dieses geschwungen D ist jetzt der Raum, in dem die Datenobjekte xi drin liegen,

das heißt diese Daten ist jetzt eine M-fache Kopie von diesem Datentraum.

Beim einfachsten ist der Fall, wo der Datentraum der R hoch N ist, das heißt xi ist in R hoch

N, ist aber nicht notwendigerweise so in der Falle.

Also jetzt bauen wir eine Abstandsfunktion, die uns erlaubt zu zwei geren Daten xi und

xj einen Abstand zu definieren.

Das ist jetzt hier ein bisschen falsch, also was hier dranstehen soll ist das hier, das

heißt wir nehmen zwei Daten x und y, ich schreibe es x und y und das ist dann eine reelle

Karte, die Größe gleich Null ist, das heißt ist das hier Größe gleich Null.

Und damit können wir jetzt einen vollständigen Graphen bauen, also zum Beispiel sagen wir

mal wir haben jetzt hier diese vier Datenpunkte, das ist x1, das ist x2, x3 und x4 und hier

in diesem Bild sind die xi natürlich in R2, so wie ich sie zeichne.

Das heißt zu einer geren Abstandsfunktion, also zbd von x und y könnte jetzt einfach

der ökologische Abstand sein von x und y, das ist eine Wahl die möglich ist.

Dann können wir diese Punkte einfach zeichnen und die Abstände zwischen ihnen, das sind

einfach die ökologischen Abstände, das heißt jeder Punkt ist mit jedem Punkt verbunden

und die Gewichte auf diesen Kanten sind die ökologischen Abstände zwischen ihnen.

Das kann man machen, das Problem ist aber wenn wir jetzt wirklich jeden Knot mit jedem

anderen Knoten verbinden, dann ist die Größe der Kantenmenge extrem groß, das ist quasi

die Quartaratschneider Anzahl der Knoten, das wollen wir also nicht machen, also wenn

wir zum Beispiel 10.000 Knoten haben, dann haben wir bereits 100 Millionen Kanten, das

ist einfach viel zu viel.

Das heißt was man eigentlich stattdessen machen möchte ist einen unvollständigen Graphen

zu erzeugen aus diesem Datenplatz.

Also gerade zum Beispiel wenn man viele Punkte hier hat und viele Punkte hier hat, dann möchte

man eigentlich nicht dass jetzt jeder Punkt von da mit jedem Punkt von hier verbunden

ist, sondern möchte eigentlich hier irgendwelche Verbindungen hier drin haben, vielleicht sowas

und hier irgendwelche Verbindungen, es geht jetzt hier nur ganz grob ein und dann hat man

vermutlich hier Gewichte dazwischen, vielleicht diese hier, irgendwas in der Art wie das hier,

das heißt es gibt schon eine gewisse Verbindung zwischen diesen beiden Cluster wenn man das

so möchte, aber nicht jeden Knot mit jedem Knot verbinden, das möchten wir gerne vermeiden.

Und welche Möglichkeiten so einen unvollständigen Graphen zu bauen gibt es?

Es gibt mehrere Alternativen, aber jetzt möchte ich gerne über drei spezielle sprechen.

Die erste Möglichkeit ist, man betrachtet erstmal den vollständigen Graphen, also man

muss ihn nicht tatsächlich aufbauen, weil wie gesagt diese ganzen Kanten, die Anzahl

davon die skaliert ziemlich schnell hoch, aber man kann ja zu jeder virtuellen oder

abstrakten Kante das Gewicht einfach ausrechnen über diese Abstandfunktion, also man stellt

sich den quasi erstmal vor, aber dann berechnet man den minimalen aufspannenden Baum aus

diesen vollständigen Graphen, das heißt, jetzt machen wir mal ein Beispiel, vielleicht

Teil einer Videoserie :

Einführung in die mathematische Datenanalyse

Presenters

Dr. Philipp Wacker

Zugänglich über

Offener Zugang

Dauer

00:55:15 Min

Aufnahmedatum

2021-03-25

Hochgeladen am

2021-03-25 02:06:31

Sprache

de-DE

Einbetten

Wordpress FAU Plugin

 https://www.fau.tv/clip/id/30314

iFrame

<iframe src="https://api.video.uni-erlangen.de/services/oembed/?url=https://www.fau.tv/clip/id/30314&format=iframe&maxwidth=1280&maxheight=720" width="1280" height="720"seamless allowfullscreen style="border: 0; padding: 0; margin: 0;overflow: hidden;"></iframe>

Herunterladen

Video

Per RSS abonnieren