11 - Informatische Werkzeuge in den Geistes- und Sozialwissenschaften II [ID:11868]
50 von 585 angezeigt

Letzte IBGS-Vorlesung vor der Klausur, bzw. für die meisten sicherlich letzte

letzte IWGS Vorlesung. Ich hoffe, dass ihr alle durchkommt. Nein, hoffe ich tatsächlich. Genau,

ich wollte heute was über Whiskey erzählen, über ein System, das sich zum Ziel setzt,

ist eine Art virtuelle Forschungsumgebung für das kulturelle Erbe oder für die Dokumentation und Diskussion des kulturellen Erbes zu sein.

Die Idee, die dahinter steht, ist eigentlich dieselbe, die wir uns vorletztes Mal angeguckt haben, mit dem Unterschied des webs und des semantischen webs.

Was wir haben, ist irgendwelche Ressourcen. Beim Web sind das irgendwelche Web-Ressourcen, also Stücke von Webpages, alles was man mit einer URI kriegen kann.

Und im jetzigen Web ist es einfach so, dass wir wissen, es gibt die Biester, nämlich jede URI oder jedes URI-Fragment ist so ein Knubbel. Und wir wissen, dass manche von denen einen Hyperlink haben zu anderen.

Das ist im Web alles, was wir wissen und damit kann man einige Dinge machen, zum Beispiel Google PageRank, dieser Algorithmus, der bei Google die Hits sortiert.

Der guckt sich im Wesentlichen an, wie viele, die sortieren nach Wichtigkeit und man denkt, eine Ressource ist wichtig, wenn viele andere Ressourcen da drauf linken.

Die machen es noch eine kleine Stufe besser, die sagen, eine Seite ist wichtig, wenn viele wichtige Seiten da drauf verlinken.

Das ist etwas, das kann man an dieser Information rauskriegen.

Man zählt einfach, wie viele Links gehen rein und dann gibt es eine Formel mit einer komplizierten Summe und dann kann man einfach sagen, dieses hier hat den Rank 0,7 und dann solche Sachen kann man berechnen.

Aber auch nicht viel mehr.

Wäre doch viel schöner, wenn wir mehr über die Sachen wüssten, wenn wir mehr wüssten, wie verhält sich dies hier zu dem, wie verhält sich dieses Dokument zu diesem Thema und so weiter.

Und wenn man diese Information hätte und wenn man sie in einer maschinenverarbeitbaren Funktion hätte, dann könnte man über diese Struktur des Webs mehr rauskriegen.

Und das ist eigentlich die ganze Idee von Whiskey.

Die Idee ist, dass man statt Dinge in eine Datenbank zu packen, Sie erinnern sich, da hatten wir auch über Foreign Links, hatten wir irgendwie Verweise auf andere Tabellen und so weiter,

in einer Datenbank wären dieses hier typischerweise Tabellen oder Reihen in einer Tabelle, die irgendwie mit irgendwelchem anderen Krempel zusammenhängen.

Aber wir wissen nicht wie in einer Datenbank.

Das hat keine Bedeutung.

Und schön wäre es doch, wenn man irgendwie, wie im Semantic Web, von den Objekten, die man hat, wüsste, was für Objekte das sind, also es ist eine Klassifikation.

Und wenn man wüsste, was die Relationen zwischen den ganzen Objekten sind.

Man wüsste, dass der Beheim-Globus ein Globus ist und dass er, das ist eine Klassifikation oder ein historisches Objekt oder ein Objekt, was relativ groß ist.

Und wenn es die Relation zu anderen Dingen hätte, zum Beispiel, es liegt im Museum in Nürnberg oder steht wahrscheinlich.

Wenn man hier genauso solche, diese Relationen, wenn man die irgendwie fassen könnte, dann hätte man mehr von diesen ganzen Dingen.

Und das ist in diesem Whisky-System, was eine große Rolle spielt, ist das die Basisidee.

Die Idee ist einfach.

Die Techniken, die dahinter stehen, alles verstehen, ist ein bisschen mehr Arbeit.

Und deswegen haben wir beim letzten Mal uns sozusagen diese Idee, wir haben Objekte und deren Relationen, haben wir uns, haben Sie sich zusammen mit Frederik sozusagen im Einzelnen angeguckt.

Das Ganze nennt man semantische Netzwerke und hier ist eins.

Und wir haben da eben Objekte, die sind durch irgendwelche Relationen miteinander verbunden.

Und das Wichtige, was dabei herauskam, dass es zwei Arten von links gibt.

Es gibt diese Ise-Links.

Ise sagt einfach, ein Rotkehlchen ist ein Subkonzept von dem Konzept eines Vogels.

Und was bedeutet das? Da ist sozusagen eine Bedeutung dahinter.

Das sagt einfach, naja, die Menge aller Objekte, die Rotkehlchen sind, ist eine Teilmenge der Menge aller Dinge, die Vögel sind.

Das steckt dahinter und das verwendet man, um mehr aus einem solchen Netz herauszulesen, als was man reingesteckt hat.

Die wichtigste Sache, die man bei so semantischen Netzen verstehen sollte und im Übrigen beim Semantic Web ist,

dass wenn man weiß, dass Vögel Körperteile haben, die Flügel sind, und man weiß, dass Rotkehlchen Vögel sind,

dann kann man daraus schließen, dass Rotkehlchen Flügel haben.

Das ist der Trick bei diesen semantischen Netzwerken, nämlich, dass man neue Informationen kriegt, die man nicht hingeschrieben hat.

Das ist der Hauptunterschied zum Beispiel auch zu Datenbanken. Datenbanken sind großartig.

Man kann Sachen reinschreiben und man kann genau das rauskriegen, was man reingeschrieben hat.

Und das sehr schnell, zuverlässig und auch bei Stromausfall. Dafür sind Datenbanken gut.

Sementische Netzwerke sind anders. Da kann man was reinschreiben und Sachen rausholen, indem man nachfragt.

Zum Beispiel, ist John der Eigentümer von Maria? Die Antwort ist nein. Warum nicht? Weil es keine Owner of Kante zwischen John und Maria gibt.

Es gibt aber eine Loves Kante, also John liebt Maria, das kriegt man raus, aber er besitzt sie, das wissen wir nicht.

Und wenn wir es nicht wissen, nehmen wir an, dass es nicht so ist. Aber wir kriegen auch Dinge drauf, die wir nicht reingeschrieben haben.

Zum Beispiel, dass Rotkehlchen Flügel haben und insbesondere das Jack Flügel hat.

Und dass John Eigentümer von etwas ist, das Flügel hat.

Zugänglich über

Offener Zugang

Dauer

01:27:48 Min

Aufnahmedatum

2019-07-18

Hochgeladen am

2019-07-19 08:14:38

Sprache

de-DE

Tags

Model Web WissKI Ontologie Ontology OWL SPARQL FOAF SUMO CIDOC-CRM ISO-21127 Semantic Network Friend Suggested Upper
Einbetten
Wordpress FAU Plugin
iFrame
Teilen