2 - LBS: Logik-Basierte Semantik Natürlicher Sprache [ID:22903]
50 von 393 angezeigt

Genau. Damit wir den Anfang finden, wir hatten darüber gesprochen, dass wir zwei Arten von

Methoden haben, wir haben statistische Methoden, die einem sozusagen erlauben, von enger Überdeckung

auf weite Überdeckung zu kommen und dass wir die wissensbasierten Methoden haben, die

erst einmal erlauben, tiefes Prozess zu machen. Worauf ich hinaus will, ist, dass es für beides

Anwendungen gibt. Es gibt was Anna Ranta die Consumer Tasks nennt. Das sind so die Tasks,

wo man, wo irgendwelche Konsumenten, also Lieschen Müller, die da hinten auf der Straße läuft,

wenn die mit ihrem Task ankommt, dann muss man irgendwas machen. Das sind so Sachen, die haben

eine Überdeckung, wo man irgendwie mit 100.000 bis 10.000.000 Konzepten, ich will das einfach

mal in Konzepten messen und wenn ich Konzept sage, dann meine ich eigentlich sowas wie die Bedeutung

von Wörtern, sowas wie Hund, Katze, Stuhl, Chlorisoparmonisch, alle solche Sachen. Und klar,

wenn ich in wie bei Google Translate oder so etwas beliebige Texte übersetzen will, dann muss

ich irgendwie mit allen Konzepten umgehen können, die ein normaler Erwachsener hat. Die nicht nur ein

ein normaler Erwachsener hat, sondern meine ganzen Konsumenten, meine ganzen Kunden sozusagen

zusammen haben. Und da sind wir schon schnell bei einer bis zehn Millionen Konzepten. Und mit denen

muss ich irgendwas anfangen. Und Google Translate kann das. Das ist schon ziemlich klasse. Aber die

Präzision, wie wir alle wissen, ist nicht sonderlich hoch bei Google Translate. Man kriegt zwar eine Idee

als Mensch, worum es da so geht, aber das liegt nicht daran, dass Google Translate so toll in

seiner Präzision ist, sondern weil die menschlichen Zuhörer so fantastisch sind, die ganzen Fehler

wieder auszuputzen. Das ist nur als Leben. Dann gibt es, was Arne Ranta die Producer-Tasks nennt,

das sind so typische Sachen. Ich bleibe mal in der Metapher-Übersetzung. Stellt euch mal vor,

ihr seid irgendwie bei Schäffler-Jahren gestellt und ihr macht irgendwelche Maschinen, Werkzeugmaschinen.

Jede Werkzeugmaschine kostet eine Million oder drei Millionen Euro und ihr stellt zwar nur

20 Stück von denen her, liefert die aber in 15 verschiedenen Länder pro Jahr. Das heißt,

nach fünf Jahren habt ihr die typischerweise in 40 Länder geliefert. Das heißt, ihr müsst die

Manuals, die ziemlich dick sind, müsst die in 40 verschiedenen Sprachen vorhalten. Und ihr müsst

sie so gut haben, dass hinterher die Maschine richtig bedient wird, irgendwo in Lahore oder so was.

Denn wenn die Maschine falsch bedient wird, ist sie hinterher kaputt. Drei Millionen Euro weg. Das

finden die Kunden nicht so dolle. Beziehungsweise Schäffler findet das nicht so doll, wenn das

Manual falsch war und es also ihre Schuld war. Das heißt, du hast ein Riesenproblem für solche

Firmen, überhaupt diese ganzen Manuals zu verwalten, zumal nach jeweils drei Maschinen

sich die Maschine ändert. Man hat auch noch ganz viele verschiedene Versionen von den Beasts,

in verschiedenen Sprachen und so weiter. Das muss man irgendwie voreinanderhalten.

Das ist eine ganz typische Sache, wo Maschinenübersetzen reinkommt, sonst könnte man das gar

nicht mehr. Aber das muss so präzise sein, dass ich das Manual, das daraus erzeugt wird,

mit der Maschine nach Lahore schicken kann und es trotzdem funktioniert. Und das sind sogenannte

Producer-Tasks. Das ist typischerweise für Produzenten von irgendetwas. Und da brauche ich

aber sehr viel weniger Konzepte. Also so eine Maschine, die hat vielleicht ja vielleicht

tausend verschiedene benahmste Teile. Viel mehr brauche ich nicht. Dann hat sie vielleicht nur

mal tausend Inputs. Dann brauche ich also im Prinzip eine Domäne, diese Maschine. In der müssen

meine Methoden vernünftig sein. Und für alles andere bin ich nicht zuständig. Insbesondere

braucht die Software, die mir diese Manuals verwaltet, die braucht nicht mit Gedichten

sich auskennen zu wollen und auch nicht einigermaßen eloquent über die Sinfonien von Beethoven reden

zu können. Und das gibt tatsächlich, das sind die etwas weniger sichtbaren KI-Anwendungen,

in irgerster Weise, die aber trotzdem ein sehr großes Volumen ausmachen. Und da sind typischerweise

symbolische Sachen, so wie wir sie jetzt betreiben, sehr stark. Es ist euch sicherlich aufgefallen,

dass dieses Diagramm ungefähr eine quantitative Version von diesem Diagramm ist. Das ist nicht

von Ihnen ungefähr. Das heißt, wir werden uns hier im Wesentlichen zumindest von der Motivation

her um diese Arten von Dingen kümmern, in der man eine hohe Präzision braucht, wo man aber nicht

irgendwo eine Million Konzepte hat. Und diese Größenordnungen sind auch mit den Techniken,

die wir hier betrachten, einigermaßen beherrschbar. Es geht um Komplexität und Präzision. Mich

Zugänglich über

Offener Zugang

Dauer

00:55:17 Min

Aufnahmedatum

2020-11-05

Hochgeladen am

2020-11-05 15:58:36

Sprache

de-DE

Einbetten
Wordpress FAU Plugin
iFrame
Teilen