4 - Wie funktioniert Spracherkennung? – Interview mit Herrn Prof. Dr. Elmar Nöth [ID:28883]

50 von 160 angezeigt

Ja, grüß Gott zusammen. Wir haben heute wieder einen interessanten Gast, Herr Prof. Elmar Nöth.

Sie sind am Lehrstuhl 5, Mustererkennung Professor und spezialisiert auf Sprachverarbeitung,

wenn ich es richtig gesagt habe. Was genau machen Sie da und können Sie da Anwendungsbeispiele sagen,

was sozusagen Forschungsgegenstand ist in Ihrem Arbeitsbereich? Bei uns in der Gruppe konzentrieren

wir uns mehr darauf, wie etwas gesagt wird, als was gesagt wurde. Was gesagt wurde heißt,

ich habe ein Sprachsignal, ich möchte es umsetzen in eine Sequenz von gesprochenen Wörtern. Wie

gesagt wurde, da möchte ich andere Sachen herausfinden über den Sprecher. Das kann sein,

ist er ein Muttersprachler, es kann sein, ist er verärgert, ist er neutral, ist er freudig,

erregt. Es kann so etwas sein, wie hat er eine Sprachbehinderung, eine Sprachpathologie. Alles,

was wir unter dem Oberbegriff paralinguistisch zusammenfassen, Sprechereigenschaften im Wesentlichen.

Das ist das, was ich untersuche. Ah, interessant. Rechtlich hat es natürlich Bedeutung für die

Frage, wenn ich zum Beispiel ein Personaldienstleister bin und sortiere jetzt bestimmte Bewerber aus,

die nicht Muttersprachler sind, könnte man die arbeitsrechtliche Frage stellen,

hat das einen Diskriminierungseffekt zum Beispiel? Ja, das ist in der Tat so, wenn ich ein Interview

führe mit einem Bewerber und nehme dieses Interview auf, dann kann ich das gleichzeitig

von einem Rechner in verschiedene Richtungen untersuchen lassen. Also auch so etwas wie

Teamfähigkeit, solche Charaktereigenschaften kann man anhand einer Stichprobe erlernen. Das heißt,

ich kann anhand des Kommunikationsverhaltens in diesem Gespräch Rückschlüsse ziehen, diese

Person ist gut geeignet, Leute zu führen, ja oder nein. Aber da wird es sehr kritisch, weil das sind

in der Regel statistische Verfahren, die zum ersten Mal gar nicht rechtfertigen können,

wie sie entscheiden. Die sagen, der ist sehr sozial eingestellt, der kann Leute führen,

der ist geeignet, der nicht. Aber das machen sie eigentlich, indem sie diese Person oder die Sprache

dieser Person vergleichen mit Sprachproben von anderen Leuten, die von Experten beurteilt wurden.

Das heißt, ich habe dann, nehmen wir an, so ein Zweiklassenproblem, geeignet Leute zu führen,

ja oder nein. Es wurde eine große Gruppe von Leuten untersucht in Bezug auf diese Eigenschaft

und bekommen zu ihrem gesprochenen Signal noch eine Bewertung, 0,1. Dann nehme ich diese neue

Person und vergleiche sie mit mathematischen Methoden zu diesen zwei Gruppen und entscheide mich,

ich schmeiße den in die eine oder die andere rein. Ich kann aber nicht mehr sagen, genau was ihr

jetzt da dazu geführt habt. Das heißt, der Algorithmus kann zwar mit einer gewissen Fehlerrate

das auch entscheiden, aber er kann jetzt sagen, ich habe mich entschieden, weil.

Es ist sozusagen, weil statistische Verfahren sind natürlich wieder das entscheidende Thema,

wie ist quasi die Gruppe zusammengestellt und wer hat die Gruppe zusammengestellt? Es gibt ja

sowas wie Trainer oder die Leute, die sozusagen als Supervisor irgendwie der Maschine das beibringen

müssen, ist es jetzt ein gesunder Kandidat oder ist es ein kranker Kandidat? Und die müssten

natürlich rechtlich dann transparent machen, an welchen Kriterien sie das festmachen sozusagen.

Genau und sie müssten vor allem auch zeigen, dass ihre Stichprobe repräsentativ ist. Also ich will

mal sagen, wenn wir jetzt das Beispiel gesund krank nehmen, auch da hätte ich jetzt sagen wir

mal jemand hat Alzheimer oder jemand hat Parkinson und ich mache eine Früherkennung,

dann möchte ich das vergleichen. Wie mache ich das? Ich brauche eine Gruppe von Leuten mit einer

gewissen Krankheit und ich brauche eine Kontrollgruppe. Viele dieser Krankheiten sind nicht so häufig,

das heißt, ich kann jetzt nicht repräsentativ die Bevölkerung durchsuchen, sondern ich

suche mir eine Gruppe von Leuten mit Alzheimer, Depression, Parkinson und nehme mir dann eine

andere Gruppe, die diese Phänomene nicht hat. Und wenn ich da jetzt zum Beispiel, weil meine Gruppen

zu klein sind, jetzt und das passiert sehr häufig, die Gruppe der Nicht-Muddersprachler ausschließe,

das heißt, ich nehme dann nur Leute, die Alzheimer haben und Muttersprachlerdeutsch sehen und hole

mir dann eine Vergleichsgruppe, die nur Deutsch als Muttersprachler als Kontrollgruppe hat und ich

habe jetzt ein Bewerbungs-Sprechung, ich nutze dieses Wissen aus, dann habe ich ja diesen Fall des

Nicht-Muddersprachlers überhaupt noch nie gesehen und dann kann es mir wirklich passieren, dass ich

schon gar schlechter bin als Würfeln. Das heißt, sehr fränkisch zugespitzt ausgedrückt, weil einer,

der Nicht-Muddersprachler ist, vielleicht etwas länger darüber nachdenken muss, was er sagen will,

Teil einer Videoserie :

Legal Tech Interviews

Presenters

Dr. Axel Adrian

Zugänglich über

Offener Zugang

Dauer

00:17:59 Min

Aufnahmedatum

2021-01-26

Hochgeladen am

2021-01-27 01:09:50

Sprache

de-DE

Kann von Spracherkennung eine Diskriminierung ausgehen, wenn z.B. ein maschinelles Bewerbungsinterview geführt wird? Was ist im Hinblick auf die Transparenz, Repräsentativität und die Stichprobe der Trainingsdaten von Algorithmen zu beachten? Wie funktioniert Spracherkennung? Sind Beweismittel wie Sprecheridentifikationen oder Lügendetektoren auf Grund von Spracherkennung und –vergleichung vor Gericht verwendbar? Videointerview von Prof. Dr. Elmar Nöth durch Notar und Lehrbeauftragten Prof. Dr. Axel Adrian.

Einbetten

Wordpress FAU Plugin

 https://www.fau.tv/clip/id/28883

iFrame

<iframe src="https://api.video.uni-erlangen.de/services/oembed/?url=https://www.fau.tv/clip/id/28883&format=iframe&maxwidth=1280&maxheight=720" width="1280" height="720"seamless allowfullscreen style="border: 0; padding: 0; margin: 0;overflow: hidden;"></iframe>

Herunterladen

Video

Per RSS abonnieren