15 - Mathematische Grundlagen zu Künstliche Intelligenz, Neuronale Netze und Data Analytics I [ID:22199]

50 von 718 angezeigt

Also nochmal alles Gute zusammen und wir wollen uns zum nächsten Kapitel zuwenden.

Das ist diesmal Bildanalyse.

Und mathematisch gesehen ist das gar nicht nur konzentriert auf Bilder, sondern allgemein

Inputvektoren, die eine Nachbarschaftsbedingung haben.

Also wie kriegen wir das jetzt hin?

Wir stellen uns mal einfach auf den Standpunkt, wir wollen die Bildverarbeitung im Vordergrund

stellen und nicht die Neu-Neu-Netzgeschichte jetzt.

Und wenn ich das tue, dann starte ich halt mit einer zweidimensionalen Konstruktion

hier.

Und diese zweidimensionalen Konstruktionen drückt ein Bild auf, wenn es ein schwarz-weiß

Bild wäre. Wenn es ein buntes Bild ist, ist es sogar eigentlich eine dreidimensionale Konstruktion,

weil ich kann für jede der Grundfarben dann das Bild nochmal zeichnen und habe dann eine

dreidimensionale Beschreibung, also die Farbwerte noch dabei.

So, und dann kann man natürlich jetzt hingehen und wie das früher so gemacht wurde, kann

man dann alle möglichen Features hier auswerten.

Und diese Features auswerten heißt, ich könnte Augenabstand messen, ich könnte Augen- und

Mundabstand messen oder Nase und was auch immer so was, meine Bild alles im Gesicht erkennen

kann.

Und dann hätte ich einen Vektor von Features und den kann ich benutzen, um am Ende des

Tages hier eine Klassifikation zu machen, welche Person das wohl ist.

Also das wäre, sagen wir mal, die klassische Möglichkeit mit der Bildverarbeitung umzuwandeln.

Du handelst das Bild mit Engineering in Features um und machst dann deine Klassifikation.

Und jetzt ist aber das natürlich sozusagen kein Neuroverarbeitung, das ist keine Artificial

Intelligence Denke, die ja gesagt hat, wir wollen mit Wahrnehmungen umgehen und das

dann eben das Neuro in der Netzwerke.

Die Person, die das am intensivsten betrieben hat, das ist Jan Lecoeur, der ist Professor

in New York und ansonsten Chefberater bei Amazon heutzutage.

Hinten ist oder war jedenfalls Professor in Toronto und Chefberater bei Google und Joshua

Benjio, der ist Professor in Montreal, der wollte sich nicht auf die Industrie einlassen,

der ist einfach Uni geblieben.

Also unter den Namen findet man zu dem Thema Bildverarbeitung viel.

Aber Jan Lecoeur hat immer geglaubt, ich will nicht hingehen und Features mit Engineeringmethoden

herauslesen und dann die Klassifikation machen.

Nein, ich will das neuronale Netz gleich auf das Bild loslassen.

Und das hinzukriegen verlangt halt einige Zwischenschritte, gedankliche Zwischenschritte.

Der erste davon ist, wie um alles in der Welt soll ich Backpropagation modifizieren, damit

ich hier einen mehrdimensionalen Input rein tun kann, weil alles, was wir gemacht haben

in unseren vielen Folien vorher war ja Input rein, Matrix-Multiplikation und dann habe

ich wieder einen Vektor, wieder Matrix-Multiplikation und ich kriege einen Output-Vektor.

So ist der ganze Kalkül ja geschrieben, was bitte passiert jetzt, wenn der Input aber

kein Vektor ist, sondern selber eine Matrix.

Oder sogar eine dreidimensionale Matrix ist, was man als Tensor bezeichnet.

Also höherdimensionale Matrizen wären Tensoren.

Und wenn hier diese Zwischenverarbeitungsschritte eben auch keine Matrizen mehr sind, sondern

wenn das eben Tensoren sind, also Beispiel, ich habe hier einen zweidimensionalen Input,

ich will hier eine zweidimensionale Zwischenschicht haben, dann ist im Sinne von allgemeinerlinierer

Allgemeinerheit das Ding, was dazwischen liegt, das ist eine vierdimensionale Erweiterung von

der Matrix, also vierdimensionale Tensor.

Und was wird aus unserem Kalkül, wenn wir von dem normalen, was wir dauernd gemacht

haben, weggehen hin zu diesen verallgemeinerten Größen.

Teil einer Videoserie :

Mathematische Grundlagen zu Künstliche Intelligenz, Neuronale Netze und Data Analytics I

Presenters

Dr. Hans Georg Zimmermann

Zugänglich über

Offener Zugang

Dauer

00:56:33 Min

Aufnahmedatum

2020-10-29

Hochgeladen am

2020-10-29 17:46:45

Sprache

de-DE

Einbetten

Wordpress FAU Plugin

 https://www.fau.tv/clip/id/22199

iFrame

<iframe src="https://api.video.uni-erlangen.de/services/oembed/?url=https://www.fau.tv/clip/id/22199&format=iframe&maxwidth=1280&maxheight=720" width="1280" height="720"seamless allowfullscreen style="border: 0; padding: 0; margin: 0;overflow: hidden;"></iframe>

Herunterladen

Video

Per RSS abonnieren