Also nochmal alles Gute zusammen und wir wollen uns zum nächsten Kapitel zuwenden.
Das ist diesmal Bildanalyse.
Und mathematisch gesehen ist das gar nicht nur konzentriert auf Bilder, sondern allgemein
Inputvektoren, die eine Nachbarschaftsbedingung haben.
Also wie kriegen wir das jetzt hin?
Wir stellen uns mal einfach auf den Standpunkt, wir wollen die Bildverarbeitung im Vordergrund
stellen und nicht die Neu-Neu-Netzgeschichte jetzt.
Und wenn ich das tue, dann starte ich halt mit einer zweidimensionalen Konstruktion
hier.
Und diese zweidimensionalen Konstruktionen drückt ein Bild auf, wenn es ein schwarz-weiß
Bild wäre. Wenn es ein buntes Bild ist, ist es sogar eigentlich eine dreidimensionale Konstruktion,
weil ich kann für jede der Grundfarben dann das Bild nochmal zeichnen und habe dann eine
dreidimensionale Beschreibung, also die Farbwerte noch dabei.
So, und dann kann man natürlich jetzt hingehen und wie das früher so gemacht wurde, kann
man dann alle möglichen Features hier auswerten.
Und diese Features auswerten heißt, ich könnte Augenabstand messen, ich könnte Augen- und
Mundabstand messen oder Nase und was auch immer so was, meine Bild alles im Gesicht erkennen
kann.
Und dann hätte ich einen Vektor von Features und den kann ich benutzen, um am Ende des
Tages hier eine Klassifikation zu machen, welche Person das wohl ist.
Also das wäre, sagen wir mal, die klassische Möglichkeit mit der Bildverarbeitung umzuwandeln.
Du handelst das Bild mit Engineering in Features um und machst dann deine Klassifikation.
Und jetzt ist aber das natürlich sozusagen kein Neuroverarbeitung, das ist keine Artificial
Intelligence Denke, die ja gesagt hat, wir wollen mit Wahrnehmungen umgehen und das
dann eben das Neuro in der Netzwerke.
Die Person, die das am intensivsten betrieben hat, das ist Jan Lecoeur, der ist Professor
in New York und ansonsten Chefberater bei Amazon heutzutage.
Hinten ist oder war jedenfalls Professor in Toronto und Chefberater bei Google und Joshua
Benjio, der ist Professor in Montreal, der wollte sich nicht auf die Industrie einlassen,
der ist einfach Uni geblieben.
Also unter den Namen findet man zu dem Thema Bildverarbeitung viel.
Aber Jan Lecoeur hat immer geglaubt, ich will nicht hingehen und Features mit Engineeringmethoden
herauslesen und dann die Klassifikation machen.
Nein, ich will das neuronale Netz gleich auf das Bild loslassen.
Und das hinzukriegen verlangt halt einige Zwischenschritte, gedankliche Zwischenschritte.
Der erste davon ist, wie um alles in der Welt soll ich Backpropagation modifizieren, damit
ich hier einen mehrdimensionalen Input rein tun kann, weil alles, was wir gemacht haben
in unseren vielen Folien vorher war ja Input rein, Matrix-Multiplikation und dann habe
ich wieder einen Vektor, wieder Matrix-Multiplikation und ich kriege einen Output-Vektor.
So ist der ganze Kalkül ja geschrieben, was bitte passiert jetzt, wenn der Input aber
kein Vektor ist, sondern selber eine Matrix.
Oder sogar eine dreidimensionale Matrix ist, was man als Tensor bezeichnet.
Also höherdimensionale Matrizen wären Tensoren.
Und wenn hier diese Zwischenverarbeitungsschritte eben auch keine Matrizen mehr sind, sondern
wenn das eben Tensoren sind, also Beispiel, ich habe hier einen zweidimensionalen Input,
ich will hier eine zweidimensionale Zwischenschicht haben, dann ist im Sinne von allgemeinerlinierer
Allgemeinerheit das Ding, was dazwischen liegt, das ist eine vierdimensionale Erweiterung von
der Matrix, also vierdimensionale Tensor.
Und was wird aus unserem Kalkül, wenn wir von dem normalen, was wir dauernd gemacht
haben, weggehen hin zu diesen verallgemeinerten Größen.
Presenters
Zugänglich über
Offener Zugang
Dauer
00:56:33 Min
Aufnahmedatum
2020-10-29
Hochgeladen am
2020-10-29 17:46:45
Sprache
de-DE