Wunderbar. Dankeschön. Wir hatten damit angefangen, um über Datenbanken zu,
eigentlich wollte ich das in der Wiederholung noch nicht, aber es ist auch jetzt egal,
klar zu werden, was Daten eigentlich sind. Und Daten sind etwas, sowas wie dieses 0,59,
ja, 95, Entschuldigung, das sind im Prinzip typischerweise so etwas wie Zahlen, wie Zeichenketten,
Bilder, alle solche Dinge, relativ einfache Dinge, die wir auch in einfache Datenstrukturen
in Python einsperren würden, die aber, und das ist das Wichtigste, einen gewissen einfachen
Kontextbezug haben. Ja, so zum Beispiel einfach das Datum 0,95 kriegt seine Nützlichkeit nicht
dadurch, dass es 0,95 ist, sondern dass wir wissen, dass dieses 0,95 einen Umtauschrate
zwischen Dollar und Euro ist. Nur dadurch, dass wir das wissen, 0,95 könnte ja auch was ganz anderes
sein. Ja, das könnte der Inhalt meiner Kaffeetasse sein, das könnte allerlei Dinge sein. Immer wäre
es 0,95. Aber dadurch, dass ich weiß, dass es irgendwo in einer Relation zu etwas anderen
Städten in diesem Fall, dass die Bedeutung eine Umtauschrate ist, also dass ein Dollar 0,95 Euro
ist, sie sehen es schon eine Weile her, dass die Folien gemacht wurden, dadurch kriegt es sozusagen
den Charakter einer in gewisser Weise Aussage, Aussage über die Welt. Und das macht es zu Daten,
nämlich etwas, was eine bestimmte Form hat, dass man sagt, okay, irgendwas, Komma, unter einen
Zweiziffer. Und auch einen Kontext hat, das ist sozusagen, was Daten ausmacht. Und das müssen wir
irgendwie modellieren und das tun wir in der Datenbank. Ups, ich bin hier wirklich viel zu weit nach
hinten geraten. Da war man. Okay, dann hatten wir uns ein bisschen darüber unterhalten, wo man Daten
speichern kann und hatten uns angeguckt die relativen Vor- und Nachteile, dass wenn man
Daten im Speicher eines Computers speichert, das ist sehr schnell, aber nicht persistent. Das heißt,
Computer aus Daten weg. Man kann es in Textdateien speichern, da hat man den großen Nachdenkvorteil,
dass man das einigermaßen gut ran kann, aber dass man zumindest als System die Datei von vorne bis
hinten durchlesen muss. Man kann also nicht einfach sozusagen in die Mitte springen, sondern wenn man
eine riesenlange Datei hat, muss man sie von vorne bis hinten durchlesen. Und wenn das, sagen wir mal,
eine Datei von einem Terabyte groß ist, dann dauert das eine Weile. Wir hatten uns Tabellenkalkulationsprogramme
angeguckt und letztlich dann hinterher die Datenbank. Der Unterschied zwischen einem
Tabellenkalkulationsprogramm und einer Datenbank, die es im Wesentlichen ist, dass wenn man das
eine, ein Tabellenkalkulationsprogramm wie Excel oder sowas, nur irgendwie 50.000 Zeilen
und Spalten kann, während eine Datenbank das sehr viel größer kann und auch sehr viel mehr Zeugs in
die Sachen reinschreiben kann, die auch die Relationen größer sind. Einfach sehr, sehr skalierbar.
Gut, und deswegen gucken wir uns Datenbanken an und ich will Ihnen jetzt sozusagen die Grundlagen
von Datenbanken nicht aus informatischer Sicht so sehr, sondern aus Anwendungssicht erklären und
an Beispielen vorführen. Dabei ist es wichtig, dass man ein paar Sachen auf ein paar Sachen aufpasst.
Wenn man sagt eine Datenbank, dann ist das sehr ungenau. Das kann nämlich zwei Dinge heißen.
Das kann entweder einen Satz von Daten, einen organisierten Satz von Daten heißen. Das könnte
sozusagen die Daten über ihre Bücher in ihrem Regal zu Hause haben oder an der UBE. Das wäre dann
ein Datensatz. Dazu sagt man Datenbank. Man sagt aber auch Datenbank zu einem Datenbankmanagementsystem,
also einem System, einem Computerprogramm, was auf irgendeiner Hardware läuft, was solche
Datensätze verwaltet, sie abspeichert, sie erweitert und solche Sachen. Das sind zwei
verschiedene Sachen. Das eine ist sozusagen das System und das andere ist der Inhalt. Beides heißt
sehr häufig Datenbank, aber wenn man es genau sagt, sagt man ein Datenbankmanagementsystem,
das ist das System, und ein Datensatz, sagt man typischerweise, und ein relationateter
Datenbankmanagementsystem, das sind die Systeme, über die wir hier sprechen wollen, weil sie die
am häufigsten verwendeten sind im Moment. Bis vor 15 Jahren oder so, das waren das eigentlich die
einzigen, die es so gab. Da hat man das, also in einem relationalen Datenbankmanagementsystem ist
es im Wesentlichen, dass man Daten in so einer Art Tabelle organisiert, wo man im Wesentlichen
jede Zelle und natürlich auch, also jede Zelle ist ein Datum, oder diese Zelle hier 1910 ist ein
Datum, was im Wesentlichen sagt, okay, diese Zahl 1910 ist ein Sterbejahr, in diesem Fall des Outdoors
Mark Twain. Sie erinnern sich 0,95 ist auch nur eine Zahl, aber was wissen wir darüber? Wir wissen
darüber, dass wir zu einem Datum, zu Informationen wird das dadurch, dass wir wissen, dass es ein
Presenters
Zugänglich über
Offener Zugang
Dauer
01:19:04 Min
Aufnahmedatum
2021-04-22
Hochgeladen am
2021-04-22 19:37:15
Sprache
de-DE