aufnehmen. Okay, also wie gesagt, Hausaufgaben sind unsere Hilfe, ihnen vernünftige Möglichkeiten zum
Üben an die Hand zu geben und sich das anzugucken, das mal selber gemacht zu haben, ist extrem hilfreich.
Sie werden in die Gelegenheit kommen, diese Dinge zu machen im Laufe ihres Studiums. Spätestens aber,
wenn sie hinterher einen Job haben in den Digital Humanities. So, genau. Bisher, also in den letzten
Jahren habe ich hier sozusagen übergeleitet in eine, ich will mal sagen Gesamtschau. Wie macht
man denn aus den Ideen, wie wir bisher hatten, eine kleine Web Application und die haben wir dann
immer, wie sagen, im Detail durchgesprochen. Das will ich heute nicht machen, sondern ich will
stattdessen ihnen so ein bisschen, noch ein bisschen mehr zeigen und sagen, wie solche Web
Applications in real life sind und zwar, wie man da mit Input und Output umgeht. Ich werde das Kapitel
8, glaube ich, diese Books Application, werde ich in den Folien drin lassen, aber nicht hier
besprechen. Da können Sie sich auch nochmal sozusagen mit dem Finger durch die Slides gehen
und gucken, ob Sie alles verstanden haben. Stattdessen möchte ich so ein bisschen mehr zeigen.
Und zwar möchte ich Ihnen auch gleich, also ich möchte nochmal zurückkommen auf das XML,
was eine der wichtigsten Serialisierungen, sagen wir, einer der wichtigen Formate ist,
in denen Daten, wie man sie in Datenbanken hat, ein- oder ausgegeben werden. Und ich möchte Ihnen
dann etwas Neues zeigen, das heißt JSON. Das ist sozusagen eine Alternative zu XML, die bei Web
Applications sehr viel benutzt wird und deswegen, glaube ich, ist es ganz gut, wenn Sie das mal
gesehen haben. Okay, so. Sie erinnern sich vielleicht, als wir uns über XML unterhalten
hatten, da hatte ich ja versucht, Ihnen darzustellen, dass XML eine Markup-Sprache ist,
in der man Dokumenten Bäume darstellen kann. Und als ein Beispiel, was wir hatten, hatte ich
irgendwo den Katalog der Museen der Stadt New York aufgetrieben, der ein XML-File war,
der im Wesentlichen als Wurzelknoten ein Museumselement hatte und darunter lauter
Kinder, ich glaube 108 oder so was waren es das letzte Mal, als ich geguckt habe, die wiederum
ein Museum waren und da gab es einen Namen, einen Telefon, Telefonnummer, eine Adresse und so weiter
Zeugs. Und jetzt könnte man doch sagen, okay, diese Datei gibt es, wäre es nicht schön, wenn
wir eine Datenbank-basierte Web-Applikation machen für diese Museen. Wie machen wir das? Die Idee ist,
dass man einfach diesen Katalog sich runterlädt und dann eine Eskulite-Datenbank damit befüllt,
dann die XML-Datei sich runterlädt und von der URL da oben runterlädt und die benutzt,
um die Tabelle zu befüllen. Sie erinnern sich, vorher hatte ich immer, wo ist es,
das ist es nicht, was ich wollte, ja, vorher hatte ich immer so mit der Krücke gearbeitet.
Ich hatte mir irgendwelche, ich hatte von Hand irgendwelche Listen von Tuppeln in Pfeifen
geschrieben und so weiter und das kann man mal machen für sieben Bücher, aber für sagen wir mal
die fünf Millionen Bücher der Uni-Bibliothek will man das nicht unbedingt machen, schon für die
108 Museen will man das nicht machen. Deswegen würden wir gerne etwas haben, eine Funktion haben,
die das einmal rein saugt, indem sie einfach diese XML-Datei nimmt. Wenn man schon so eine Funktion
hat, kann man die natürlich in der Web-Application jede Nacht laufen lassen, dann ist man immer up
to date. Man könnte sich ja vorstellen, eine Pandemie passiert und da müssen irgendwie die
Hälfte aller Museen für immer schließen, dann will man natürlich nicht die alten Museen irgendwie
immer noch in unserer Web-Application rumstehen haben und das ist eine Sache, die sehr häufig
passiert. Man importiert Daten, man importiert Daten aus irgendwelchen Datenquellen und sehr
häufig hat man solche Datenquellen und die muss man irgendwie absaugen. Wie macht man das?
Hier ist der Code. Im Wesentlichen brauchen wir zwei Dinge, einmal das gute alte LXML,
die LXML Library aus dem letzten Semester, wir hatten uns die schon angeguckt und wir benutzen
die urlib-Library, mit der wir einfach eine Datei vom Web holen. Das heißt, wir importieren die
beiden Dinge, geben uns eine Abkürzung für diese URL, die wir gefunden haben und dann kann ich mir
daraus ein Dokument machen, das ist einfach ein String letztlich und da sagen wir einfach mal,
wir benutzen die urlopen-Funktion, die öffnet einfach diese URL, dafür kriege ich ein Objekt
und dann sage ich read, read heißt einfach, gib mir das, hol das einfach. Danach habe ich die
Dokumentendatei, die vorher irgendwo vermutlich in New York lag, habe ich jetzt hier in dieser
Variable. Das ist jetzt ein String, ein XML String, deswegen muss ich von dem XML String,
Presenters
Zugänglich über
Offener Zugang
Dauer
01:14:37 Min
Aufnahmedatum
2021-05-06
Hochgeladen am
2021-05-06 19:28:14
Sprache
de-DE