4 - Informatische Werkzeuge in den Geistes- und Sozialwissenschaften (IWGS) II [ID:32438]
50 von 512 angezeigt

aufnehmen. Okay, also wie gesagt, Hausaufgaben sind unsere Hilfe, ihnen vernünftige Möglichkeiten zum

Üben an die Hand zu geben und sich das anzugucken, das mal selber gemacht zu haben, ist extrem hilfreich.

Sie werden in die Gelegenheit kommen, diese Dinge zu machen im Laufe ihres Studiums. Spätestens aber,

wenn sie hinterher einen Job haben in den Digital Humanities. So, genau. Bisher, also in den letzten

Jahren habe ich hier sozusagen übergeleitet in eine, ich will mal sagen Gesamtschau. Wie macht

man denn aus den Ideen, wie wir bisher hatten, eine kleine Web Application und die haben wir dann

immer, wie sagen, im Detail durchgesprochen. Das will ich heute nicht machen, sondern ich will

stattdessen ihnen so ein bisschen, noch ein bisschen mehr zeigen und sagen, wie solche Web

Applications in real life sind und zwar, wie man da mit Input und Output umgeht. Ich werde das Kapitel

8, glaube ich, diese Books Application, werde ich in den Folien drin lassen, aber nicht hier

besprechen. Da können Sie sich auch nochmal sozusagen mit dem Finger durch die Slides gehen

und gucken, ob Sie alles verstanden haben. Stattdessen möchte ich so ein bisschen mehr zeigen.

Und zwar möchte ich Ihnen auch gleich, also ich möchte nochmal zurückkommen auf das XML,

was eine der wichtigsten Serialisierungen, sagen wir, einer der wichtigen Formate ist,

in denen Daten, wie man sie in Datenbanken hat, ein- oder ausgegeben werden. Und ich möchte Ihnen

dann etwas Neues zeigen, das heißt JSON. Das ist sozusagen eine Alternative zu XML, die bei Web

Applications sehr viel benutzt wird und deswegen, glaube ich, ist es ganz gut, wenn Sie das mal

gesehen haben. Okay, so. Sie erinnern sich vielleicht, als wir uns über XML unterhalten

hatten, da hatte ich ja versucht, Ihnen darzustellen, dass XML eine Markup-Sprache ist,

in der man Dokumenten Bäume darstellen kann. Und als ein Beispiel, was wir hatten, hatte ich

irgendwo den Katalog der Museen der Stadt New York aufgetrieben, der ein XML-File war,

der im Wesentlichen als Wurzelknoten ein Museumselement hatte und darunter lauter

Kinder, ich glaube 108 oder so was waren es das letzte Mal, als ich geguckt habe, die wiederum

ein Museum waren und da gab es einen Namen, einen Telefon, Telefonnummer, eine Adresse und so weiter

Zeugs. Und jetzt könnte man doch sagen, okay, diese Datei gibt es, wäre es nicht schön, wenn

wir eine Datenbank-basierte Web-Applikation machen für diese Museen. Wie machen wir das? Die Idee ist,

dass man einfach diesen Katalog sich runterlädt und dann eine Eskulite-Datenbank damit befüllt,

dann die XML-Datei sich runterlädt und von der URL da oben runterlädt und die benutzt,

um die Tabelle zu befüllen. Sie erinnern sich, vorher hatte ich immer, wo ist es,

das ist es nicht, was ich wollte, ja, vorher hatte ich immer so mit der Krücke gearbeitet.

Ich hatte mir irgendwelche, ich hatte von Hand irgendwelche Listen von Tuppeln in Pfeifen

geschrieben und so weiter und das kann man mal machen für sieben Bücher, aber für sagen wir mal

die fünf Millionen Bücher der Uni-Bibliothek will man das nicht unbedingt machen, schon für die

108 Museen will man das nicht machen. Deswegen würden wir gerne etwas haben, eine Funktion haben,

die das einmal rein saugt, indem sie einfach diese XML-Datei nimmt. Wenn man schon so eine Funktion

hat, kann man die natürlich in der Web-Application jede Nacht laufen lassen, dann ist man immer up

to date. Man könnte sich ja vorstellen, eine Pandemie passiert und da müssen irgendwie die

Hälfte aller Museen für immer schließen, dann will man natürlich nicht die alten Museen irgendwie

immer noch in unserer Web-Application rumstehen haben und das ist eine Sache, die sehr häufig

passiert. Man importiert Daten, man importiert Daten aus irgendwelchen Datenquellen und sehr

häufig hat man solche Datenquellen und die muss man irgendwie absaugen. Wie macht man das?

Hier ist der Code. Im Wesentlichen brauchen wir zwei Dinge, einmal das gute alte LXML,

die LXML Library aus dem letzten Semester, wir hatten uns die schon angeguckt und wir benutzen

die urlib-Library, mit der wir einfach eine Datei vom Web holen. Das heißt, wir importieren die

beiden Dinge, geben uns eine Abkürzung für diese URL, die wir gefunden haben und dann kann ich mir

daraus ein Dokument machen, das ist einfach ein String letztlich und da sagen wir einfach mal,

wir benutzen die urlopen-Funktion, die öffnet einfach diese URL, dafür kriege ich ein Objekt

und dann sage ich read, read heißt einfach, gib mir das, hol das einfach. Danach habe ich die

Dokumentendatei, die vorher irgendwo vermutlich in New York lag, habe ich jetzt hier in dieser

Variable. Das ist jetzt ein String, ein XML String, deswegen muss ich von dem XML String,

Zugänglich über

Offener Zugang

Dauer

01:14:37 Min

Aufnahmedatum

2021-05-06

Hochgeladen am

2021-05-06 19:28:14

Sprache

de-DE

Einbetten
Wordpress FAU Plugin
iFrame
Teilen