9 - Informatische Werkzeuge in den Geistes- und Sozialwissenschaften I [ID:12598]
50 von 512 angezeigt

Und immer wenn ein Klammerpaar einer an einem anderen Klammerpaar dran ist, dann machen wir da zwischen einen Pfeil.

Und das Ganze ist ähnlich aufgebaut wie ein Baum.

Und deswegen benutzen wir Baumvokabular dafür.

Okay, also was wie Äste, Blätter, Großeltern, Nachkommen.

Solche Worte können wir nahezu unmittelbar benutzen.

Okay, irgendwelche Fragen zu dieser Idee?

Wohlgeklammerte Ausdrücke sind Bäume.

Und Bäume sind selbstähnlich.

Das ist das Wichtigste.

Dann habe ich versucht, Sie davon zu überzeugen, dass man Bäume relativ leicht programmieren kann.

Weil man eine Teile- und Herrschestrategie anwenden kann.

Man guckt sich in so einem Baum immer die Wurzel an.

Und die Teilbäume, das Schöne an den Teilbäumen ist, man kann das Ganze durch einen rekursiven Aufruf machen.

Diese Sache ist schwierig zu verdauen.

Und wenn Sie allgemein was mit Bäumen machen, auch wichtig zu verstehen.

In diesem Fall aber nicht so wichtig, weil wir Ersatz dafür finden werden.

Ich wollte Ihnen aber trotzdem mal gezeigt haben.

Wenn ich mich so einschätze, als wenn ich jetzt da sitzen würde, wäre ich immer noch ziemlich verwirrt.

Das ist okay.

Sie können das durchdringen, werden das auch irgendwann durchdringen, bin ich mir absolut sicher.

Aber man muss gegen diese Wand mit dem Kopf einigermaßen häufig anrennen.

Das Einzige, was man nicht machen darf, ist aufhören damit.

Und irgendwann schnackelt es. Und es fühlt sich wahnsinnig gut an.

Und irgendwann ist es dann auch so, dass man das natürlich findet.

Das ist wie Kaffee trinken. Das ist eine Weile, bis man sich an den Geschmack gewöhnt und den gut findet.

Deswegen ist es vollkommen okay, wenn Sie jetzt immer noch das Gefühl haben, das schmeckt bitter.

Deswegen werde ich da auch gar nicht mehr besonders drauf eingehen.

Ich will nur sagen, dass wenn wir irgendetwas mit Dokumenten machen,

zum Beispiel Word Dokumente sich anguckt oder Ihr Webbrowser ein Dokument verarbeitet, das erste, was das Beast macht,

ist, dass es eine Baumdatenstruktur im Speicher anlegt,

die gar nicht so unterschiedlich aussieht von dem Beast hier.

Und dann nur noch auf dem arbeitet. Warum?

Na ja, weil das so schön ist und so einfach ist, während der Schmerz erst mal nachgelassen hat.

Okay? Was ich heute machen möchte, ist, dass ich Ihnen zeigen möchte, dass es Tools gibt,

mit denen man den ganzen Vieles des Schmerzes des rekursiven Programmierens einfach umgehen kann.

Gut. Und das möchte ich nicht auf der Ebene von HTML machen, sondern das möchte ich auf der Ebene von XML machen.

Weil XML ist eines der wichtigsten Werkzeuge, was Sie in den Digital Humanities brauchen,

weil das eins der Hauptdatenaustauschformate sind. Ein anderes namens Jason, haben Sie vielleicht auch schon mal was von gehört,

das sieht tatsächlich fast genauso aus. Ist ja auch nur ein Baum.

Aber ich möchte es an XML machen. XML als Idee ist, dass wir uns die Ideen von HTML nehmen,

nämlich Beginntag, Endtag, Attribute, Textknoten und so weiter.

Und die Dokumentenbedeutung, nämlich ein P wird ein Paragraf und ein H2 wird eine Überschrift,

das wird das alles weglassen und das freigeben. Was die Elementnamen sind, kann man sich selber überlegen.

Hier ist ein XML-Dokument, das zufällig auch ein HTML-Dokument ist.

Hier ist eins, da geht es um Museen. Da hat sich irgendeiner hingesetzt in New York und hat gesagt,

ich will was über Museen sagen, was ist denn eine Museumsdatenbank?

Da sage ich, Achtung, Anfang, Museumsdatenbank, dann kommt das erste Museum, das zweite Museum, das dritte Museum

und bis 80 oder so etwas haben Sie in dieser Datei drin. Was ist ein Museum? Das hat einen Namen, eine Adresse,

eine Telefonnummer, wann es aufmacht, wie viel es kostet und dann noch irgendwelche Texte, die Specials anführen.

Wenn Sie irgendwelche Daten erfassen wollen, können Sie das in genau der gleichen Weise machen.

Zugänglich über

Offener Zugang

Dauer

01:26:33 Min

Aufnahmedatum

2019-12-19

Hochgeladen am

2019-12-20 02:19:03

Sprache

de-DE

Tags

XML python docx hypertext
Einbetten
Wordpress FAU Plugin
iFrame
Teilen