7 - Informatische Werkzeuge in den Geistes- und Sozialwissenschaften I (WS 2020/21) [ID:26803]
50 von 506 angezeigt

aufzunehmen. Und wir würden uns anfangen mit sogenannten regulären Ausdrücken. Reguläre

Ausdrücke sind so ein, ich will mal sagen, typischer Angstgegner von Anfängern. Einer meiner

Doktoranden hat ein ganz tolles T-Shirt, da steht groß drauf, Stand back, I know regular expressions.

Ja, weil regular expressions sind irgendwie ein tolles kleines Tool, aber das verknotet einem das

Gehirn so ein bisschen. Deswegen möchte ich Sie bitten, sozusagen mal so ganz offen und relaxed an

die Sache ranzugehen, dann sind sie nämlich nicht so wahnsinnig schwer. Man kann sehr viel damit

machen und man kann sehr effizient Dinge tun. Gut, so, das haben Sie sich sicherlich gewundert. Was

sind reguläre Ausdrücke? Reguläre Ausdrücke oder RegExper sind, ist eigentlich eine Programmiersprache

in der Programmiersprache. Das ist eine Programmiersprache, mit denen wir Mengen von Zeichenketten definieren

können. Und das ist im Prinzip ganz einfach, aber die im Wesentlichen hat in dieser Sprache jeder

Buchstabe eine eigene Bedeutung und deswegen sind reguläre Ausdrücke, wo man mit zehn Zeichen oder

so etwas sehr viel machen kann. Und da haben wir, dies hier gibt einem schon viel mehr als dieses

hier ist es gar nicht. Aber dies hier ist etwas, das richtig, richtig kompliziert ist. Oder

beziehungsweise aufwendig ist zu schreiben, aber wenn man es mal hat, macht das tolle Dinge und das

werden wir uns angucken. Es gibt, es ist im Allgemeinen immer so, dass wir einen Buchstaben haben

und der steht für eine ganze Menge von Strings, von Zeichenketten. Zum Beispiel der Buchstabe Punkt

steht nicht nicht für den Buchstaben Punkt selber, sondern für beliebig viele, nein, stimmt gar nicht,

für beliebige Buchstaben, außer neue Zeichen. Also wenn ich einen regulären Ausdruck habe,

der nur aus dem Punkt besteht, dann könnte das das A sein, das kleine A, das große A oder irgendwie

die Hieroglyph für Ente oder was weiß ich, die Zahl fünf. Okay und jetzt können wir und der Trick

an dieser ganzen Sache ist, dass wir die hier Buchstaben der regulären Ausdrücke zusammensetzen

können. Fast alle Buchstaben, zum Beispiel A, B und C oder so etwas, spezifizieren sich selber.

Ja und ich möchte jetzt mal ein paar Beispiele machen, wenn ich zum Beispiel den regulären

Ausdruck C, A, R mache, dann steht das für die Menge der Zeichenketten, die erst ein C haben,

dann ein A und dann ein R. Wenn ich aber Punkt A, T mache, dann haben wir ja gesehen auf der letzten

Slide, Punkt steht für beliebige Buchstaben, dann steht dieses hier für Cat, Hat, Mad, Rat,

was weiß ich, aber nicht die Zeichenkarte Anna oder Splat. Warum nicht Splat, das hört ja wunderbar

mit A, T auf, aber Spl entspricht nicht den Punkt. Punkt, Punkt, Punkt, A, T würde Splat mit reinnehmen.

Okay, das heißt, im Wesentlichen ist es so bei regulären Ausdrücken, normale Buchstaben stehen

für sich selber und Punkt steht für eine ganze Menge und wenn ich Buchstaben aneinanderreihe,

müssen sozusagen die einzelnen Dinger aneinandergereiht funktionieren. Hier habe

ich also einen Punkt, der für beliebige Buchstaben steht. Ich möchte als nächstes Beispiel,

wir wissen, was Cat macht, das steht für den String Cat. Wenn ich diesen vertikalen Strich

mache, dann heißt das einfach nur oder. Cat steht für Cat, Dog steht für Dog, Cat or Dog,

lesen wir das, steht für zwei Strings, nämlich den String Cat und den String Dog. Okay, hier ist der

Operator, der steht für oder Disjunktion. Was können wir noch machen? Wenn wir, was habe ich

für Beispiele? Richtig, ja, wir haben die eckigen Klammern, die haben auch eine Sonderbedeutung.

Die eckigen Klammern sagen gerade, da kann ich, in den eckigen Klammern kann ich Buchstaben rein

machen, dann heißt das einer von den Buchstaben, die da drin sind. Ein Buchstaben, jede Gruppe von

eckigen Klammern ist ein Buchstabe und es darf nur einer sein, der da drin ist. Wenn wir uns jetzt

zum Beispiel mal angucken, wenn wir, wenn uns dieses Punkt A-T-E, das ist noch zu promis, das hat viel

zu viele, das hat viel zu vieles Strings, ja, wenn wir wirklich nur Cat und Hat haben wollen,

dann sage ich, okay, wir wollen hier einen Buchstaben haben, das kann ein H sein oder das

kann ein C sein. Okay, das heißt, ich kriege hier nur Cat und Hat. Oder aber hier angenommen,

ich will irgendwie ein Zeichen haben, was eine Ziffer ist, dann kann ich sagen, okay, ich mache

meine ein Buchstabige Gruppe und ich sage zwischen 0 bis 9, ja, dann gibt mir das die, dann gibt mir

das die einzelnen Ziffer, 0, 1, 2, 3, 4, bis 9. Ich kann die aber auch einander hängen. Angenommen,

ich sage, ich möchte als ersten Buchstaben der Zeichenkette einen 1 bis 9 haben, also eine Zahl,

eine Ziffer, die keine 0 ist und dann hinterher will ich eine 0 bis 9, also eine beliebige

Ziffer haben und dann habe ich den Sternoperator. Der Sternoperator ist etwas, der sagt, den

Zugänglich über

Offener Zugang

Dauer

01:20:17 Min

Aufnahmedatum

2020-12-17

Hochgeladen am

2020-12-17 19:38:39

Sprache

de-DE

Einbetten
Wordpress FAU Plugin
iFrame
Teilen