4 - Towards GenAI based Metadata Generation [ID:61049]
50 von 562 angezeigt

Ja

herzlich willkommen in unserem

Forschungsdatenmanagement entschieden für die Verzögerung.

Aber jetzt kann es losgehen.

Ich freue mich auf

Burak Toplas.

Er arbeitet beim HITZ.

Wir hatten das HITZ ja auch schon vor ein paar Wochen schon mal hier.

Heute stellt er jetzt einen Aspekt seines Forschungsprojekts vor und zwar es geht hier in die Richtung

automatische Generierung von Metadaten mit Hilfe von Large Language Models.

Herzlich willkommen Burak Toplas.

Hallo zusammen.

Ich freue mich sehr, heute im Rahmen des HMK-Kolokiums meinen Paper-Proschnern zu gründen.

Wie Herr Lenchow gesagt hat

ich bin Wissenschaftsmitarbeiter an der TUH und kommuniziere nebenbei an der FHU im Bereich des Forschungsdatenmanagements.

Der tiefenmeister Vortrag heute lautet Towards Gen.I-based Metadata Generation.

In diesem Vortrag geht es heute um die konzentrationelle Entwicklung eines Metadatenmodells,

das als Grundlage für Gen.I-basierte Metadatengenerierung gehen soll.

Dabei stehen Large Language Models im Mittelpunkt

die zukünftig Metadaten aus wissenschaftlichen Publikationen

extrahieren sollen oder können.

Bevor ich einsteige, möchte ich einen kurzen Überblick über die Strukturmeinsportrages geben.

Wir beginnen mit der Einleitung wie in den Papern

in der ich den Hintergrund und die Zielsetzung wie sowie die Problemstellung stichle.

Anschließend gebe ich ein paar Informationen zum Hintergrund

damit man nachvollziehen kann

wie das Modell entwickelt und abgeleitet wurde.

Dann präsentiere ich das Forschungsdesign

wie das Metadatenmodell erstellt wurde

auch die Reproduzierbarkeit.

Und im Anschluss kommen die Ergebnisse und abschließend die Conclusion.

Zu der Motivation.

Metadaten sind der Schlüssel, um Forschungsdaten fair zu machen, also findable, accessible, interoperable und reusable.

Ohne ausreichend Metadaten verliert ein Datensatz schnell an wissenschaftlichen Wert.

Also man kann ihn schwieriger interpretieren

einordnen oder auch schwieriger wiederverwenden

was großzuletzt ist.

Und dadurch steht man hier vor einer sogenannten Metadata-Dilemma.

Also Metadaten sind zwar kollektiv wichtig

aber individuell aufwendig und bringen den einzelnen Forscher oft keinen direkten Nutzen.

Deshalb dokumentieren viele Forscher nur das nötigste

wie zum Beispiel Titel

Description

den Autor

also generische Informationen

die sie zum Beispiel auch im Datenhikroar abgewickelt sind.

Dadurch gehen jedoch wertvolle kontextuelle Informationen verloren, beispielsweise z.B.

die methodischen Vorgehensweisen, wie die Daten erhoben wurden oder mit den Geräten oder zum Beispiel auch zum Datenergieungsumfeld.

Und gerade diese Informationen wären wichtig für die Reusability

also das R im Fair.

Zugänglich über

Offener Zugang, StudOn-Zugang

Dauer

00:35:15 Min

Aufnahmedatum

2025-12-12

Hochgeladen am

2025-12-12 16:50:12

Sprache

de-DE

Burak Toptas
Einbetten
Wordpress FAU Plugin
iFrame
Teilen