Ja
herzlich willkommen in unserem
Forschungsdatenmanagement entschieden für die Verzögerung.
Aber jetzt kann es losgehen.
Ich freue mich auf
Burak Toplas.
Er arbeitet beim HITZ.
Wir hatten das HITZ ja auch schon vor ein paar Wochen schon mal hier.
Heute stellt er jetzt einen Aspekt seines Forschungsprojekts vor und zwar es geht hier in die Richtung
automatische Generierung von Metadaten mit Hilfe von Large Language Models.
Herzlich willkommen Burak Toplas.
Hallo zusammen.
Ich freue mich sehr, heute im Rahmen des HMK-Kolokiums meinen Paper-Proschnern zu gründen.
Wie Herr Lenchow gesagt hat
ich bin Wissenschaftsmitarbeiter an der TUH und kommuniziere nebenbei an der FHU im Bereich des Forschungsdatenmanagements.
Der tiefenmeister Vortrag heute lautet Towards Gen.I-based Metadata Generation.
In diesem Vortrag geht es heute um die konzentrationelle Entwicklung eines Metadatenmodells,
das als Grundlage für Gen.I-basierte Metadatengenerierung gehen soll.
Dabei stehen Large Language Models im Mittelpunkt
die zukünftig Metadaten aus wissenschaftlichen Publikationen
extrahieren sollen oder können.
Bevor ich einsteige, möchte ich einen kurzen Überblick über die Strukturmeinsportrages geben.
Wir beginnen mit der Einleitung wie in den Papern
in der ich den Hintergrund und die Zielsetzung wie sowie die Problemstellung stichle.
Anschließend gebe ich ein paar Informationen zum Hintergrund
damit man nachvollziehen kann
wie das Modell entwickelt und abgeleitet wurde.
Dann präsentiere ich das Forschungsdesign
wie das Metadatenmodell erstellt wurde
auch die Reproduzierbarkeit.
Und im Anschluss kommen die Ergebnisse und abschließend die Conclusion.
Zu der Motivation.
Metadaten sind der Schlüssel, um Forschungsdaten fair zu machen, also findable, accessible, interoperable und reusable.
Ohne ausreichend Metadaten verliert ein Datensatz schnell an wissenschaftlichen Wert.
Also man kann ihn schwieriger interpretieren
einordnen oder auch schwieriger wiederverwenden
was großzuletzt ist.
Und dadurch steht man hier vor einer sogenannten Metadata-Dilemma.
Also Metadaten sind zwar kollektiv wichtig
aber individuell aufwendig und bringen den einzelnen Forscher oft keinen direkten Nutzen.
Deshalb dokumentieren viele Forscher nur das nötigste
wie zum Beispiel Titel
Description
den Autor
also generische Informationen
die sie zum Beispiel auch im Datenhikroar abgewickelt sind.
Dadurch gehen jedoch wertvolle kontextuelle Informationen verloren, beispielsweise z.B.
die methodischen Vorgehensweisen, wie die Daten erhoben wurden oder mit den Geräten oder zum Beispiel auch zum Datenergieungsumfeld.
Und gerade diese Informationen wären wichtig für die Reusability
also das R im Fair.
Presenters
Zugänglich über
Offener Zugang, StudOn-Zugang
Dauer
00:35:15 Min
Aufnahmedatum
2025-12-12
Hochgeladen am
2025-12-12 16:50:12
Sprache
de-DE