Integration von Textsammlungen in die DTA-Infrastruktur an der BBAW. Eine Schritt-für-Schritt-Anleitung am Beispiel der »Digitalen Bibliothek«
Main Authors: | Matthias Boenig, Marius Hug |
---|---|
Format: | Report Journal |
Bahasa: | deu |
Terbitan: |
, 2021
|
Subjects: | |
Online Access: |
https://zenodo.org/record/5680455 |
Daftar Isi:
- English: Within the collaborative project CLARIAH-DE, the BBAW was involved in two working packages: 1) »Research data, standards and procedures«, 2) »Tools and virtual research environments«. The focus was on the evaluation and documentation of the German Text Archive’s base format (DTABf) as a pivot or exchange format for text collections (incl. editions), the homogenisation of large data sets using texts from the »Digital Library«, and the integration or making available of resources (data and services) within already existing infrastructures. This step-by-step manual describes the way the DiBiLit corpus was created by homogenising various derivatives of texts from the »Digital Library« and extensively enriching them with (bibliographic) metadata. The long-term availability of the resources (data and services) is ensured via the DTA infrastructure as part of the academy project DWDS at the BBAW. German: Im Verbundprojekt CLARIAH-DE war die BBAW an zwei Arbeitspaketen beteiligt: 1) »Forschungsdaten, Standards und Verfahren«, 2) »Werkzeuge und virtuelle Forschungsumgebungen«. Im Zentrum standen die Evaluierung und Dokumentation des Basisformats des Deutschen Textarchivs (DTABf) als Pivot- bzw. Austauschformat für Textsammlungen (inkl. Editionen), die Homogenisierung großer Datenbestände am Beispiel von Texten aus der »Digitalen Bibliothek« sowie die Integration bzw. Verfügbarmachung von Ressourcen (Daten und Dienste) innerhalb bereits bestehender Infrastrukturen. Diese Schritt-für-Schritt-Anleitung beschreibt, wie durch Homogenisierung verschiedener Derivate von Texten aus der »Digitalen Bibliothek« sowie die umfängliche Anreicherung durch (bibliographische) Metadaten das neue Korpus DiBiLit entstand. Die langfristige Verfügbarkeit der Ressourcen (Daten und Dienste) wird über die DTA-Infrastruktur als Bestandteil des Akademienvorhabens DWDS an der BBAW sichergestellt.