Digitalisation has made extensive text and data resources increasingly available. The project is rising to address the challenge of efficiently incorporating these digitised resources in the humanities. To maximize the benefits of digitalisation and efficiently use these resources, the academic community requires innovative processes that permit automatic information extraction, and promote the subsequent generation of knowledge.

„Iterative Verfahrensschritte bei dem Einsatz von Text und Data Mining in den Geisteswissenschaften“ von Katharina Erler-Fridgen und Prof. Dr. Benjamin Raue, CC BY-SA 4.0.
„Iterative process steps in the use of text and data mining in the humanities" by Katharina Erler-Fridgen and Prof. Dr. Benjamin Raue CC BY-SA 4.0.

Against this background, the MiMoText project deals with the automatic extraction, structuring and networking of specialist information from text and data collections, as well as the use of such information networks to answer questions in the humanities. The first application of this project is in the context of the history of German and French literature, but the transferability of the methods to other disciplines has been intended from the project’s outset. MiMoText takes into account different types of texts, from lightly structured texts (e.g. bibliographical indexes) to non-fiction texts in the humanities (e.g. literature history) to literary texts (e.g. novels).

As as central goal, interdisciplinary solutions that combine conceptual, humanities-focused, informatics, legal and infrastructural questions and procedures are developed.

„Intertwining of jurisprudential subject areas in the use of text and data mining in the humanities " by Katharina Erler-Fridgen, CC BY-SA 4.0.

Legal Handouts

Within the framework of the legal support for the project, legal topics are identified that arise in the context of the project. These are then prepared in abstract form in the form of handouts. The handouts are published in the IRDT’s PAPERSERIES and aim, among other things, to present the legal framework for the use of text and data mining in the humanities beyond the context of the project.

  • Datenschutz bei den Digital Humanities – ein Überblick

    Der Datenschutz in Europa hat zwei Schutzziele, zum einen den Schutz der Privatsphäre und zum anderen den weitereichenden Schutz des allgemeinen Persönlichkeitsrechts. Dabei leitet das BVerfG den grundrechtlichen Schutz aus Art. 1 und 2 GG ab: „Recht auf informationelle Selbstbestimmung“. [...]

  • Die internationale Anwendbarkeit des (deutschen) Urheberrechts

    Urheberrechtlich geschützte Gegenstände sind immateriell. Sie können damit auf der Welt gleichzeitig genutzt werden. Daraus leitet sich bei grenzüberschreitenden Sachverhalten die Frage ab, welches Recht anzuwenden ist. Aus diesen Gründen erläutert die Handreichung im Folgenden in Grundzügen, welches Urheberrecht auf grenzüberschreitendes Forschen, Publizieren und Präsentieren anwendbar ist. [...]

  • Open Access in der Wissenschaft und im Urheberrecht sowie verwandte Schutzrechte

    Digitaler Wandel ist auch bei der Veröffentlichung wissenschaftlicher Aufsätze allgegenwärtig. Neben der körperlichen Zeitschrift bieten digitale Datenbänke und das Internet potenziell Zugang zu allem Wissen. Allerdings gilt das Urheberrecht unabhängig vom Medium. Es ist also auch auf internetbasierte Zugänge und Verwertungen anwendbar. Dadurch schränkt das Urheberrecht die Verbreitung des Wissens ein. [...]

  • Kollektive Lizenzen mit erweiterter Wirkung

    Die Forschung in den Digital Humanities ist zunehmend daran interessiert, Forschungsfragen auf der Grundlage umfassender, relevanter Datensätze zu bearbeiten. Nur dies erlaubt es, Muster und Verteilungen von Phänomenen oder auch Entwicklungen von Phänomenen über die Zeit auf der Ebene größerer historischer, literarischer oder künstlerischer Teilsysteme zu betrachten, statt wie bislang häufig der Fall nur anhand ausgewählter, als repräsentativ gesetzter Beispiele. [...]

  • Vertragsrechtliche Lösungen

    Das Urhebervertragsrecht befasst sich mit dem Verhältnis des Urhebers und dem in die Verwertung seines Werks einbezogenen Dritten. In den seltensten Fällen verwerten Urheber heutzutage ihre Rechte selbst. Vielmehr erledigen das die Verwertungsunternehmen für die Schaffenden. Das Urheberrecht und einige Leistungsschutzrechte sind grundsätzlich unübertragbar (vgl. § 29 I UrhG), sodass die Rechteverschaffung in Form von Lizenzen erfolgt. Verträge, die darauf ausgerichtet sind, Nutzungsrechte (also Lizenzen) einzuräumen, werden als Lizenzverträge bezeichnet. [...]

  • Die Wissenschaftsschranke in den Digital Humanities

    Die Wissenschaftsschranke in § 60c UrhG ermöglicht es, für die Zwecke der nicht kommerziellen wissenschaftlichen Forschung Teile eines urheberrechtlich geschützten Schutzgegenstands zu vervielfältigen und gegebenenfalls zu verbreiten und öffentlich zugänglich zu machen. Sie dient der Freiheit der wissenschaftlichen Forschung und soll neue, digitale Arbeitsmittel und -methoden in der Wissenschaft unterstützen[...]

  • Das Zitat und dessen Rahmen für Belege bei Textanalysen

    Werden Ergebnisse von Textanalysen präsentiert, können Texte oder Textteile als Beleg für deren Qualität oder zur Überprüfung der Plausibilität hilfreich sein. Neben dem Rahmen der Text und Data Mining-Schranken für Vervielfältigungen im Verlauf der Textanalyse bietet das Zitatrecht einen Freiraum für die geistige Auseinandersetzung mit urheberrechtlich geschützten Texten und Textteilen. Im Folgenden soll die Schranke der Zitierfreiheit nach § 51 UrhG und deren Voraussetzungen erläutert werden. [...]

  • Die Text und Data Mining-Schranken und ihr Rahmen für Textanalysen in den Digital Humanities

    Werden Informationen aus urheberrechtlich geschützten Texten extrahiert und zu diesem Zweck Quellen, beispielsweise aus Datenbanken, gesammelt, aufbereitet und die Ergebnisse der Textanalyse sowie die Ausgangstexte schließlich aufbewahrt, so werden Vervielfältigungshandlungen oder Entnahmen vorgenommen, die einer urheberrechtlichen Gestattung bedürfen. Die Text und Data Mining-Schranken in § 44b UrhG und § 60d UrhG schaffen hierfür einen Rahmen, der im Folgenden erläutert werden soll. [...]

  • Verfahrensschritte bei dem Einsatz von Text und Data Mining-Verfahren in den Geisteswissenschaften

    Werden urheberrechtlich geschützte Texte mit Hilfe von Text und Data Mining Verfahren analysiert, unterliegen die vorgenommenen Handlungen grundsätzlich urheberrechtlichen Restriktionen. Denn werden Vervielfältigungen oder Entnahmen aus Datenbanken vorgenommen oder der Analyse zugrundeliegende Text(teil)e präsentiert, können die Verwertungsrechte des Urhebers beeinträchtigt werden. [...]

  • Datenbanken als Quelle oder Ergebnis von Textanalysen

    Werden Texte gesammelt und Informationen extrahiert und zusammengeführt, so gewinnt der Schutz von Datenbanken in zweierlei Weise an Bedeutung: Zum einen kann die Entnahme von Material aus Datenbanken urheberrechtlichen Restriktionen unterliegen, wenn Datenbanken etwa als Quelle für Textanalysen genutzt werden. [...]

Project presentation

In 2021, the Projekt MiMoText was selected to be presented at the virtual annual conference of the Digital Humanities in the German-speaking world (vDHd2021), which had the overarching theme of “Experiments”. In six stations, insights into the MiMoText project were provided in an interactive, virtual format on 24.03.2021.

As an introduction to the project presentation, the individual sub-projects were presented by the respective project leaders in six videos. On the one hand, these impulse videos were intended to introduce the sub-projects and, on the other hand, to facilitate the entry into the dialogue in the virtual space with its project stations. In the videos, the sub-projects “bibliography”, “corpus of novels”, “secondary literature”, “modelling”, “law” and “infrastructure” were presented in depth. Concrete examples and a project pilot were used to illustrate the sub-projects and their approaches. A virtual room (wonder.me) made it possible to implement a concept for discussions at six flexibly changeable stations. This created a realistic and interactive communication platform.

The law sub-project and the mode of interdisciplinary cooperation with the digital humanities were presented at Station 5. The impulse video first explained the mode of interdisciplinary cooperation along the iterative procedural steps in the use of text and data mining in the humanities. Then the example of the use of scientific editions in text analyses was discussed and the ancillary copyright according to § 70 Coryright Act (UrhG). In this way, it was made clear how legal topics are identified from the ongoing project work that are also relevant for the digital humanities beyond the project context.

The IRDT contributes its legal expertise to the project. Prof. Dr. Raue and Frau Erler-Fridgen from the Institute are involved in the project.

Other projects at IRDT.

INWEND

Intelligent knowledge-based decision support

Publication series digital | recht

Publications by means of Diamond Open Access

Tech & Literature

Reviews of books related to digitisation