MiMoText - IRDT

Durch die Digitalisierung werden zunehmend umfangreiche Text- und Datenbestände verfügbar. Das Projekt stellt sich der Herausforderung, dass es für deren effiziente Nutzung in den Geisteswissenschaften notwendig ist, innovative Verfahren zu entwickeln, welche die automatische Informationsextraktion erlauben und die darauf aufbauende Wissensgenerierung befördern.

„Iterative Verfahrensschritte bei dem Einsatz von Text und Data Mining in den Geisteswissenschaften“ von Katharina Erler-Fridgen und Prof. Dr. Benjamin Raue, CC BY-SA 4.0.

Das Vorhaben befasst sich mit der automatischen Extraktion, Strukturierung und Vernetzung von Fachinformationen aus Text- und Datensammlungen. Außerdem wird die Nutzung solcher Informationsnetzwerke für die Beantwortung geisteswissenschaftlicher Fragestellungen behandelt. Erster Anwendungskontext ist die deutsche und französische Literaturgeschichte. Die Übertragbarkeit der Verfahren auf andere Disziplinen wird aber von Anfang an mitgedacht. Das Projekt berücksichtigt unterschiedliche Arten von Texten: von leicht strukturierten Texten (bspw. bibliografische Verzeichnisse) über geisteswissenschaftliche Sachtexte (bspw. literaturgeschichtliche Fachliteratur) bis hin zu literarischen Texten (bspw. Romane).

Als Kernanliegen werden interdisziplinäre Lösungsansätze entwickelt, wobei konzeptuelle, geisteswissenschaftliche, informatische, rechtliche und infrastrukturelle Fragestellungen und Verfahren ineinandergreifen.

„Ineinandergreifen rechtswissenschaftlicher Themenfelder beim Einsatz von Text und Data Mining in den Geisteswissenschaften“ von Katharina Erler-Fridgen, CC BY-SA 4.0.

Rechtswissenschaftliche Handreichungen

Im Rahmen der rechtswissenschaftlichen Begleitung des Projekts werden rechtliche Themenfelder identifiziert, die im Projektkontext exemplarisch auftauchen. Diese werden dann in Form von Handreichungen abstrahiert aufbereitet. Die verfassten Handreichungen erscheinen in der PAPERSERIES des IRDT. Sie machen es sich u.a. zum Ziel, rechtliche Rahmenbedingungen beim Einsatz von Text und Data Mining in den Geisteswissenschaften über den Projektkontext hinaus darzustellen.

Datenschutz bei den Digital Humanities – ein Überblick
Der Datenschutz in Europa hat zwei Schutzziele, zum einen den Schutz der Privatsphäre und zum anderen den weitereichenden Schutz des allgemeinen Persönlichkeitsrechts. Dabei leitet das BVerfG den grundrechtlichen Schutz aus Art. 1 und 2 GG ab: „Recht auf informationelle Selbstbestimmung“. [...]
Die internationale Anwendbarkeit des (deutschen) Urheberrechts
Urheberrechtlich geschützte Gegenstände sind immateriell. Sie können damit auf der Welt gleichzeitig genutzt werden. Daraus leitet sich bei grenzüberschreitenden Sachverhalten die Frage ab, welches Recht anzuwenden ist. Aus diesen Gründen erläutert die Handreichung im Folgenden in Grundzügen, welches Urheberrecht auf grenzüberschreitendes Forschen, Publizieren und Präsentieren anwendbar ist. [...]
Open Access in der Wissenschaft und im Urheberrecht sowie verwandte Schutzrechte
Digitaler Wandel ist auch bei der Veröffentlichung wissenschaftlicher Aufsätze allgegenwärtig. Neben der körperlichen Zeitschrift bieten digitale Datenbänke und das Internet potenziell Zugang zu allem Wissen. Allerdings gilt das Urheberrecht unabhängig vom Medium. Es ist also auch auf internetbasierte Zugänge und Verwertungen anwendbar. Dadurch schränkt das Urheberrecht die Verbreitung des Wissens ein. [...]
Kollektive Lizenzen mit erweiterter Wirkung
Die Forschung in den Digital Humanities ist zunehmend daran interessiert, Forschungsfragen auf der Grundlage umfassender, relevanter Datensätze zu bearbeiten. Nur dies erlaubt es, Muster und Verteilungen von Phänomenen oder auch Entwicklungen von Phänomenen über die Zeit auf der Ebene größerer historischer, literarischer oder künstlerischer Teilsysteme zu betrachten, statt wie bislang häufig der Fall nur anhand ausgewählter, als repräsentativ gesetzter Beispiele. [...]
Vertragsrechtliche Lösungen
Das Urhebervertragsrecht befasst sich mit dem Verhältnis des Urhebers und dem in die Verwertung seines Werks einbezogenen Dritten. In den seltensten Fällen verwerten Urheber heutzutage ihre Rechte selbst. Vielmehr erledigen das die Verwertungsunternehmen für die Schaffenden. Das Urheberrecht und einige Leistungsschutzrechte sind grundsätzlich unübertragbar (vgl. § 29 I UrhG), sodass die Rechteverschaffung in Form von Lizenzen erfolgt. Verträge, die darauf ausgerichtet sind, Nutzungsrechte (also Lizenzen) einzuräumen, werden als Lizenzverträge bezeichnet. [...]
Die Wissenschaftsschranke in den Digital Humanities
Die Wissenschaftsschranke in § 60c UrhG ermöglicht es, für die Zwecke der nicht kommerziellen wissenschaftlichen Forschung Teile eines urheberrechtlich geschützten Schutzgegenstands zu vervielfältigen und gegebenenfalls zu verbreiten und öffentlich zugänglich zu machen. Sie dient der Freiheit der wissenschaftlichen Forschung und soll neue, digitale Arbeitsmittel und -methoden in der Wissenschaft unterstützen[...]
Das Zitat und dessen Rahmen für Belege bei Textanalysen
Werden Ergebnisse von Textanalysen präsentiert, können Texte oder Textteile als Beleg für deren Qualität oder zur Überprüfung der Plausibilität hilfreich sein. Neben dem Rahmen der Text und Data Mining-Schranken für Vervielfältigungen im Verlauf der Textanalyse bietet das Zitatrecht einen Freiraum für die geistige Auseinandersetzung mit urheberrechtlich geschützten Texten und Textteilen. Im Folgenden soll die Schranke der Zitierfreiheit nach § 51 UrhG und deren Voraussetzungen erläutert werden. [...]
Die Text und Data Mining-Schranken und ihr Rahmen für Textanalysen in den Digital Humanities
Werden Informationen aus urheberrechtlich geschützten Texten extrahiert und zu diesem Zweck Quellen, beispielsweise aus Datenbanken, gesammelt, aufbereitet und die Ergebnisse der Textanalyse sowie die Ausgangstexte schließlich aufbewahrt, so werden Vervielfältigungshandlungen oder Entnahmen vorgenommen, die einer urheberrechtlichen Gestattung bedürfen. Die Text und Data Mining-Schranken in § 44b UrhG und § 60d UrhG schaffen hierfür einen Rahmen, der im Folgenden erläutert werden soll. [...]
Verfahrensschritte bei dem Einsatz von Text und Data Mining-Verfahren in den Geisteswissenschaften
Werden urheberrechtlich geschützte Texte mit Hilfe von Text und Data Mining Verfahren analysiert, unterliegen die vorgenommenen Handlungen grundsätzlich urheberrechtlichen Restriktionen. Denn werden Vervielfältigungen oder Entnahmen aus Datenbanken vorgenommen oder der Analyse zugrundeliegende Text(teil)e präsentiert, können die Verwertungsrechte des Urhebers beeinträchtigt werden. [...]
Datenbanken als Quelle oder Ergebnis von Textanalysen
Werden Texte gesammelt und Informationen extrahiert und zusammengeführt, so gewinnt der Schutz von Datenbanken in zweierlei Weise an Bedeutung: Zum einen kann die Entnahme von Material aus Datenbanken urheberrechtlichen Restriktionen unterliegen, wenn Datenbanken etwa als Quelle für Textanalysen genutzt werden. [...]

12 Vor

Projektvorstellung

Das Projekt MiMoText wurde im Jahr 2021 ausgewählt, auf der virtuellen Jahrestagung der Digital Humanities im deutschsprachigen Raum (vDHd2021) vorgestellt zu werden, die unter dem übergeordneten Thema „Experimente“ stand. In sechs Stationen wurden am 24.03.2021 in einem interaktiven, virtuellen Format Einblicke in das Projekt MiMoText gegeben.

Als Einstieg für die Projektvorstellung wurden die einzelnen Teilprojekte von den jeweiligen Projektverantwortlichen in sechs Videos präsentiert. Diese Impulsvideos sollten einerseits der Vorstellung der Teilprojekte dienen und andererseits den Einstieg in den Dialog im virtuellen Raum mit seinen Projektstationen ermöglichen. Es wurden in den Videos die Teilbereiche „Bibliographie“, „Romankorpus“, „Sekundärliteratur“, „Modeling“, „Recht“ und „Infrastruktur“ vertieft dargestellt. Anhand von konkreten Beispielen und eines Projektpiloten wurden die Teilprojekte und deren Ansätze illustriert. Ein virtueller Raum (wonder.me) ermöglichte es, ein Konzept für Diskussionen an sechs flexibel wechselbaren Stationen umzusetzen. So wurde eine realitätsnahe und interaktive Kommunikationsplattform geschaffen.

Das Teilprojekt Recht sowie der Modus der interdisziplinären Zusammenarbeit mit den Digital Humanities wurde an Station 5 präsentiert. Im Impulsvideo wurde zunächst der Modus der interdisziplinären Zusammenarbeit entlang der iterativen Verfahrensschritte beim Einsatz von Text und Data Mining in den Geisteswissenschaften erläutert. Sodann wurde auf das Beispiel des Einsatzes wissenschaftlicher Ausgaben bei Textanalysen eingegangen und das Leistungsschutzrecht nach § 70 UrhG diskutiert. Auf diese Weise wurde verdeutlicht, wie aus den laufenden Projektarbeiten heraus rechtswissenschaftliche Themen identifiziert werden, die für die Digital Humanities auch über den Projektkontext hinaus relevant sind.

Unter dem Thema „Linked Open Data für die Literaturgeschichtsschreibung“ wurde das Projekt MiMoText und sein Stand in der Postersession auf der 8. Jahrestagung des Verbandes der Digital Humanities im deutschsprachigen Raum (DHd2022) präsentiert. Anknüpfend an das Generalthema („Kulturen des digitalen Gedächtnisses“) der Jahrestagung setzte das Projekt an die Potentiale systematischer Datenerschließung und Wissensrepräsentation für die Literaturgeschichtsschreibung an. Es wurde das Projektvorhaben präsentiert, ein literaturgeschichtliches Informationssystem aufzubauen. Dargestellt wurde, wie im Projekt quantitative Methoden der Informationsextraktion („Mining“) mit der Datenmodellierung („Modeling“) verbunden werden. Es steht im Vordergrund, Verfahren zur Extraktion und Modellierung geisteswissenschaftlich weiterführender Informationen interdisziplinär zu erforschen – also geistes-, informatik-, und rechtswissenschaftlich.

Das IRDT steuert seine rechtliche Expertise an dem Projekt bei. Vom Institut an dem Projekt beteiligt sind Prof. Dr. Raue und Frau Erler-Fridgen.

Andere Projekte am IRDT.

Zur Projektübersicht

INWEND

Intelligente wissensbasierte Entscheidungsunterstützung

Mehr erfahren

Schriftenreihe digital | recht

Schriften im Weg des Diamond Open Access

Mehr erfahren

Tech & Literature

Rezensionen zu Büchern mit Digitalisierungsbezug.

Mehr erfahren

Mining and Modeling Text

MiMoText.

Rechtswissenschaftliche Handreichungen

Datenschutz bei den Digital Humanities – ein Überblick

Die internationale Anwendbarkeit des (deutschen) Urheberrechts

Open Access in der Wissenschaft und im Urheberrecht sowie verwandte Schutzrechte

Kollektive Lizenzen mit erweiterter Wirkung

Vertragsrechtliche Lösungen

Die Wissenschaftsschranke in den Digital Humanities

Das Zitat und dessen Rahmen für Belege bei Textanalysen

Die Text und Data Mining-Schranken und ihr Rahmen für Textanalysen in den Digital Humanities

Verfahrensschritte bei dem Einsatz von Text und Data Mining-Verfahren in den Geisteswissenschaften

Datenbanken als Quelle oder Ergebnis von Textanalysen

Projektvorstellung

Andere Projekte am IRDT.

INWEND

Schriftenreihe digital | recht

Tech & Literature

Kontakt