MHDBDB: Mittelhochdeutsche Literatur auf Knopfdruck

---

Über die MHDBDB

Die Mittelhochdeutsche Begriffsdatenbank, kurz MHDBDB, ist in ihrer Art eine einzigartige Datenbank. Sie ermöglicht den Zugriff auf die wichtigsten Werke der mittelhochdeutschen Dichtung von den verschiedensten Blickwinkeln aus über eine äußerst vielseitige Suchfunktionalität. Der Benutzer kann nicht nur in einem einzigen System nach Wörtern, Zeichenketten und Begriffen aus verschiedenen Quellen suchen, sondern auch so gut wie jede linguistische oder semantische Fragestellung an die Textbasis auswerten. Damit ist die MHDBDB leistungsfähiger als jedes noch so umfangreiche Wörterbuch.

Weiters bietet die Datenbank die Möglichkeit, nach komplexeren Wort- oder Begriffskombinationen zu suchen, also nach gleichzeitigem Vorkommen (Kookurrenz) von verschiedenen Wörtern oder Begriffen in einem gegebenen Kontextrahmen. Zum Beispiel kann man nicht nur nach dem gleichzeitigen Auftauchen der Wörter swert und künec suchen, sondern auch nach dem gleichzeitigen Auftauchen von Begriffskategorien, wie z.B. Waffen und Geburtsadel; das Ergebnis dieser Suche schließt also das Ergebnis des obigen Wortsuche-Beispiels ein und ermöglicht damit einen umfassenderen Überblick über das Motivmaterial. Diese Suchfunktionen eröffnen damit ganz neue Einblicke in die komplexe Motivstruktur einzelner Werke oder des Gesamtkorpus, und gestatten einen umfassenderen Zugriff auf die darin enthaltenen kulturellen Informationen.

Die zwei wichtigsten Module der MHDBDB sind der Wortindex mit Begriffen und die Textsuche nach Belegstellen.

 

Genesis

Die MHDBDB ist das Ergebnis der engen Zusammenarbeit zweier Langzeitprojekte, die sich 1992 zusammengeschlossen haben:

  • Namen in deutschen literarischen Texten des Mittelalters von Dr. Horst P. Pütz, Christian-Albrechts-Universität zu Kiel
  • Begriffswörterbuch der mittelhochdeutschen Literatur, Prof. Dr. Klaus M. Schmidt, Bowling Green State University

Im Mai 1995 wurde dann anlässlich des International Congress on Medieval Studies der University of Michigan in Kalamazoo ein weltweites Informationsabrufsystem über das Internet eröffnet. Damit entstand ein leistungsfähiges Informationssystem zur mittelhochdeutschen Sprache und Literatur, dem bislang kein ähnlich umfangreiches Projekt in anderen mittelalterlichen Sprachen gegenüber steht.

Im Herbst 1998 wurde dieses System auf eine relationale Datenbank von ORACLE übertragen und eine neue Benutzeroberfläche auf der Basis von Web-Seiten erstellt.

Seit 2002 ist die MHDBDB an der Paris Lodron-Universität Salzburg installiert, von wo aus das Projekt verwaltet und betreut wird.

Seit 2006 ist die MHDBDB mit den Mittelhochdeutschen Wörterbüchern im Verbund (Wörterbuchnetz) der Universität Trier verlinkt.

Seit Herbst 2015 steht der MHDBDB ein Wissenschaftlicher Beirat zur Seite.

Seit Sommer 2016 ist die MHDBDB mittels Schenkung in das Eigentum der Universität Salzburg übergegangen und wurde an das Interdisziplinäre Zentrum für Mittelalter und Frühneuzeit (IZMF) angegliedert.

Im Dezember 2016 startete der Relaunch der MHDBDB, der auf zwei Jahre konzipiert ist.

 

Zitierempfehlung

Mittelhochdeutsche Begriffsdatenbank (MHDBDB). Universität Salzburg. Koordination: Margarete Springeth. Technische Leitung: Nikolaus Morocutti/Daniel Schlager. 1992-2017. URL: http://www.mhdbdb.sbg.ac.at/ (Abrufdatum).

 

Umfang des Archivs

Klicken Sie hier, um die Seite mit Statistiken über das Textarchiv aufzurufen.

Fernziel ist es, die Textbasis weiter auszubauen und diese vollständig zu lemmatisieren und zu disambiguieren (d.h. nach Bedeutungskategorien aufzuschlüsseln, ähnlich wie in Roget’s Thesaurus), um die komplexe Suchmaschine MHDBDB für Forschung und Lehre noch besser nutzbar zu machen.

 

Relaunch der MHDBDB

Am 1. Dezember 2016 startete der Relaunch der Mittelhochdeutschen Begriffsdatenbank (MHDBDB). In den kommenden zwei Jahren wird die Datenbank einem Redesign und einer Migration unterzogen. Zukünftig soll noch mehr Wert gelegt werden auf offene Systemstellen und die bisher schon essenzielle Open Access-Policy weiter vorangetrieben werden (Downloadbarkeit urheberrechtlich unproblematischer Texte und großzügige Datenauszüge ebenso wie eine öffentlich zugängliche IT-Dokumentation).
Die vorhandenen Texte werden in das XML-TEI-Format konvertiert. TEI (Text Encoding Initiative) stellt heute einen de facto-Standard in den Geisteswissenschaften dar und wird zur Kodierung und Auszeichnung von Texten verwendet.
Weiters wird die Oberfläche komplett überarbeitet und auf den neuesten Stand der Technik und Usability gebracht. So kann die MHDBDB danach auch auf mobilen Geräten wie Tablets oder Smartphones genutzt werden.
Eine neue Abfragesprache wird komplexe Recherchen ermöglichen, ebenso die Verknüpfung mit externen Datenquellen (z.B. des Semantic Webs wie LOD) und auch den Export der Daten in die unterschiedlichsten Formate wie z.B. PDF, TEI, LaTeX, XLS oder Graphen (zur weiteren Verarbeitung z.B. mit Gephi).

Neue Tools, die dabei entstehen sollen, sind u.a.: Synonym-, Komposita- und Reimwörterbücher des Mittelhochdeutschen, die Abfrage eines autor- und textspezifischen Wortschatzes (Hapaxlegomena), Visualisierungsanwendungen, eine NutzerInnen-spezifische Oberfläche mit Speichermöglichkeit („myMHDBDB“), sowie ein automatischer Disambiguierer, der Mehrdeutigkeit von Wörtern auflösen können wird.

Zudem wird das Begriffssystem der MHDBDB auf der Basis von Ontologien überarbeitet. Dabei werden die (meisten) bestehenden hierarchischen Relationen der Categories (Begriffsfelder) beibehalten, jedoch um zahlreiche weitere (Poly-)Hierarchien sowie standardisierte Tags erweitert und außerdem ein Netzwerk von Äquivalenzrelationen über den Wortbestand gelegt, vergleichbar mit dem nhd. Wortmaterial im lexikalisch-semantischen Netz von GermaNet. Assoziationsrelationen, die an die Vorgehensweise bekannter Onlineshops erinnern („Kunden, die sich für dieses Buch interessierten, kauften auch…“), sind ebenfalls in Arbeit.

Vom Institut für Literaturwissenschaft sowie dem Institut für Maschinelle Sprachverarbeitung an der Universität Stuttgart konnte bereits auf Basis der Texte und des Wortindexes der MHDBDB eine Trainingsdatei für einen Tree-Tagger erstellt werden. Das Trainingskorpus enthält etwa 10 Millionen tokens und repräsentiert unterschiedliche Gattungen, Epochen und Dialekte. Dieser Tree-Tagger ist nun Basis für die weitere Entwicklung des automatischen Disambiguierers der MHDBDB im Zuge des Relaunches. Details s. http://www.ims.uni-stuttgart.de/forschung/ressourcen/werkzeuge/PoS_Tag_MHG.html  (Koordination Stuttgart: Prof.Dr. Manuel Braun und Dr. Nils Reiter)

Der Relaunch der MHDBDB erfolgt unter der Leitung von: Daniel Schlager (MHDBDB-Team Salzburg).

Fragen zum Relaunch können Sie direkt stellen an daniel.schlager@sbg.ac.at

Wir halten Sie über den Fortschritt auf dem Laufenden.

---

 

MHDBDB-Team

Universität Salzburg

Externe Mitwirkende

 

Ehemalige Mitwirkende (in alphabetischer Reihenfolge)

  • Maike Ahrends, Barbara Aitenbichler, Claudia Becker, Wolfgang Boepple, Claudia Bornholdt, Michael Brachtl, Katrin Callsen, Christof Danzl, Werner Dietl, Andrea Dietrich, Alfred Ebenbauer, Jim Ecker, Annemarie Eder,Harald Feiel, Bente Gebhardt, Susanne Gehrke, Camilla Groth, Bettina Hatheyer, Britta Jäkel, Barbara Kraus, Susanne Lang, Thomas Mahler, Anindo Majumdar, August Mayer, Peter Meerwald, Silvia Müller, Ulrich Müller, Charles Osborne, Horst P. Pütz, Judith Pouget, Anne Rahmlow, Ron Reazin, Martin Schubert, Leevke Schiwek, Svenja Schulz, Rudolf Schürer, Barbara Siebert, W. Maurice Sprague, Joachim Steinwendner, Joe Uffner, Verena Vitzthum, Tanja Vogl, Ruth Weichselbaumer, Michael Westreicher, Katrin Woesner

 

Kontakt

 

Zurück zum Inhalt

 

 

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken