MHDBDB: Mittelhochdeutsche Literatur auf Knopfdruck

---

Über die MHDBDB

Die Mittelhochdeutsche Begriffsdatenbank, kurz MHDBDB, ist in ihrer Art eine einzigartige Datenbank. Sie ermöglicht den Zugriff auf die wichtigsten Werke der mittelhochdeutschen Dichtung von den verschiedensten Blickwinkeln aus über eine äußerst vielseitige Suchfunktionalität. Der Benutzer kann nicht nur in einem einzigen System nach Wörtern, Zeichenketten und Begriffen aus verschiedenen Quellen suchen, sondern auch so gut wie jede linguistische oder semantische Fragestellung an die Textbasis auswerten. Damit ist die MHDBDB leistungsfähiger als jedes noch so umfangreiche Wörterbuch.

Weiters bietet die Datenbank die Möglichkeit, nach komplexeren Wort- oder Begriffskombinationen zu suchen, also nach gleichzeitigem Vorkommen (Kookurrenz) von verschiedenen Wörtern oder Begriffen in einem gegebenen Kontextrahmen. Zum Beispiel kann man nicht nur nach dem gleichzeitigen Auftauchen der Wörter swert und künec suchen, sondern auch nach dem gleichzeitigen Auftauchen von Begriffskategorien, wie z.B. Waffen und Geburtsadel; das Ergebnis dieser Suche schließt also das Ergebnis des obigen Wortsuche-Beispiels ein und ermöglicht damit einen umfassenderen Überblick über das Motivmaterial. Diese Suchfunktionen eröffnen damit ganz neue Einblicke in die komplexe Motivstruktur einzelner Werke oder des Gesamtkorpus, und gestatten einen umfassenderen Zugriff auf die darin enthaltenen kulturellen Informationen.

Die zwei wichtigsten Module der MHDBDB sind der Wortindex mit Begriffen und die Textsuche nach Belegstellen.

Genesis

1972: Prof. Dr. Klaus M. Schmidt, promoviert mit seinen Vorarbeiten zum Begriffswörterbuch der mittelhochdeutschen Literatur, einer Dissertation zur computergestützten Analyse des Wortmaterials Ulrichs von Liechtenstein (daher auch das Logo der MHDBDB: die Helmzier Ulrichs im Codex Manesse). Zum damaligen Zeitpunkt erfolgten die Annotationen noch mit alten Fortran-Lochkarten.

1992: Zwei Langzeitprojekte schließen sich unter dem Namen “Mittelhochdeutsche Begriffsdatenbank” (MHDBDB) zusammen:

  • Namen in deutschen literarischen Texten des Mittelalters von Dr. Horst P. Pütz, Christian-Albrechts-Universität zu Kiel
  • Begriffswörterbuch der mittelhochdeutschen Literatur, Prof. Dr. Klaus M. Schmidt, Bowling Green State University

1995: Im Mai 1995 wird anlässlich des International Congress on Medieval Studies der University of Michigan in Kalamazoo ein weltweites Informationsabrufsystem über das Internet eröffnet. Damit entsteht ein leistungsfähiges Informationssystem zur mittelhochdeutschen Sprache und Literatur, dem bislang kein ähnlich umfangreiches Projekt in anderen mittelalterlichen Sprachen gegenüber steht.

1998: Im Herbst 1998 wird dieses System auf eine relationale Datenbank von ORACLE übertragen und eine neue Benutzeroberfläche auf der Basis von Web-Seiten erstellt.

2004: Seit 2004 ist die MHDBDB an der Paris Lodron-Universität Salzburg installiert, von wo aus das Projekt verwaltet und betreut wird.

Von 2004-2016 erhielt die MHDBDB externes Sponsoring für die Systembetreuung der Datenbank von der Universität Wien.

Seit 2006 ist die MHDBDB mit den Mittelhochdeutschen Wörterbüchern im Verbund (Wörterbuchnetz) der Universität Trier verlinkt.

Seit Herbst 2015 steht der MHDBDB ein Wissenschaftlicher Beirat zur Seite.

2016: Im Sommer 2016 geht die MHDBDB mittels Schenkung in das Eigentum der Universität Salzburg über und wird an das Interdisziplinäre Zentrum für Mittelalter und Frühneuzeit (IZMF) angegliedert.

2017: Im Frühjahr startet der Relaunch der MHDBDB, der zunächst auf drei Jahre konzipiert war. Aufgrund personeller und finanzieller Einschränkungen ist die verschobene Deadline für das Rollout nun Mitte des Jahres 2022.

Zitierempfehlung

Mittelhochdeutsche Begriffsdatenbank (MHDBDB). Universität Salzburg. Interdisziplinäres Zentrum für Mittelalter und Frühneuzeit (IZMF). Koordination: Katharina Zeppezauer-Wachauer. 1972-2022 (laufend). URL: http://www.mhdbdb.sbg.ac.at/ (Abrufdatum).

Umfang des Archivs

Klicken Sie hier, um die Seite mit Statistiken über das Textarchiv aufzurufen.

Fernziel ist es, die Textbasis weiter auszubauen und diese vollständig zu lemmatisieren und zu disambiguieren (d.h. nach Bedeutungskategorien aufzuschlüsseln, ähnlich wie in Roget’s Thesaurus), um die komplexe Suchmaschine MHDBDB für Forschung und Lehre noch besser nutzbar zu machen.

Relaunch der MHDBDB

Im Frühjahr 2017 startete der Relaunch der Mittelhochdeutschen Begriffsdatenbank (MHDBDB). In den kommenden Jahren wird die Datenbank einem Redesign und einer Migration unterzogen. Zukünftig soll noch mehr Wert gelegt werden auf offene Systemstellen und die bisher schon essenzielle Open Access-Policy weiter vorangetrieben werden (Downloadbarkeit urheberrechtlich unproblematischer Texte und großzügige Datenauszüge ebenso wie eine öffentlich zugängliche IT-Dokumentation).
Die vorhandenen Texte werden in das XML-TEI-Format konvertiert. TEI (Text Encoding Initiative) stellt heute einen de facto-Standard in den Geisteswissenschaften dar und wird zur Kodierung und Auszeichnung von Texten verwendet.
Weiters wird die Oberfläche komplett überarbeitet und auf den neuesten Stand der Technik und Usability gebracht. So kann die MHDBDB danach auch auf mobilen Geräten wie Tablets oder Smartphones genutzt werden.
Eine neue Abfragesprache wird komplexe Recherchen ermöglichen, ebenso die Verknüpfung mit externen Datenquellen (z.B. des Semantic Webs wie LOD) und auch den Export der Daten in die unterschiedlichsten Formate wie z.B. PDF, TEI, LaTeX, XLS oder Graphen (zur weiteren Verarbeitung z.B. mit Gephi).

Neue Tools, die dabei entstehen sollen, sind u.a.: Synonym-, Komposita- und Reimwörterbücher des Mittelhochdeutschen, die Abfrage eines autor- und textspezifischen Wortschatzes (Hapaxlegomena), Visualisierungsanwendungen sowie eine NutzerInnen-spezifische Oberfläche mit Speichermöglichkeit („myMHDBDB“).

Zudem wird das Begriffssystem der MHDBDB auf der Basis von Ontologien überarbeitet. Dabei werden die (meisten) bestehenden hierarchischen Relationen der Categories (Begriffsfelder) beibehalten, jedoch um zahlreiche weitere (Poly-)Hierarchien sowie standardisierte Tags erweitert und außerdem ein Netzwerk von Äquivalenzrelationen über den Wortbestand gelegt, vergleichbar mit dem nhd. Wortmaterial im lexikalisch-semantischen Netz von GermaNet. Assoziationsrelationen, die an die Vorgehensweise bekannter Onlineshops erinnern („Kunden, die sich für dieses Buch interessierten, kauften auch…“), sind ebenfalls in Arbeit.

Vom Institut für Literaturwissenschaft sowie dem Institut für Maschinelle Sprachverarbeitung an der Universität Stuttgart konnte bereits auf Basis der Texte und des Wortindexes der MHDBDB eine Trainingsdatei für einen Tree-Tagger erstellt werden. Das Trainingskorpus enthält etwa 10 Millionen tokens und repräsentiert unterschiedliche Gattungen, Epochen und Dialekte. Dieser Tree-Tagger ist nun Basis für die weitere Entwicklung des automatischen Disambiguierers der MHDBDB im Zuge des Relaunches. Details s. http://www.ims.uni-stuttgart.de/forschung/ressourcen/werkzeuge/PoS_Tag_MHG.html  (Koordination Stuttgart: Prof.Dr. Manuel Braun und Dr. Nils Reiter)

Der Relaunch der MHDBDB erfolgt unter der Leitung von Katharina Zeppezauer-Wachauer (MHDBDB) und Daniel Schlager (IT Service|dhPLUS).

Wir halten Sie über den Fortschritt auf dem Laufenden.

Beachten Sie auch unsere Seite bei ResearchGate.

---

 

MHDBDB-Team

Universität Salzburg

Externe Mitwirkende

Ehemalige Mitwirkende (in alphabetischer Reihenfolge)

  • Maike Ahrends, Barbara Aitenbichler, Claudia Becker, Wolfgang Boepple, Claudia Bornholdt, Michael Brachtl, Katrin Callsen, Christof Danzl, Werner Dietl, Andrea Dietrich, Alfred Ebenbauer, Jim Ecker, Annemarie Eder,Harald Feiel, Bente Gebhardt, Susanne Gehrke, Camilla Groth, Bettina Hatheyer, Britta Jäkel, Barbara Kraus, Susanne Lang, Thomas Mahler, Anindo Majumdar, August Mayer, Peter Meerwald, Nikolaus Morocutti, Silvia Müller, Ulrich Müller, Charles Osborne, Horst P. Pütz, Judith Pouget, Anne Rahmlow, Ron Reazin, Martin Schubert, Leevke Schiwek, Svenja Schulz, Rudolf Schürer, Barbara Siebert, W. Maurice Sprague, Margarete Springeth (ehem. Koordinatorin), Joachim Steinwendner, Joe Uffner, Verena Vitzthum, Tanja Vogl, Ruth Weichselbaumer, Michael Westreicher, Katrin Woesner

Kontakt

 

Zurück zum Inhalt

 

 

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken

Merken