MHDBDB-Hilfe: Textanalyse

Das der MHDBDB zu Grunde liegende Textinformationssystem erlaubt so gut wie jede linguistische und semantische Fragestellung an die Textbasis. Für die umfassende analytische Arbeit an einzelnen Texten oder am gesamten Textarchiv steht das Modul Textanalyse zur Verfügung. Es bietet folgende Möglichkeiten der Suche: Von der Suche erfasst wird der gesamte Wortschatz, also auch der noch nicht lemmatisierte Teil.

Das Suchergebnis wird in einer Tabelle dargestellt. An den dort verzeichneten Textkürzeln ist sofort ersichtlich, aus welchem Text jede Belegstelle stammt. Die einzelnen Belegstellen kann man dann anschließend aufrufen (siehe unten).

Die Suche kann sich beziehen auf:

Hierzu müssen die entsprechenden Funktionen gewählt bzw. der oder die entsprechenden Texte angeleuchtet werden).

Bei der Suche nach zwei oder mehr Wörtern im Kontext mehrerer Verse (Kontextsuche) ist die Definition des Kontextes erforderlich (wie viele Wörter oder Zeilen soll er umfassen?). Ebenso kann für die Darstellung des Ergebnisses (Belegstelle) die Anzahl der Verse vor und nach dem gesuchten Wort festgelegt werden (Zeilen vor und nach Schlüsselwort).

Jeder Suchbefehl, außer der nach einem Einzelwort, setzt eine geregelte Syntax voraus; Näheres dazu findet sich in den Hilfe-Dokumenten (s. Allgemeine Hilfe und Hilfe zur Textsuche).

Die wichtigsten Syntaxregeln sind folgende:

Grundsätzlich gilt:
keine Spatien zwischen den Suchbegriffen und den Funktionszeichen;

Suche nach einer bestimmten Zeichenkette:
vorangestelltes „$“;

Suche nach einem Lemma mit sämtlichen graphischen Varianten:
vorangestelltes „@“;

Suche nach Wörtern in Folge:
die Wörter werden durch Kommata verbunden;

Suche nach einer Wortform, die gleichzeitig ein spezifisches grammatisches oder ein semantisches Merkmal aufweisen oder in einer bestimmten Position stehen soll:
das Verbindungszeichen ist „&“;

Suche nach Wörtern im Kontext:
die Suchbegriffe müssen durch „+“ verbunden werden;

Suche nach zwei verschiedenen Wortformen oder zwei verschiedenen Merkmalen:
das Verbindungszeichen ist „|“ (= oder).

Das Suchergebnis wird in einer Tabelle, bestehend aus den Textkürzeln und der Anzahl der gefundenen Belege, dargestellt: Die jeweiligen Grundformen (z.B. klagen; vrouwe) sind gelb unterlegt; die dazugehörigen Formen (z.B. chlagn, klagete, geklaget; vrouwen, frauw) stehen auf dem normalen hellen Untergrund. Die Belegstellen, die noch keinem Lemma zugeordnet oder Homographen, die noch nicht disambiguiert sind, finden sich am Ende der Tabelle.

Durch Anklicken einer Zahl in der Tabelle gelangt man zur Textanzeige mit den entsprechenden Belegstellen. Die gesuchten Wörter sind innerhalb des Belegkontextes rot markiert.

Es kann aber nicht nur nach einzelnen Wörtern gesucht werden, sondern auch nach einem Ensemble von Wörtern, die zu einem oder auch mehreren Begriffsfeldern gehören. Daraus ergeben sich verschiedene Möglichkeiten, wobei die bereits oben erwähnten Syntaxregeln gelten:

Tristan und Isold (Gottfried von Straßburg), Zeile 116 - 124
daz übel daz tuot so herzewol,
daz es kein edele herze enbirt,
sit ez hie von geherzet wirt.
ich weiz ez warez alse den tot
120 und erkennez bi der selben not:
der edele senedaere
der minnet senediu maere.
von diu swer seneder maere ger,
dern var niht verrer danne her;

Die Begriffe, die bestimmten semantischen Kategorien zugeordnet sind, sind durch Zifferncodes, der die jeweilige Bedeutungskategorie bezeichnen, definiert. Für ausführliche Erklärungen zur Suche mit Bedeutungskategorien siehe die Wortindex-Hilfe (Was ist das?) und Allgemeine Hilfe - Bedeutungskategorien.

Zurück zum Hilfe-Inhaltsverzeichnis