MHDBDB-Hilfe: Textanalyse
Das der MHDBDB zu Grunde liegende Textinformationssystem erlaubt so gut
wie jede linguistische und semantische Fragestellung an die
Textbasis. Für die umfassende analytische Arbeit an einzelnen
Texten oder am gesamten Textarchiv steht das Modul Textanalyse
zur Verfügung. Es bietet folgende Möglichkeiten der Suche:
- nach einzelnen Wörtern oder Zeichenketten
- nach mehreren Wörtern
- nach Wörtern in Folge
- nach Wörtern vor oder nach Satzzeichen oder Zäsuren
- nach Wörtern in verschiedensten Positionen innerhalb einer Verszeile
(z.B. für metrische Analysen)
- nach einfachen bis komplexen Wortkombinationen im Kontext.
Von der Suche erfasst wird der gesamte Wortschatz, also auch der noch
nicht lemmatisierte Teil.
Das Suchergebnis wird in einer Tabelle dargestellt. An den dort
verzeichneten Textkürzeln ist sofort ersichtlich, aus welchem
Text jede Belegstelle stammt. Die einzelnen Belegstellen kann man
dann anschließend aufrufen (siehe unten).
Die Suche kann sich beziehen auf:
- einen einzelnen Text,
- auf mehrere ausgewählte Texte,
- auf Autoren oder auf Texttypen
Hierzu müssen die entsprechenden Funktionen gewählt bzw. der oder
die entsprechenden Texte angeleuchtet werden).
Bei der Suche nach zwei oder mehr Wörtern im Kontext mehrerer Verse
(Kontextsuche) ist die Definition des Kontextes erforderlich (wie
viele Wörter oder Zeilen soll er umfassen?). Ebenso kann für
die Darstellung des Ergebnisses (Belegstelle) die Anzahl der Verse
vor und nach dem gesuchten Wort festgelegt werden (Zeilen vor und
nach Schlüsselwort).
Jeder Suchbefehl, außer der nach einem
Einzelwort, setzt eine geregelte Syntax voraus; Näheres dazu
findet sich in den Hilfe-Dokumenten (s. Allgemeine Hilfe
und Hilfe zur Textsuche).
Die wichtigsten Syntaxregeln sind folgende:
- Grundsätzlich gilt:
- keine Spatien zwischen den Suchbegriffen und den
Funktionszeichen;
- Suche nach einer bestimmten Zeichenkette:
- vorangestelltes „$“;
- Suche nach einem Lemma mit sämtlichen graphischen Varianten:
- vorangestelltes „@“;
- Suche nach Wörtern in Folge:
- die Wörter werden durch Kommata verbunden;
- Suche nach einer Wortform, die gleichzeitig ein spezifisches grammatisches oder
ein semantisches Merkmal aufweisen oder in
einer bestimmten Position stehen soll:
- das Verbindungszeichen ist „&“;
- Suche nach Wörtern im Kontext:
- die Suchbegriffe müssen durch „+“ verbunden
werden;
- Suche nach zwei verschiedenen Wortformen oder zwei verschiedenen Merkmalen:
- das Verbindungszeichen ist „|“ (= oder).
Das Suchergebnis wird in einer Tabelle, bestehend
aus den Textkürzeln und der Anzahl der gefundenen Belege,
dargestellt: Die jeweiligen Grundformen (z.B. klagen;
vrouwe) sind gelb unterlegt; die
dazugehörigen Formen (z.B. chlagn,
klagete, geklaget;
vrouwen, frauw)
stehen auf dem normalen hellen Untergrund. Die Belegstellen, die
noch keinem Lemma zugeordnet oder Homographen, die noch nicht disambiguiert sind, finden sich am Ende der Tabelle.
Durch Anklicken einer Zahl in der Tabelle gelangt man zur Textanzeige mit
den entsprechenden Belegstellen. Die gesuchten Wörter sind
innerhalb des Belegkontextes rot markiert.
Es kann aber nicht nur nach einzelnen Wörtern
gesucht werden, sondern auch nach einem Ensemble von Wörtern,
die zu einem oder auch mehreren Begriffsfeldern gehören.
Daraus ergeben sich verschiedene Möglichkeiten, wobei die
bereits oben erwähnten Syntaxregeln gelten:
- Man kann nach sämtlichen Wörtern und Wortformen in der MHDBDB
suchen, die in das Begriffsfeld „Tod“ fallen;
- oder in das Begriffsfeld „Liebe“;
- man kann des weiteren auch nach Wörtern und Wortformen suchen, die
gleichzeitig diesen beiden Begriffsfeldern angehören (Achtung:
hierfür ist das Zeichen & zu verwenden, z.B.:
21104000&22704010, Ergebnis: minnetôt, tôtviendinne
u,.a.);
- und schließlich kann man suchen, wo in einem bestimmten Kontext
ein Wort aus dem Begriffsfeld „Tod“ neben einem Wort aus
dem Begriffsfeld „Liebe“ vorkommt (Achtung: hierfür
ist das Zeichen + zu verwenden,z.B.: 21104000+2704010, Ergebnis
(Kontext: 3 Verse; Verse vor und nach den Schlüsselwörtern:
je 3).
Tristan und Isold (Gottfried von Straßburg), Zeile 116 - 124
|
daz übel daz tuot so herzewol, |
|
daz es kein edele herze enbirt, |
|
sit ez hie von geherzet wirt. |
|
ich weiz ez warez alse den tot |
120 |
und erkennez bi der selben not: |
|
der edele senedaere |
|
der minnet senediu maere. |
|
von diu swer seneder maere ger, |
|
dern var niht verrer danne her; |
Die Begriffe, die bestimmten semantischen Kategorien zugeordnet sind,
sind durch Zifferncodes, der die jeweilige Bedeutungskategorie bezeichnen,
definiert. Für ausführliche Erklärungen zur Suche mit
Bedeutungskategorien siehe die
Wortindex-Hilfe (Was ist das?) und
Allgemeine Hilfe - Bedeutungskategorien.
Zurück zum Hilfe-Inhaltsverzeichnis