MHDBDB - Die Suche im Wortindex

Letzte Änderung: 16. Februar 2003

Inhalt

Allgemeine Erklärungen

Man kann über das Wortindex-Modul keine Suche in den Texten vornehmen. Das Wortindex enthält nur das Wortmaterial der Texte, die bereits lemmatisiert wurden. Generell funktioniert das Wortindex wie ein normales mhd. Wortindex, weist aber die folgenden entscheidenden Unterschiede auf:

  1. Anstatt der neuhochdeutschen Übersetzungen für die mittelhochdeutschen Einträge erscheinen Bedeutungen, die jeweils ganz unten im WB-artikel geführt werden. Jede Bedeutung beginnt mit einer laufenden Nummer und kann aus einer oder meist mehreren Begriffskategorien bestehen. Die Summe der unter einer bestimmten laufenden Nummer erscheinenden Begriffskategorien ergibt die entsprechende Bedeutung.

    Beispiel: man hat vier Bedeutungen: Nhd. "männlicher Mensch", "Krieger niedrigen sozialen Standes", "Ehemann", "sozial niedrig stehender Vasall"

    1	Mensch					20000000
    	Geschlecht				21010000
    
    2	Mensch					20000000
    	Geschlecht				21010000
    	Kriegswesen/Kampf/Allgemeines		23241000
    	Dienstklasse				24323000
    	Unterste Klassen			24325000
    
    3	Mensch					20000000
    	Geschlecht				21010000
    	Ehe					23112200
    
    4	Dienstklasse				24323000
    	Lehenswesen				24323100
    

    Wirkliche Homographen erscheinen als separate Lemmaeinträge. So wird zum Beispiel man für das unpersönliche Pronomen als eigener Lemmaeintrag geführt.

  2. Komposita erscheinen als eigene Lemmata, man kann diese aber auch durch Anklicken in der jeweiligen Kompositaliste aufrufen, die dem Lemmaeintrag der jeweiligen Komponente folgt.

Suchfenster

Wenn man das Wortindex-Modul aufruft, sieht man zunächst nur das Suchfenster und den Knopf Get it!. Nachdem Sie Ihre Zeichenkette, nach der Sie suchen wollen, ins Suchfenster eingetragen haben, drücken Sie einfach auf den Knopf Get it!. Sie erhalten dann die Seite mit den Suchergebnissen auf dem Bildschirm.

Typische Wortindex-Suchen

Sie können entweder nach einer beliebigen Zeichenkette, nach einem Lemma, nach einer Variante eines Lemmas, nach einer Begriffskategorie oder einer Kombination von Kategorien oder einer Kombination von Wort und Begriffskategorie suchen.
  1. Suche nach Zeichenketten, Lemmata, Varianten:
    Wenn Sie nach einer Zeichenkette suchen, erhalten Sie jedes Lemma und jede Variante, die dieser Zeichenkette entspricht. Wenn Sie zum Beispiel die Zeichenkette man eingeben, erhalten Sie drei Lemmata, man = Nomen; man = unbestimmtes Pronomen; manen = Verb (da 'man' auch eine Variante von 'manen' sein kann). Wenn Sie nur nach einem bestimmten Lemma suchen wollen, so geben Sie den Suchbefehl @man ein, und Sie erhalten dann nur die beiden Lemmata man = Nomen; man = unbestimmtes Pronomen.

    Sie können auch einen sogenannten Joker verwenden. Der Suchbefehl @ar*, erbringt Ihnen zum Beispiel alle Lemmata, die mit den Buchstaben 'ar' beginnen. Der Suchbefehl @ar? ergibt alle Lemmata, die mit den Buchstaben 'ar' beginnen, und auf die nur ein weiterer Buchstabe folgt.

  2. Suche nach Begriffskategorien:
    Wenn man eine bestimmte Begriffskategorie als Suchbefehl eingibt, erhält man alle Lemmata, bei denen in irgendeiner Bedeutung diese Kategorie auftaucht. So erbringt zum Beispiel die Eingabe von 14021 alle Lemmata, bei denen zumindest einer Bedeutung die Kategorie "Vögel/Allgemeines" zugeordnet ist. Aufgepasst, wenn sie eine zu allgemeine oder übergeordnete Kategorie eingeben, bekommen sie u.U. eine riesige Liste, die die Reaktionszeit des Systems in die Länge ziehen kann. Die Obergrenze für solche Listen ist bei 1000 Lemmata festgesetzt. Bitte benutzen Sie die Hilfsfunktionen Search word in category system or Browse categories.

  3. Suchkombinationen:
    Wenn man zwei oder mehrere Kategorien miteinander verbindet, erhält man alle Lemmata, in deren Bedeutungen eine solche Kombination von Begriffskategorien auftaucht. Zum Beispiel ergibt die Sucheingabe 2101&231122 alle Lemmata, bei denen zumindest eine Bedeutung die Kategorien-Kombination 2101 = Geschlecht und 231122 = Ehe enthält. Man kann bei der Suche auch Kategorien mit Zeichenketten + Joker verbinden. Die Sucheingabe 231125&a* erbringt zum Beispiel alle Eigennamen die mit dem Buchstaben 'a' beginnen.

Die Suchausgabe

  1. Lemma:
    Neben dem MHDBDB Bild-Logo erscheint jeweils das Lemma in fett.

  2. Varianten:
    Unter dem Lemma erscheinen eingerückt die Varianten, die zum Lemma gehören. Diese spiegeln den jeweilig neuesten Stand der Lemmatisierung des ganzen Projekts wider. Neben jeder Variante erscheint eine Frequenz-Ziffer . Diese steht auf 0 = null, wenn der kleine weiße, quadratische Knopf Count Frequencies neben dem Get it!-Knopf nicht angeleuchtet worden ist. (Wenn die Frequenzen angezeigt werden, erhöht sich die Reaktionszeit des Systems).

    Am Ende der Variantenliste steht dann die kumulative Frequenz für das gesamte Lemma. Die Frequenzen gelten nur für die Häufigkeit, in der die jeweiligen Varianten diesem bestimmten Lemma zugeordnet wurden. Bei Homographen entspricht das dem derzeitigen Stand der Disambiguierung oder Homographentrennung auf der Basis von Kontextbestimmung für das gesamte Projekt. Dies bedeutet nicht, dass die entsprechende Form in der Textbasis überhaupt nicht vorkommt (siehe Textsuche).

  3. Komposita:
    Unterhalb der Varianten finden Sie die Liste der Komposita, die mit dem aufgezeigten Lemma als Komponente gebildet wurden. Jedes dieser Komposita erscheint als eigener Lemma-Artikel, der durch Anklicken des entsprechenden Kompositums aufgerufen werden kann. Komposita erben gewöhnlich die Bedeutungen ihrer Hauptkomponente, sofern nicht eine Bedeutungsverengung durch die Zusammensetzung erfolgt.

Blättern im Wortindex

Wenn Sie einmal das erste Lemma im Wortindex aufgerufen haben, können Sie beliebig vorwärts und rückwärts im alphabetisch geordneten Wortindex weiterblättern, indem Sie auf die entsprechenden Pfeile unterhalb des Suchfensters neben dem Suchknopf Get it! klicken.

Zurück zum Wortindex

Zurück zum Hilfe-Inhaltsverzeichnis