15.2.3 KWIC



up previous
Hoch: 15. BWINF 2. Runde Zurück: 15.2.2

15.2.3 KWIC

KWIC ist eine Abkürzung für ``KeyWord In Context'', etwa mit ``Schlüsselwort im Textzusammenhang'' zu übersetzen. Ein KWIC-Index ist ein Verzeichnis von Schlüsselwörtern mit den sie umgebenden Wörtern und einem Hinweis auf die Vorkommensstelle.

Beispiel: Einige Überschriften aus ``Technische und theoretische Informatik'', Bayerischer Schulbuchverlag 1992

Begriff Seite
Präzisierung des Algorithmenbegriffs 194
Bestandteile und Arbeitsweise der Turingmaschine 184
Vergleich der Turingmaschine mit dem Endlichen Automaten 191
Beispiele von Turingmaschinen 188
Grenzen der Berechenbarkeit 196
Bestandteile und Arbeitsweise der Turingmaschine 184
Vergleich der Turingmaschine mit einem Computer 192
Darstellungsarten von Turingmaschinen 185
Vergleich der Turingmaschine mit dem Endlichen Automaten 191
Grenzen der Berechenbarkeit 196
Präzisierung des Algorithmenbegriffs 194
Bestandteile und Arbeitsweise der Turingmaschine 184
Vergleich der Turingmaschine mit dem Endlichen Automaten 191i
Vergleich der Turingmaschine mit einem Computer 192
Darstellungsarten von Turingmaschinen 185
Beispiele von Turingmaschinen 188
Vergleich der Turingmaschine mit dem Endlichen Automaten 191
Vergleich der Turingmaschine mit einem Computer 192


Natürlich sind ``vor'', ``und'', ``mit'' usw. in diesem Zusammenhang keine geeigneten Schlüsselwörter!

Aufgabe: Schreiben Sie ein Programm, welches aus einer Datei Textzeilen einliest, dazu einen KWIC-Index erstellt und diesen ausgibt. Schicken Sie uns mehrere Erzeugnisse Ihres KWIC-Index-Generators, darunter eines, welches den unten angegebenen Text als Eingabetext verwendet. Als Angabe der Fundstelle soll dabei die Satznummer (bitte abzählen) stehen.

Diskutieren Sie alle Probleme (z.B. sehr lange Zeilen, Positionierung der Schlüsselworte, Vielfachvorkommen usw.), die Sie bei der Realisierung entdecken. Wir nehmen übrigens an, daß nach einem Doppelpunkt ein neuer Satz beginnt.

Eingabetext:
Dies soll einmal ein netter Text sein. Schließlich sollen Sie Spaß daran haben. Der Text soll nicht von Informatik handeln. Dazu gibt es schließlich schon das Beispiel oben. Natürlich müssen viele Schlüsselwörter vorkommen. Und die Schlüsselwörter müssen in einem Zusammenhang stehen. Sonst muß der Zusammenhang künstlich erzeugt werden. Das ist dann ein künstlicher Zusammenhang. Und ein künstlicher Zusammenhang ist kein natürlicher Zusammenhang. Aber nun Schluß. Dies soll einmal ein netter Text sein. Und lange Texte sind nicht nett.




Mon Dec 16 11:47:49 MET 1996