KWIC ist eine Abkürzung für ``KeyWord In Context'', etwa mit ``Schlüsselwort im Textzusammenhang'' zu übersetzen. Ein KWIC-Index ist ein Verzeichnis von Schlüsselwörtern mit den sie umgebenden Wörtern und einem Hinweis auf die Vorkommensstelle.
Beispiel: Einige Überschriften aus ``Technische und theoretische Informatik'', Bayerischer Schulbuchverlag 1992
Begriff | Seite | |
---|---|---|
Präzisierung des | Algorithmenbegriffs | 194 |
Bestandteile und | Arbeitsweise der Turingmaschine | 184 |
Vergleich der Turingmaschine mit dem Endlichen | Automaten | 191 |
Beispiele von Turingmaschinen | 188 | |
Grenzen der | Berechenbarkeit | 196 |
Bestandteile und Arbeitsweise der Turingmaschine | 184 | |
Vergleich der Turingmaschine mit einem | Computer | 192 |
Darstellungsarten von Turingmaschinen | 185 | |
Vergleich der Turingmaschine mit dem | Endlichen Automaten | 191 |
Grenzen der Berechenbarkeit | 196 | |
Präzisierung des Algorithmenbegriffs | 194 | |
Bestandteile und Arbeitsweise der | Turingmaschine | 184 |
Vergleich der | Turingmaschine mit dem Endlichen Automaten | 191i |
Vergleich der | Turingmaschine mit einem Computer | 192 |
Darstellungsarten von | Turingmaschinen | 185 |
Beispiele von | Turingmaschinen | 188 |
Vergleich der Turingmaschine mit dem Endlichen Automaten | 191 | |
Vergleich der Turingmaschine mit einem Computer | 192 |
Aufgabe: Schreiben Sie ein Programm, welches aus einer Datei Textzeilen einliest, dazu einen KWIC-Index erstellt und diesen ausgibt. Schicken Sie uns mehrere Erzeugnisse Ihres KWIC-Index-Generators, darunter eines, welches den unten angegebenen Text als Eingabetext verwendet. Als Angabe der Fundstelle soll dabei die Satznummer (bitte abzählen) stehen.
Diskutieren Sie alle Probleme (z.B. sehr lange Zeilen, Positionierung der Schlüsselworte, Vielfachvorkommen usw.), die Sie bei der Realisierung entdecken. Wir nehmen übrigens an, daß nach einem Doppelpunkt ein neuer Satz beginnt.
Eingabetext:
Dies soll einmal ein netter Text sein.
Schließlich sollen Sie Spaß daran haben.
Der Text soll nicht von Informatik handeln.
Dazu gibt es schließlich schon das Beispiel oben.
Natürlich müssen viele Schlüsselwörter vorkommen.
Und die Schlüsselwörter müssen in einem Zusammenhang
stehen.
Sonst muß der Zusammenhang künstlich erzeugt werden.
Das ist dann ein künstlicher Zusammenhang.
Und ein künstlicher Zusammenhang ist
kein natürlicher Zusammenhang.
Aber nun Schluß. Dies soll einmal ein netter Text sein.
Und lange Texte sind nicht nett.