Text-Indexierung

  • Type: Vorlesung (V)
  • Chair: KIT-Fakultäten - KIT-Fakultät für Informatik - Institut für Theoretische Informatik - ITI Sanders
  • Semester: WS 21/22
  • Location:

    planned: Building 50.34, Room -119 
    Please note the current instructions!

  • Time:

    Monday 10:00 to 11:30 pm

  • Start: 18.10.2021
  • Lecturer:

    Prof. Dr. Peter Sanders
    Dr. Florian Kurpicz

  • SWS: 3
  • Lv-No.: 2400005
Inhalt

In dieser Vorlesung beschäftigen wir uns mit Algorithmen und Datenstrukturen für Texte, speziell Text-Indizes. Text-Indizes sind Datenstrukturen, die Zusatzinformationen über einen Text bereitstellen, um Anfragen hinsichtlich dieses Texts zu beschleunigen. Hierbei kann es sich um einfache Pattern-Matching-Anfragen („Kommt ein Suchmuster im Text vor?“) oder komplexere Data-Mining-Anfragen („Welches Muster einer bestimmten Länge kommt am häufigsten im Text vor?“) handeln.

 

Darüber hinaus beschäftigen wir uns mit der Textkompression. Hierbei möchten wir einen Text möglichst platzeffizient darstellen. Allerdings müssen wir sicherstellen, dass der originale Text vollständig rekonstruiert werden kann. Wir sprechen hierbei von verlustfreier Kompression. In der Vorlesung lernen wir Techniken kennen, die unter anderem in Kompressionsprogrammen wie gzip verwendet werden.

VortragsspracheDeutsch

Materialien

Kapite 00: Einführung Folien (Stand 18.10.2021)

Kapitel 01: Tries Folien (Stand 18.10.2021)