Text-Indexierung

  • Typ: Vorlesung (V)
  • Lehrstuhl: Prof. Dr. Peter Sanders
  • Zeit: Montag  09.45 bis 11.15 Uhr
    50.34 Raum 236
  • Beginn: 15.04.2013
  • Dozent: J. Fischer
  • SWS: 2
  • ECTS: 5
  • LVNr.: 24692
  • Prüfung:

    ja

Mündliche Prüfung

Bitte melden Sie sich per Email beim Dozenten, um einen Termin für die mündliche Prüfung zu vereinbaren. Mögliche Termine sind der 29.7.13 und der 2.8.13, jeweils vormittags. Bitte melden Sie sich zusätzlich bis spätestens am Tag vor der Prüfung offiziell an.

Inhalte

In dieser Vorlesung beschäftigen wir uns mit dem Problem, einen (oft sehr langen) Text so vorzuverarbeiten, dass im Anschluss effiziente Suchanfragen darin ausgeführt werden können. Beispiele solcher Anfragen reichen von einfachen Pattern-Matching Anfragen ("kommt ein Suchmuster im Text vor?") bis hin zu komplexen Data-Mining-Anfragen, z.B. die Suche nach repetitiven Mustern.

Die Vorlesung ist geeignet für Informatiker im Master- oder Diplomstudiengang (Hauptstudium). Sie eignet sich gut als Vorbereitung zur Erstellung von Studien- oder Abschlussarbeiten (Master/Diplom) im Bereich Text-Indexierung.

In diesem Semester wollen wir uns vermehrt mit praktischen Systemen beschäftigen, in denen Textindizes zum Einsatz kommen. Diese sollen implementiert werden (etwa in Gruppenarbeit). Insgesamt wird eine aktive Mitarbeit aller TeilnehmerInnen erwartet, da wir uns stark vom üblichen Vorlesungsformat entfernen werden.

Vorlesungskalender

  • 15.4.2013: Einführung
  • 22.4.2013: Suffix Arrays [pdf]
  • 29.4.2013: Inverted Indexes [pdf]
  • 6.5.2013: Fehlertolerante Suche
  • 13.5.2013: Kompression [pdf]
  • 20.5.2013: Pfingstmontag - fällt aus!
  • 27.5.2013: Paralleles IR [pdf]; Gruppenfindung für Anwendungsprojekt [pdf]
  • 3.6.2013: fällt aus!
  • 10.6.2013: Anwendungsprojekt: Ideenpräsentation
  • 17.6.2013: fällt aus
  • 24.6.2013: Repeats-Berechnung; effiziente Berechnung des LCP-Arrays
  • 1.7.2013: Burrows-Wheeler Transformation; Rückwärtssuche
  • 8.7.2013: Projektpräsentation I (Nachbarschaftskookurrenzen und Plagiatsdetektor)
  • 15.7.2013: Projektpräsentation II (Suche in Sprachdateien und Desktopsuche)