SS 2015

Semantikkonstruktion

 

Semantikkonstruktion


AM 3b/AM 6: Semantikkonstruktion
Sommersemester 2015
Prof. Dr. Alexander Koller
Fr 10-12; Golm, Haus 14, Raum 0.09

Beginn: Freitag, 24. April


In der Semantikkonstruktion geht es darum, für einen gegebenen Satz eine semantische Repräsentation zu berechnen.

Im klassischen Ansatz der Jahre 1970-2000 geht man dabei so vor, dass man zunächst einen Syntaxbaum für den Satz berechnet. Danach geht man diesen Baum von unten nach oben durch und berechnet für jede Konstituente rekursiv eine semantische Repräsentation, etwa auf der Grundlage des Lambda-Kalküls. Dieser Ansatz geht typischerweise davon aus, dass man eine Grammatik für die Abbildung von Syntax zu Semantik von Hand geschrieben hat.

Aus verschiedenen Gründen, die wir im Seminar erarbeiten werden, ist die klassische Semantikkonstruktion aus der Mode gekommen. Unter anderem hat sich gezeigt, dass die Entwicklung von großen Grammatiken für die Semantikkonstruktion ungeheuer aufwändig ist. Eine ganz aktuelle Entwicklung ist aber die Wiederentdeckung der Semantikkonstruktion unter dem Namen “Semantic Parsing”. Hier geht es im wesentlichen um das gleichen Problem, allerdings aus einer etwas anderen Perspektive: (Probabilistische) Grammatiken werden automatisch aus Daten gelernt, und syntaktische Strukturen bleiben evtl. implizit.

Ablauf des Seminars. Das Seminar besteht aus zwei Teilen, die wir je nach Interesse und Teilnehmerzahl verschieden ausdehnen können.

Im ersten Teil werden wir einen Parser implementieren, der auf der Grundlage einer kontextfreien Grammatik mit semantischen Informationen Ausdrücke in Lambda-Termen übersetzen kann, also ein einfaches System für die “klassische” Semantikkonstruktion. Wir werden dann eine Grammatik entwickeln, die eine Reihe von interessanten linguistischen Phänomenen abdeckt. Wir implementieren den Parser in Python, auf der Grundlage von NLTK.

Im zweiten Teil werden wir uns dann zusammen die Literatur zu fortgeschrittenen Themen in Semantikkonstruktion und Semantic Parsing erarbeiten. Die Themen können je nach Interesse der Teilnehmer zugeschnitten werden; unter anderem können wir die folgenden Fragen diskutieren:

Bitte melden Sie sich im Piazza-Forum für dieses Seminar an. Ich werde es für Ankündigungen verwenden, und Sie können sich dort auch während des Seminars miteinander austauschen.

Teilnahmevoraussetzungen. Ich setze Kenntnisse über Parsingalgorithmen und ihre Implementierung voraus, wie man sie z.B. durch den erfolgreichen Besuch der Vorlesung “Computerlinguistische Techniken” erwirbt. Das Seminar enthält erhebliche praktische Anteile und richtet sich primär an Studierende im BSc Computerlinguistik.

Daneben sind Kenntnisse im Bereich Semantik wichtig. Ich setze den erfolgreichen Besuch von BM3 “Semantik I” voraus. Der erfolgreiche Besuch von VM6 “Semantik II” ist von Vorteil.

Prüfung und Schein. Das Seminar kann nach Wahl des Studierenden entweder dem Modul AM3b (Methoden der Computerlinguistik) oder dem Modul AM6 (Semantik) zugeordnet werden.

Die Prüfung besteht aus der Projektarbeit in Teil 1 (30%), einem Vortrag in Teil 2 (40%) und einer kleinen Hausarbeit (30%), die bis zum 15.09.2015 abzugeben ist.