Situierte Semantik/Nichtlinguistische Bedeutungsrepräsentationen

Seminar (BSc: AM3b/AM6; MSc: MM3/MM6)
Sommersemester 2012
Alexander Koller

Di 12-14, Raum II.14.038

Beginn: Di 17.4.12

Moodle

Ein alter Semantiker-Witz geht so: The meaning of life is life'. In der Tat sind die Montague-Grammatik in der theoretischen Semantik und die von ihr abgeleiteten Ansätze für Semantikkonstruktion in der Computerlinguistik sehr erfolgreich darin, logikbasierte Bedeutungsrepräsentationen für gegebene Sätze zu berechnen. Um mit diesen formalen Repräsentationen irgendetwas nichttriviales anfangen zu können, müssen die Symbole (wie life') aber mit Inhalt gefüllt werden. Der klassische Ansatz in der computerlinguistischen Semantik erfasst diesen Inhalt in logikbasierten Wissensbasen, die den Bezug zwischen verschiedenen Symbolen darstellen. Solche Wissensbasen von Hand zu entwickeln ist allerdings teuer. Außerdem bieten sie nur einen recht indirekten und kognitiv unplausiblen Zugang zur Bedeutung von Wörtern und Phrasen.

Manche Computerlinguisten arbeiten deshalb an alternativen Ansätzen zur Modellierung der Bedeutung von Wörtern und logischen Konzepten. Ein Ansatz, der in den letzten Jahren vielversprechende erste Ergebnisse gezeigt hat, ist die direkte Abbildung von Wörtern in die nichtlinguistische Umwelt. Das kann (im Fall von Robotern, die die Bedeutung von Wörtern wie "Tür" lernen sollen) die reale Welt sein; es können multimodale Daten wie Fotos oder Filme sein (der Computer soll lernen, Filmszenen zu finden, die vom Wort "trinken" beschrieben werden); oder man arbeitet mit abstrakten "Welten" wie Protokollen von Fußballspielen oder Wetterdaten. Dieser Ansatz ermöglicht den Einsatz von Machine-Learning-Verfahren, die den Zusammenhang von Wort und Umwelt sehr direkt darstellen können.

In diesem Seminar besprechen wir einige der aktuellen Arbeiten in diesem Bereich. Das Seminar ist sowohl für fortgeschrittene BSc-Studenten (als AM3b oder AM6) als auch für MSc-Studenten (als MM3 oder MM6) geeignet; es wird aus technischen Gründen als zwei verschiedene Lehrveranstaltungen angeboten. Einige Artikel, die wir lesen werden, sind recht technisch. Daher sind computerlinguistische Vorkenntnisse (insbesondere im Bereich von statistischen Verfahren) erforderlich. Um eine rege Diskussion sicherzustellen, lege ich Wert darauf, dass jeder Teilnehmer mindestens eines der Papiere, die in jeder Sitzung diskutiert werden, vorher liest.

Zeitplan

8.5. Nicht-situierte Modelle von Bedeutung
Sprecher: Alexander Koller

15.5. Grounding in Parsing und Generierung
Sprecher: Alexander Koller

22.5. Akquisition von Trainingsdaten aus Online-Spielen
Sprecher: Evgeniya Shipova

29.5. Lernen aus Filmdaten
Sprecher: Christian Lemke

5.6. Geographische Koordinaten
Sprecher: Florian Hofmann

12.6. Sprachverarbeitung in Robotern
Sprecher: Leonard Kriese

19.6. Lernen in virtuellen Welten
Sprecher: Christian Lemke

26.6. Windows-GUI-Aktionen
Sprecher: Leonard Kriese

3.7. Strategiespiele
Sprecher: Evgeniya Shipova

10.7. Sport
Sprecher: Florian Hofmann