Methoden der Dialogmodellierung, SoSe 2006

David Schlangen (et al.)

email:

[ Achtung: alle den Kurs betreffende Korrespondenz bitte über ]

Office: Haus 24, Room 1.51
Office Hour: Nach Vereinbarung, normalerweise Montags 14h-15h
Class: Mittwoch 11--13h
Room: <blink>14.102</blink>

[this document: http://www.ling.uni-potsdam.de/~das/teaching/mdm_sose06.html]




Kursbeschreibung: In dieser Veranstaltung wird es um die computationale Modellierung von Dialogverhalten in praktischen Computersystemen gehen. Wir werden uns hauptsächlich der Komponente des Dialogue Managers widmen, die die Reaktion des Systems auf den Input des Benutzers bestimmt (und damit das Dialogmodell im engeren Sinne implementiert), werden aber auch andere Komponenten kennenlernen, die durch ihre Eigenschaften die Möglichkeiten dieser Komponente einschränken und mitbestimmen (z.B. automatic speech recognition und speech synthesis).
Die behandelten (und zu referierenden) Papers werden im BSCW des Kurses zu finden sein (siehe unten für Details zum Zugang) oder, wenn nur in Papierform vorhanden, im Reader bei der Fachschaft.
Teile des Kurses werden auf Englisch gehalten (siehe unten), mindestens die Referate am 31.5. müssen ebenfalls auf Englisch gehalten werden (an anderen Terminen optional).


Zur Anmeldung / Vorbereitung:
  • Der Kurs ist zulassungsbeschränkt, also bitte im Sekretariat einschreiben.
  • Bitte richten Sie sich einen Account auf dem Linguistik-Wiki ein (hier), falls Sie noch keinen haben. Teil der Anforderung für den Kurs ist das gemeinsame Erstellen von Zusammenfassungen der Sitzungen (siehe unten).
  • Bitte melden Sie sich zusätzlich noch per email bei mir an:
    • Subject: "Anmeldung <Ihr Vorname> <Ihr Nachname>"
    • Als Text der email bitte Ihren Benutzernamen im Wiki (siehe voriger Schritt), damit ich später dann Änderungen im Wiki zuordnen kann.
    • Empfängeradresse: .
    Ich richte Ihnen dann einen Zugang zum BSCW ein (beziehungsweise schalte Sie für den Ordner des Kurses frei, falls Sie schon einen Account haben) und trage Ihre Adresse in die Mailingliste für den Kurs ein.



Anforderungen:
  • Alle Teilnehmer müssen ein Referat übernehmen, zu einem der unten aufgeführten Themen (ca. 50 Minuten Studentenpräsentationen insgesamt pro Sitzung, max 2. Vortragende pro Thema). Dazu sollen Folien vorbereitet werden, die aber eher zur Diskussionsführung gedacht sind (siehe Hinweise unten).
    D.h., ich erwarte auch von den nicht-Vortragenden rege Beteiligung. Selbstverständlich sollte sein, dass alle Teilnehmer den jeweiligen Text gelesen haben.
  • Es wird, wenn passend, auch kurze praktische Übungen geben während der Sitzungen; Mitarbeit dabei ist Teil der Benotungsgrundlage.
  • Ebenso soll nach jeder Sitzung eine Zusammenfassung der Diskussion erstellt werden (ab der 3. Sitzung, genaue Fragestellung siehe jeweils Eintrag unten zur Sitzung), und zwar wie folgt:
    • Alle Teilnehmer (außer den jeweiligen Referenten) erstellen eine kurze Zusammenfassung der Diskussion während der Sitzung (bezüglich der jeweiligen Fragestellung, siehe Einträge für Sitzungen unten).
    • Dafür haben Sie knapp eine Woche Zeit, bis 0 Uhr (Mitternacht) des auf die Veranstaltung folgenden Montages, dann schicken Sie diese Zusammenfassung an mich per email (an die Kursadresse!!).
    • Ich leite dann am Dienstag Vormittag die Zusammenfassungen (anonymisiert) weiter an die Referenten (der zusammengefassten Sitzung) weiter, welche daraus bis 0 Uhr (Mitternacht) des darauf folgenden Dienstages (also des Vortages der nächsten Veranstaltung) eine kanonische Zusammenfassung generieren, die sie auf die entsprechende Wiki-Seite eintragen. Diese Zusammenfassung gehen wir dann kurz durch zu Beginn der Veranstaltung.
    • Ganz einfach, oder?
  • Hausarbeiten: Proseminarsschein ca. 5-10 Seiten Literaturarbeit; Hauptseminarsschein ca. 15-20 Seiten mit substantiellem Eigenanteil. Formatvorlagen finden sich hier!



Hinweise für Referate: Folgende Fragen (u.a.) sollten beantwortet (und prominent auf den Folien dargestellt) werden:
  • Was ist die zentrale These des Papers, was sind wichtige Merkmale des beschriebenen Ansatzes?
  • Wie wird die These / der Ansatz begründet?
  • Welche möglichen Einwände werden nicht behandelt?
  • Wie könnte man die These / den Ansatz experimentell testen / wurde sie getestet?
  • Wie stehen die These / der Ansatz im Zusammenhang zum bisher behandelten?
Bitte Distanz zum Text wahren; zusammenfassen &, wenn angemessen, Inhalte auch mal anders strukturieren als in der Vorlage; Referenzen nachgehen, aber immer belegen. ("Wie (Musterman et al. 2003) behaupten...")



Kursplaner:
# Datum Titel, Thema, Lektüre, etc.
1 19/04/ Organistorisches; Einleitung I.
Leitung: D.S.
Referenten: --

Thema: Worum geht's in der Veranstaltung, was sind die Anforderungen, etc. From structured dialogue to self-organised / locally managed dialogue, from Voice User Interface (VUI) to Spoken Dialogue Systems (SDSs) to Conversational Agents (CAs).

Required Reading:
Background Reading: (Schlangen 2005; Allen 1995, Ch. 17)

Für Referenten:
Für Alle:
2 26/04/ Einleitung II.
Leitung: D.S.
Referenten: --

Thema: Forsetzung der Einleitung... Link zu Sphinx-4 (Spracherkenner) und FreeTTS (Text-To-Speech), beides open source und in Java.

Required Reading:
Background Reading: (siehe 19/04/)

Für Referenten:
Für Alle:
3 03/05/ Finite State-based DM (and beyond)
Leitung: D.S.
Referenten: Marcus Thienert, Jan Baresel

Thema: Die einfachste, aber auch immer noch weitestverbreitete, Methode der Dialogmodellierung ist es, Skripte zu entwerfen, die den legalen (= vom System beherrschten) Dialogfluss beschreiben. (Formal entsprechen solche Skripte endlichen Automaten.) In dieser Sitzung wird diese Methode vorgestellt (anhand von Beispielen aus dem CSLU Toolkit, das, leider nur für Windows, frei erhältlich ist) und ihre Beschränkungen werden diskutiert.

Required Reading: (McTear, 1998; Goddeau et al., 1996; Rudnicky & Xu, 1999)
Background Reading:

Für Referenten: Für Alle: Zusammenfassung "Pro und Contra Structured Dialogue".
4 10/05/ Information State Update-based DM
Leitung: D.S.
Referenten: Natalie Herndon, Felix Engelmann

Thema: In dieser Sitzung wird eine Methode behandelt, Dialog-Management lokaler zu machen im Vergleich zu Finite-State-basierten Modellen. Beim ISU-DM wird die für die weitere Führung des Dialoges relevante Information über den Zustand desselben in einer "Information State" genannten Datenstruktur repräsentiert; die Reaktion des Systems wird mit Hilfe von Regeln bestimmt, die auf dieser operieren (ein Update herbeiführen). Im weiteren Sinne definiert die ISU-Methode nur einen Formalismus, innerhalb dessen sich verschiedene Ansätze realisieren lassen, u.a. der aus der vorherigen Sitzung und der aus der nächsten Sitzung. Deshalb wird in dieser Sitzung auch eine Realisierung dieses Ansatzes besprochen, Staffan Larssons "Issue-Based Dialogue Management".

Required Reading: (Traum & Larsson, 2003; Larsson 2002)
Background Reading:

Für Referenten: Es lohnt sich vielleicht, mal einen Blick auf die Seite des TrindiKits zu werfen (Rahmen-Implementation des ISU-Ansatzen), und die von GoDiS (Instantiierung in Beispiel-Dialogsystem).
Für Alle:
5 17/05/ Agent-based DM
Leitung: D.S.
Referenten: Anna Iwanow, Katharina Moczko

Thema: Der hier besprochene Ansatz geht am weitesten in Richtung Modellierung eines Agenten, indem Elemente aus der (klassischen) KI wie Belief, Desire, Intentions, Obligations benutzt werden.

Required Reading: (Allen et al. 1995, Allen et al. 2000)
Background Reading: (Allen & Perrault 1980) [in reader], (Allen 1995, Ch.17) [in reader]

Für Referenten:
Für Alle:
6 24/05/ Data-Based DM
Leitung: D.S.
Referenten: Christian Sander, Andreas Hildebrandt

Thema: Diese Sitzung führt zurück zu Automaten-basierten Modellen, mit dem Unterschied, dass die hier besprochenen Methoden es erlauben, die "Skripte" autmatisch (basiert auf Korpora von Interaktionen) zu `lernen'. Es soll hier die Methode des reinforcement learnings eingeführt werden. (Etwas Grundkenntnisse über HMMs wären hilfreich für die Referenten.)

Required Reading: (Singh, Litman, Kearns & Walker 2000)
Background Reading: (Sutton & Barto 1998, Ch.1-3) [in reader]

Für Referenten:
Für Alle:
7 31/05/ Theoretical DM; Semantics of Dialogue
Leitung: Raquel Fernández
(Zur genaueren Absprache des Referats bitte an wenden.)
Referenten: Andreas Peldszus, Jana Götze

Thema:

Required Reading:
Background Reading:

Für Referenten:
Für Alle:
8 07/06/ Gestures
Leitung: Andrea Corradini
(Zur genaueren Absprache des Referats bitte an wenden.)
Referenten: Uta Kaltwaßer, Titus v.d. Malsburg

Thema:

Required Reading:
  • Gesture and Speech: (Krauss 1998; Kraus & Hadar 1999; Wilcox 2004)
  • Gesture and Technical Multimodal Systems: (Sharma et al. 1996; Cassell & Stone 1999; Wilson, Bobick & Cassell 1997)
Background Reading: (Kendon 1996) [ Hier als Webseite, mit weiterführender Bibliographie. ]

Für Referenten:
Für Alle:
9 14/06/ Error Handling / Recovery; Grounding
Leitung: D.S.
Referenten: Andrei Litvinov, Jürg Schlegel

Thema:

Required Reading: (Clark & Schaefer 1987, Larsson 2003) ; (Walker et al. 2000, Gabsdil & Lemon 2004, Schlangen 2004)
Background Reading:

Für Referenten:
Für Alle:
10 21/06/ Embodied Conversational Agents
Leitung: Andrea Corradini
(Zur genaueren Absprache des Referats bitte an wenden.)
Referenten: Johannes Bubenzer, Mathias Lenz

Thema:

Required Reading: (Cassell et al. 1999; Massaro, Bosseler and Light 2003; Johnson, Rickel & Lester 2000; Li, Nakano & Nishida 2004; Beun, de Vos & Witteman 2003; Massaro, Ouni, Cohen & Clark 2005)
Background Reading: (Pelachaud & Poggi 2002)

Für Referenten:
Für Alle:
11 28/06/ Evaluation of SDSs
Leitung: D.S.
Referenten: Angelika Adam, Norman Rosner

Thema:

Required Reading: (Walker et a. 2001, Dybkjaer et al. 2004, Larsen 2004)
Background Reading:

Für Referenten:
Für Alle:
12 05/07/ The View from the Real World: Developing Commercial SDSs
Leitung: Jörn Kreutel, semantic edge GmbH, Berlin
(Zur genaueren Absprache des Referats bitte an wenden.)
Referenten: Johannes Schröder, Martin Schwietzke

Thema:

Required Reading: (Carpenter et al. 2002, Balchandran & Boyer 2004, Huerta et al. 2004), (Scansoft inc. (aka Nuance) 2005, Chapter 1)
Background Reading:

Für Referenten:
Für Alle:
13 12/07/ Abstract Dialogue Modelling
Leitung: Jörn Kreutel, semantic edge GmbH, Berlin
(Zur genaueren Absprache des Referats bitte an wenden.)
Referenten:

Thema:

Required Reading: (Book & Gruhn 2004, de Paula et al. 2003, Berti & Paternò 2003, Barnett 2005)
Background Reading:

Für Referenten:
Für Alle:
14 19/07/ Fazit
Leitung: D.S.
Referenten:

Thema:

Required Reading:
Background Reading:

Für Referenten:
Für Alle:
--> Literaturangaben