Sommersemester 17

Sprechstunde: Montag 13-14 (Anmeldung per email)

Sentimentanalyse in Linguistik und Computerlinguistik

Seminar, Mo 10-12, II.05.110, Moodle-Seite
Sentimentanalyse hat sich in den vergangenen Jahren zu einer sehr populären Anwendung der Computerlinguistik entwickelt. Wir erarbeiten das Thema sowohl aus linguistischer als auch aus anwendungsnaher CL-Perspektive: Was bedeutet der Begriff der "Subjektivität" und was sind ihre sprachlichen Ausdrucksmittel? Was sind die wesentlichen Ansätze zur automatischen Sentimentanalyse, wie funktionieren sie, und wozu kann man sie verwenden?
Leistungserfassung: Referat und Hausarbeit oder Semesterprojekt
Modul (B.Sc. L/CL): AM4
Literatur: B. Liu: Sentiment Analysis and Opinion Mining. Morgan and Claypool, 2012

Korpuslinguistische Untersuchungen zur Veränderung von Wortbedeutungen durch Medienge- und missbrauch (mit M. Zimmermann)

Seminar, Fr 10-12, II.14.029, Moodle-Seite
Sprache wird von Sprachbenutzern nicht nur benutzt, sondern auch geprägt, das heißt: für die weitere Benutzung verändert. Kommen Medien ins Spiel, kann diese Prägung gezielt eingesetzt werden, um politische, wirtschaftliche oder auch persönliche Interessen zu verfolgen. Auf der politischen Ebene ist dies beispielsweise in John Orwells "1984" ausgeführt. Auf der wirtschaftlichen Ebene ist uns allen die Verbreitung einprägsamer Werbeslogans wohlbekannt. Aus sprachphilosophischer Sicht wird das Thema prominent bei Foucault diskutiert ("Die Ordnung des Diskurses").
Die zielgerichtete Beeinflussung von öffentlichen Diskursen trifft nun die Linguistik an (zumindest) zwei Stellen, die uns im Seminar beschäftigen werden. (i) Für das mentale Lexikon ist einerseits die Neuschöpfung von Begriffen interessant, noch mehr aber die "Umdeutung" von bestehenden Begriffen bzw. ihre Verbindung mit neuen (positiven oder negativen) Konnotationen. Wir untersuchen dies an Beispielen aus der Zeit des Dritten Reichs (z.B. anhand von Viktor Klemperers "LTI"), der deutschen Teilung, und der Gegenwart und fragen, inwieweit Modelle der lexikalischen Semantik solche Prozesse abbilden können. (ii) Für die Erfassung von "Umdeutungen" stehen Korpora zur Verfügung, die uns erlauben, einerseits einfache Frequenzveränderungen der Wortverwendung zu beobachten, andererseits die Assoziation von Wörtern untereinander zu bestimmen, und wiederum deren Veränderung über die Zeit. Dafür relevante Ressourcen und Methoden werden vorgestellt. Die Seminarteilnehmer sollen eigene Studien zu Einzelwörtern oder Wortfeldern durchführen und die Ergebnisse interpretieren (Projektarbeit).
Modul (B.Sc. L/CL): AM 6

Knowledge-based text summarization (with T. Schaub)

Project, Tue 16-18, III.06.H03 Course starts April 25!
Module: M.Sc. CogSys PM1, PM3

Annotation technology

Project, Tue 10-12, 14.009 Course starts April 25!
Module: M.Sc. CogSys PM1
Annotated data is the basis of supervised ML in CompLing. We first survey the "market" of tools for manual annotation, pointing out their utility for different types of annotation, and then turn to the technical side of underlying data models and formats. A focal point will be the handling of multi-layer annotated text corpora, as exemplified in the linguistic database Annis3.
Reading:Various chapters of Ide/Pustejovsky (eds.): Handbook of Linguistic Annotation, Springer 2017


-->