Kausalitätsmarker als Kohärenzmittel und ihre Formalisierung für die automatische TextanalyseGemeinsames Projekt mit dem IDS Mannheim, Dr. Eva Breindl (Projektseite Mannheim) Gefördert durch die Deutsche Forschungsgemeinschaft (DFG)
Projektleitung: Professor
Dr. Manfred Stede Ziel des Gemeinschaftsprojekts war die Beschreibung der Interaktion zwischen der Verknüpfung von Sätzen durch spezifische kausale Ausdrücke im Grenzbereich von Grammatik und Lexikon (Konjunktionen, Adverbien, Partikeln) und der Herstellung kausaler Kohärenz in Texten der geschriebenen deutschen Standardsprache (Mannheimer Projektanteil) sowie die Formalisierung der Ergebnisse in Hinblick auf automatische Analyseverfahren (Potsdamer Projektanteil). Zur Modellierung der Schnittstelle zwischen (komplexen) Sätzen und Texten diente das Konzept der Diskursrelationen, wie es in RST und SDRT benutzt wird. Ausgangspunkt der Untersuchung war die enorme Variationsbreite in der Kodierung von Kausalität und die Tatsache, dass die zur Verfügung stehenden Ausdrucksmittel untereinander weder syntaktisch noch semantisch äquivalent sind. Ein zentrales Anliegen des Projekts war folglich die Bestimmung derjenigen Faktoren, die die Variation in der Kodierung kausaler Information steuern. Auf der Basis einer empirisch gestützten Analyse der Kausalmarker in ihren jeweiligen Kontextumgebungen sollte der idiosynkratisch-lexikalische Beitrag der einzelnen Marker und der Anteil bestimmter Kontextcharakteristika zur Spezifizierung von Diskursrelationen ermittelt werden. Im besonderen Rahmen des Gemeinschaftsprojekts versteht sich dieses Vorhaben vor dem Hintergrund der Einsicht, dass reinoberflächennahe Verfahren der automatischen Textanalyse mittlerweile an ihre Grenzen gestoßen sind und infolgedessen nun angestrebt wird, für computerlinguistische Anwendungen wie etwa automatische Informationsextraktion oder Textzusammenfassungen wieder verstärkt Erkenntnisse der qualitativen linguistischen Analyse nutzbar zu machen. Im computerlinguistisch orientierten Potsdamer Projektteil entstand ein XML-basiertes Lexikon kausaler Konnektoren, das in ein prototypisches Modul zur automatischen Erkennung von Begründungen in Texten mündete. Die Implementierung erfolgte im Rahmen der in der Arbeitsgruppe von Prof. Stede entwickelten Textanalyse-Werkbank MOTS (MOdulares Textanalyse System). Die (gemeinsam mit dem Mannheimer Teilprojekt zusammen getragenen) Informationen, die dem Lexikon zugrunde liegen, finden sich hier. Zudem wurde in einem (extern finanzierten) Teilprojekt ein Korpus von Hotelrezensionen manuell hinsichtlich der vorkommenden kausalen Kohärenzrelationen annotiert. Informationen finden sich hier. |