Korpora und Sprachressourcen in der (Computer-)linguistik
Pro/Hauptseminar, WS 2005/06
Stefanie Dipper, Michael Götze
Fr 10:00-16:00, in 24.078 bzw. im Pool
Das Seminar richtet sich an alle, die sich mit Korpora und anderen Sprachressourcen (wie semantisch-lexikalischen Netzen, Ontologien) beschäftigen wollen. Fragen, die im Seminar beantwortet werden sollen, sind z.B.:
- Welchen Nutzen haben Korpora/Sprachressourcen für die (Computer-)Linguistik?
- Welche Korpora/Sprachressourcen und Korpustools gibt es und wie nutze ich sie?
- Wie erstelle ich mein eigenes Korpus?
Die 5 Sitzungen (à 6 Stunden) gliedern sich jeweils in 2 Teile: einen theoretischen, einführenden Teil und einen praktischen, in dem die erworbenen Kenntnisse gleich umgesetzt werden in Form von praktischen Übungen am Computer (hierfür sind UNIX/Linux-Kenntnisse von Vorteil). U.a. sollen dabei eigene, kleine Korpora entstehen.
Folgende Termine sind geplant:
(jeweils freitags, 10-16h, mit Pausen, in 24.078 bzw. im Pool)
- 28.10.05: Korpora/Sprachressourcen in der (Computer-)Linguistik:
Einführung und Überblick
- 11.11.05: Erstellung von Korpora: manuelle und automatische Annotation
- 25.11.05: Nutzung von Korpora: manuelle und statistische Auswertung
- 09.12.05: Weitere Sprachressourcen (GermaNet, FrameNet etc.);
Standards in der Korpuslinguistik
- 16.12.05: Abschlusssitzung
Seminartyp: PS/HS
Zielgruppe: ab 3.FS
Leistungserfassung: Hausaufgaben und Abschlussprojekt
Module: G: Angewandte Computerlinguistik; CL-G-BM 203 Korpuslinguistik
Material: hier