Download
Hauptseite
Publikationen
Lehre
Online-Demos
Download
Linksammlung Statistische Maschinelle 
	   Übersetzung
Links


  • Software
    • UIMA-Wrapper für den deutschen Chunker von Helmut Schmid und Sabine Schulte im Walde.
    • DISCO: semantische Worträume in 8 Sprachen und Java-API zur Bestimmung der semantischen Ähnlichkeit zwischen Wörtern
    • Graphen-Visualisierungsprogramm GRAVIS.
    • Perl-Skripte zur Bestimmung der Termrelevanz nach dem tf-idf-Maß:
      • df.pl: Gibt eine Liste mit den Dokumenthäufigkeiten aller Terme in den Dateien im Eingabeverzeichnis aus.
      • tfidf.pl: Berechnet die Relevanz der Terme in einer Eingabedatei (anhand der vom obigen Skript df.pl ausgegebenen Dokumentfrequenzliste) und gibt eine nach Relevanz sortierte Termliste aus.
      Mehr Informationen über Termrelevanz stehen auf dieser Seminarfolie.

  • Wortlisten (zur freien Verwendung, Public Domain)

© 1999-2012 Peter Kolb   |  1.1.2012