Dr. Roland Stuckardt

IT-Beratung - Sprachtechnologie - Medienanalyse

ROSANA

Das ROSANA-System

Dem Anaphernresolutionssystem ROSANA, das das Kernergebnis meiner Forschungsarbeiten darstellt, liegt der Anspruch einer derartigen, uneingeschränkt algorithmischen, robusten, massendatentauglichen Interpretation pronominaler Ausdrücke zugrunde. ROSANA steht für

Robuste syntaxbasierte Interpretation anaphorischer Ausdrücke

Als zentrales Problem wird die robuste Verarbeitung ggf. partieller, d.h. potentiell fragmentarischer syntaktischer Voranalysen thematisiert. Diese Problemstellung ist deshalb von besonderer Relevanz, weil der syntaktische Kontext sprachlicher Ausdrücke bekanntermaßen in entscheidender Weise die referentiellen Interpretationsoptionen ko-determiniert. In der gegenwärtigen Implementierung baut das ROSANA-System auf den syntaktischen Analysen des robusten FDG (Functional Dependency Grammar) Parser for English auf. Die dem Kernsystem zugrunde liegenden Algorithmen sind jedoch prinzipiell auch für andere Sprachen (insbesondere Deutsch) geeignet.

In seiner konsequenten Ausrichtung auf die Anforderungen einer robusten, massendatentauglichen Analyse ist ROSANA auf der Ebene der Softwaresysteme angesiedelt, die im Rahmen der Message Understanding Conferences evaluiert wurden. Das ROSANA-System wurde in Common Lisp implementiert und in Anlehnung an die einschlägigen Evaluationsmaße der MUCs auf einem potentiell anwendungsrelevanten Korpus von Nachrichtenagentur-Meldungen formal evaluiert. Für weitere Details, ein Beispiel sowie die Ergebnisse der Evauation vgl. die ausführliche Beschreibung von ROSANA (vgl. entsprechende Menueunterpunkte) sowie meine Dissertation. [PDF, 2744k, gzipped]

Aktuelle Seite: Start Inhaltsanalyse ROSANA