Die gewachsenen Möglichkeiten, Sprache in Form von Texten oder Tonaufnahmen elektronisch zu speichern und auszuwerten, könnten bisherige Forschungsmethoden in der Sprachwissenschaft und in den Geistes- und Kulturwissenschaften revolutionieren. Um die großen Datenmengen verwalten, bearbeiten, analysieren und nutzbar machen zu können, müssen jedoch neue Werkzeuge entwickelt werden. Dieser Aufgabe stellt sich der Leibniz-WissenschaftsCampus „Empirical Linguistics and Computational Language Modeling“.

Zu den Forschungsschwerpunkten gehören unter anderem die Aufbereitung und statistische Analyse umfangreicher Sprachressourcen. Die beteiligten Sprachwissenschaftler, Computerlinguisten und Informatiker wollen darauf aufbauend innovative Sprachverarbeitungsmodelle für das Deutsche entwickeln. Diese Modelle sollen es ermöglichen, Sprache verschiedener Genres und Domänen automatisch zu analysieren und damit eine verbesserte Interpretation von Sprachkorpora unterschiedlicher Herkunft und Anwendungsfelder zu leisten – von Texten der sozialen Medien über gesprochene Sprache bis hin zu fachsprachlichen und literarischen Texten.

Darüber hinaus wollen die Wissenschaftlerinnen und Wissenschaftler diese Methoden und Werkzeuge auch für neue Forschungsfragen in den sogenannten Digital Humanities („digitale Geisteswissenschaften“) nutzbar machen.

Sprecher
Prof. Dr. Andreas Witt
Leibniz-Institut für Deutsche Sprache (IDS), Mannheim
T 0621 15 81 165
witt@ids-mannheim.de
Koordination
Antonina Werthmann
Leibniz-Institut für Deutsche Sprache (IDS), Mannheim
T 0621 1581 307
werthmann@ids-mannheim.de