Wo ist die Pampelmuse geblieben?

30.000 Wörter katalogisieren und sprachlich beschreiben  – das ist das ehrgeizige Ziel des „Zentrums für digitale Lexikographie“. Wie die Begriffe ausgewählt werden und was das mit Pampelmusen zu tun hat, erläutert Computerlinguist Alexander Geyken.

So sieht es aus, wenn ein Computer die häufigsten sprachlichen Verbindungen eines Wortes untersucht. © BBAW/ZDL

Herr Geyken, Sie wollen mit der Förderung durch das BMBF die Veränderungen der deutschen Sprache auf einer digitalen Plattform darstellen. Gibt es so etwas nicht schon längst?

Alexander Geyken: Die bisherigen Werke sind sehr verdienstvoll, haben aber auch einige Lücken. Diese sind auch dadurch entstanden, dass die bekannten Großwörterbücher zuletzt nicht mehr konsequent weitergeführt wurden. Das Großwörterbuch des Dudens zum Beispiel wird seit 2013 nur noch in sehr bescheidenem Umfang bearbeitet. Ähnlich sieht es bei anderen bekannten Publikationen aus. Aktuell gibt es kein Projekt, das sich der deutschen Sprache mit einer gewissen historischen Tiefe annimmt. Und das, obwohl das Deutsche als eine der wichtigen Kultursprachen der Welt über einen sehr reichhaltigen Wortschatz verfügt.

Wo fangen Sie dabei an?

Zum Glück nicht bei Null. Wir stützen uns auf schon bekannte Werke und überarbeiten diese. Uns stehen jetzt schon etwa 170.000 Wörter aus verschiedenen Quellen zur Verfügung. 30.000 Wörter wollen wir neu erfassen, sodass der Gesamtbestand auf 200.000 steigt. Wir haben also noch einiges zu tun.

Geyken_Poträt
Alexander Geyken ist Arbeitsstellenleiter des Berliner Teilprojekts. © BBAW/ZDL

Wie wählen Sie die Wörter aus, mit denen Sie sich befassen?

Computer durchforsten für uns große Mengen an Text und bewerten unter anderem, wie oft ein Wort vorkommt und in welchem Kontext. Wir prüfen dann in jedem Fall einzeln, ob ein Vorschlag des Computers wirklich würdig für eine Aufnahme in das Wörterbuch ist, oder wie wir in der Werkstattsprache sagen: gebucht werden kann. Über die reine Worthäufigkeit hinaus spielen dabei für uns die semantische Relevanz für den Wortschatz, also der Gebrauchswert, sowie auch eine ausreichende zeitliche und textsortenübergreifende Verteilung die entscheidende Rolle.

Was passiert mit einem Wort, das es in das Wörterbuch „schafft“?

Es gibt verschiedene Möglichkeiten. Häufig stellen wir einfach nur fest, dass es dieses Wort gibt. Wir versehen es mit grammatischen Angaben, wie man zum Beispiel den Plural und den Genitiv bildet. Damit ist die erste Etappe abgeschlossen. Die zweite besteht darin, die Bedeutung des Wortes zu ermitteln. Dafür schauen wir uns wieder die maschinelle Auswertung der Texte an. Wir betrachten dabei die direkte Umgebung des Wortes und schließen aus den jeweiligen Satzkontexten auf die Bedeutung. In einem letzten Schritt stellen wir sprachliche Verbindungen dar, die das Wort oft eingeht. Für das Wort „Interview“ wäre eine solche typische Verbindung zum Beispiel „führen“. Oder auch „beenden“ (lacht).

Bitte noch nicht! Welchen Nutzen hat der normale Bürger von Ihrem Projekt?

Jeder kann bereits jetzt über das in das ZDL integrierte „Digitale Wörterbuch“ (www.dwds.de) online nach Schreibweisen, Bedeutungen oder Herkunft von Wörtern suchen – kostenfrei und ohne Anmeldung. Wir wollen, dass die Nutzerinnen und Nutzer ausgehend von der Gegenwartssprache einen Ausflug in die Vergangenheit unternehmen können. Damit leisten wir auch einen Beitrag zum Erhalt unserer Kultur.

Warum verändert sich Sprache überhaupt?

Das lässt sich am besten erklären, denkt man an die vergangenen 30, 40 Jahre zurück. Es gab viele technologische Veränderungen, neue Geräte, für die ein neuer Begriff benötigt wurde. Das beste Beispiel dafür ist vielleicht das „Smartphone“. Andererseits gibt es gesellschaftspolitische Debatten, die neue Begriffe begründen, denken Sie an „Fakenews“. Drittens gibt es einen starken Einfluss der Globalisierung auf das Deutsche, meistens durch englische Begriffe. Wer kennt schon heute noch die „Pampelmuse“? Fast alle sprechen von „Grapefruit“.

Ein anderes prominentes Beispiel ist das Wort „geil“, das noch vor drei Jahrzehnten als extrem vulgär galt. Heute ist es Teil der jungen Sprache. Wie kommt das?

Diese Frage habe ich mir noch nicht gestellt, aber ich kann Ihnen sagen, wie ich sie untersuchen würde: indem ich mir den Kontext ansehe, in dem das Wort früher und heute gebraucht wird. Das heißt, ich schaue mir Romane an, Ratgeber, Jugendmagazine und ähnliches. Wenn man das über einige Jahre hinweg untersucht, kann man erkennen, wie oft das Wort verwendet wird, in welchem Zusammenhang, und kann daraus auf die stilistische Veränderung des Wortes schließen.

Herr Geyken, wir danken Ihnen für das Gespräch.

Zur Person

Alexander Geyken ist Arbeitsstellenleiter des Projekts "Digitales Wörterbuch der deutschen Sprache" (DWDS) an der Berlin-Brandenburgischen Akademie der Wissenschaften. Er studierte Mathematik und Linguistik in München, Freiburg und Paris. 1998 promovierte er im Fach Computerlinguistik an der Universität München.