Wie viele Wörter gibt es in Englisch

Die schlechte Nachricht hat Wolfgang Klein in einer unscheinbaren Fußnote versteckt: Als der Linguist bei den Vorarbeiten zum „Ersten Bericht zur Lage der deutschen Sprache“ hervorragende Wissenschaftler befragte, was jeweils die prägenden Texte ihres Fachs für einen bestimmten Zeitraum seien, war das Ergebnis „etwas traurig“. Für manche Fächer gibt es in den letzten zwei oder drei Jahrzehnten nur noch wenige wirklich wichtige deutschsprachige Texte. Von dieser Seite ist also keine Bereicherung des deutschen Wortschatzes zu erwarten.

Grund zu apokalyptischen Befürchtungen über den Untergang der deutschen Sprache besteht dennoch nicht. Denn eigentlich fällt Kleins Bilanz durchaus positiv aus. Der von ihm verfasste Abschnitt des „Reichtum und Armut der deutschen Sprache“ betitelten Berichts untersucht die Entwicklung des Wortschatzes. Auf der Basis von bisher einzigartigem umfangreichen statistischen Material kommt der Direktor des Max-Planck-Instituts für Psycholinguistik und Leiter des „Digitalen Wörterbuchs der Deutschen Sprache“ zu dem Ergebnis, es könne von irgendeiner „Verarmung“ des Deutschen keine Rede sein: „Die heutige deutsche Sprache verfügt über einen überaus reichen Wortschatz, der weit jenseits dessen liegt, was je in einem Wörterbuch beschrieben worden ist.“

Der „Grimm“ kennt 350.000 Wörter

Im Rechtschreib-Duden stehen rund 135.000 Stichwörter. Das zehnbändige „Große Wörterbuch der deutschen Sprache“ aus dem Duden-Verlag, das umfangreichste aus jüngerer Zeit, zählt 200.000. Die Duden-Redaktion ist sich – im Gegensatz zu vielen Wörterbuchbenutzern – aber darüber im Klaren, dass das keineswegs alle deutschen Wörter sind. Sie geht 300.000 bis 500.000 aus. Auf etwa 70.000 wird der so genannte Standardwortschatz geschätzt, der Rest gehört eher Fachsprachen, Jargons und regionalen Dialekten an.

Im „Deutschen Wörterbuch“ von Jacob und Wilhelm Grimm sind etwa 350.000 Stichwörter verzeichnet. Allerdings sind einige Begriffe ausgestorben, seitdem die Brüder 1838 mit der Arbeit begannen. Andere fehlen, weil die Grimms und ihre Nachfolger Fremdwörter nur sehr spärlich aufnahmen und weil unzählige Wörter im 19. und 20. Jahrhundert erst dazu kamen, als die entsprechenden alphabetischen Bände längst abgeschlossen waren.

Für das Englische sind 620.000 Wörter gezählt

Zum Vergleich: Das „Oxford Dictionary of English“, das versucht, den gesamten Wortschatz der englischen Sprache in ihrer historischen Tiefe und ihren regionalen Varianten zu beschreiben, weist derzeit etwa 620.000 Stichwörter auf. Der für die französische Sprache maßgebliche „Grand Robert“ beschreibt 100.000 Stichwörter.

Das Ziel von Wolfgang Klein und seinen Mitarbeitern war nun, von Computern anhand einer repräsentativen digitalen Textsammlung – einem so genannten „Korpus“ – auszählen zu lassen, wie viele Wörter es im Deutschen tatsächlich gibt. Dazu muss zunächst geklärt werden, was ein Wort überhaupt ist. Als Beispiel nennt Klein Absatz, bei dem beispielsweise zwischen dem Absatz in einem Text und dem Absatz von Produkten auf dem Markt unterschieden werden muss. Sind das dann zwei verschiedene Wörter oder zwei Bedeutungen desselben Wortes? Wie bringt man einem Computer bei, sie zu unterscheiden? Ähnliche Probleme stellen sich beispielsweise bei Strauß und Schloss.

Googles Schwierigkeiten mit Hegel

Kleins Korpus besteht aus einer über das ganze 20. Jahrhundert gleichmäßig gestreuten sorgfältigen Auswahl repräsentativer Texte aus folgenden Gruppen: Belletristik (Romane und Erzählungen), Zeitungen, Gebrauchstexte (wie Ratgeber, Kochbücher und Rechtstexte) und wissenschaftliche Texte aus verschiedenen Gebieten.

Wichtig ist auch, dass es gelingt, Fehler beim Scannen nachträglich auszusortieren. Klein zitiert ein wunderbares Beispiel aus Google Books, das zeigt, welche Tücken bei der Digitalisierung lauern: „bamit fo fefyr erweiterten 2lnafyft8 auf bei @cometrie überljaupf, gek.rt ljat. T-a. problem ljat bei ifym bei ftorm ber Slufgabc, gerabe Sinien fenfredit auf beliebige Jdrte einer Gur>>e ju jieben, alo woburd) @ubtangente u.f.f. beftimmt tt>irb; man begreift bie Sefriedigung, bie er bafelbft über feine Cmtbecfung, bie einen Q.v genftanb >>on allgemeinen wiffenfdjaftlidjcn Sntcresse ber bamaltget.“ Es handelt sich um eine gescannte Passage aus Hegels „Wissenschaft der Logik“. Nun ist Hegel bekanntlich keine leichte Lektüre, aber so unverständlich schrieb noch nicht mal er. Hier war schlicht die Texterkennungssoftware von der Frakturschrift überfordert. Allein das schöne deutsche Wort fefyr kommt, laut Klein, 94.00 Mal in Google Books vor – es entspricht dem in Fraktur geschriebenen Wort sehr.

Drei „Zeitscheiben“

Nachdem all diese Fehlerquellen einigermaßen ausgeschlossen bzw. mit statistischen Methoden herausgerechnet waren, ergab sich: „In einem Textkorpus der deutschen Gegenwartssprache, das eine Milliarde Textwörter lang ist, kommen etwa 5,3 Millionen lexikalische Einheiten – also Wörter, so wie sie im Wörterbuch stehen – vor.“ 5.328.000 deutsche Wörter – das ist der Stand für die „Zeitscheibe“ von 1994 bis 2004. In den Texten aus der Nachkriegszeit 1948 bis 1957 wurden 5.045.000 Wörter gezählt, für die Zeit von 1905-1914 waren es 3.715.000.

Klein fasst zusammen: „Der deutsche Wortschatz hat im Verlauf des 20. Jahrhunderts um etwa ein Drittel (...) zugenommen. Dabei ist der Anstieg in der ersten Jahrhunderthälfte deutlicher als in der zweiten.“ Der Zuwachs besteht nur zum geringen Teil aus eigenständigen neuen einfachen Wörter wie rödeln oder mosern. Auch die Zahl der Fremdwörter wird überschätzt. Die weitaus meisten neuen Wörter sind Ableitungen (wie Zocker von zocken) oder Zusammensetzungen (wie Endlösung).

Zeitungen sind Fundgruben für neue Wörter

Die Pioniere des Wortschatzes sind übrigens keineswegs die Schriftsteller. In der Belletristik gibt es von 1905 bis 2004 die wenigsten neuen Wörter. Viel stärker ist der Zuwachs im Bereich der Gebrauchstexte, der wissenschaftlichen Prosa und vor allem der Zeitungen. Klein erklärt: „Das hat seinen Grund weniger darin, dass die Schriftsteller sprachlichen Neuerungen abhold sind, sondern darin, dass in Zeitungen immer neue Themen auftauchen, und die erfordern neue Wörter.“

Auf der anderen Seit hat sich der Kernwortschatz als erstaunlich konstant erwiesen. Bei den 20 meistgebrauchten Substantiven handelt es sich im Großen und Ganzen in allen drei Zeitscheiben um fast dieselben. Doch es gibt kleine vielsagende Verschiebungen: Gott, zum Beginn des 20. Jahrhunderts noch an elfter Stelle, taucht am Ende des Säkulums nicht einmal unter den hundert häufigsten Wörtern auf. Auch der Kaiser, 1905-1914 noch auf Platz 57, ist aus den Top 100 herausgefallen. Stattdessen haben sich Prozent und Million deutlich nach vorne geschoben.

Wir trauern um „behufs“

Ein paar Beispiele für Verluste nennt Klein auch. Droschke und weiland sind erwartungsgemäß seltener geworden. Und ganz schlimm steht es um die Präposition behufs: Sie ist „sicher ein gutes Beispiel für ein Wort, das aktiv kaum noch gebraucht wird, während es zu Beginn des 20. Jahrhunderts in wissenschaftlicher Literatur- und Gebrauchstexten durchaus noch rege benutzt wurde.“

Manche Rätselfragen kann die Statistik nicht beantworten – sie stellt sie erst: Mysteriös ist, dass dann in der Belletristik der Vierzigerjahre seltener gebraucht wurde als vorher oder nachher. Und warum benutzen Journalisten in den Zwanziger- und noch einmal in den Achtzigerjahren dann häufiger als in anderen Jahrzehnten?

Manchmal versteht man nur Bahnhof

Noch geheimnisvoller ist das Schicksal von Bahnhof: In der ersten Hälfte des Zwanzigsten Jahrhunderts kommt das Wort oft in Zeitungen vor, dann wird es seltener. Der Abfall beginnt schon in den Dreißigerjahren. In der Belletristik ist Bahnhof sowohl am Ende wie am Beginn des Jahrhunderts sehr häufig – nur von 1930 bis 1950 nicht. Vor allem in den Vierzigerjahren benutzten es Schriftsteller sehr selten. Hatte die Reichsschrifttumskammer etwas gegen Bahnhof? Es bleibt noch viel zu forschen.

Kleins Fazit ist allerdings eindeutig: „Der Wortschatz (...) ist im Verlauf der letzten hundert Jahre um mindestens eine Million Wörter angewachsen. Da der Ausdrucksreichtum einer Sprache letztlich auf ihrem Wortschatz beruht, muss man schließen, dass sich das Deutsche in dieser Zeit zu einem immer mächtigeren Instrument entwickelt hat.“

Deprimierender Ausblick auf die Wissenschaftssprache

Nur in der Wissenschaftswelt wird dieses Instrument immer seltener angewendet. Auf Nachfrage der „Welt“ erläutert Klein: „De facto ist es so, dass es kaum noch deutschsprachige Spitzenforschung gibt; soweit sie noch Weltgeltung hat, beruht sie auf englischsprachigen Arbeiten, entweder von den Verfassern selbst so geschrieben oder gelegentlich auch in Übersetzungen.“ In den Naturwissenschaften gebe es seit 30 Jahren so gut wie keinen anderen Weg als auf Englisch zu publizieren, wenn man wahrgenommen werden wolle.

Der Linguist hält diese Entwicklung für „deprimierend“: Zum einen stelle sie einen massiven Nachteil für die Forschung hierzulande dar, zum zweiten koppele sie die Spitzenforschung von den Schulen ab und zum dritten verfälsche sie inzwischen auch die Geschichte der Wissenschaften, weil entsprechende ältere Publikationen auch nicht mehr rezipiert werden: „Da ist es auch kein Trost, dass das nicht nur für das Deutsche, sondern auch das Französische oder Italienische gilt.“

Klein, Eisenberg, Eichinger, Storrer: "Reichtum und Armut der deutschen Sprache. Erster Bericht zur Lage der deutschen Sprache" (Verlag De Gruyter, 234. Seiten, 29, 95 Euro)

Quelle: De Gruyter

Wie viele Wörter gibt es in der englischen Sprache?

Die Sprache mit dem größten Wortschatz ist übrigens Englisch: Das bekannte englische Wörterbuch Oxford Dictionary of English hat im Jahr 2014 620.000 Wörter gezählt.

Wie viele Wörter hat die Englische Sprache 2022?

Welche Sprache hat mehr Wörter – Deutsch oder Englisch:“]Wie wir bereits wissen, besitzt das Englische laut dem Oxford English Dictionary um die 600.000 Wörter. Im Deutschen sind es laut dem Duden zwischen 300 000 und 350 000. Damit gibt es im Englischen also fast doppelt so viele Wörter wie im Deutschen.

Wie viele Wörter C1 Englisch?

Wenn du Niveau C1 erreichen möchtest, sollte dein Wortschatz etwa 8000 Wörter umfassen – doppelt so viel wie für B2!

Wie viele Wörter gibt es in Deutsch?

Nach führenden Sprachwissenschaftlern der deutschen Sprache umfasst der Wortschatz der deutschen Standardsprache etwa 75 000 Wörter. Je nach Quelle und Zählweise wird die derzeitige Gesamtgröße des deutschen Wortschatzes auf ca. 350 000 bis 500 000 Wörter geschätzt.

Toplist

Neuester Beitrag

Stichworte