Häufigkeit

Die Angaben zur Worthäufigkeit sind computergeneriert und wurden auf Basis des Dudenkorpus erstellt. Das Dudenkorpus ist eine digitale Volltextsammlung mit mehr als 5 Milliarden Wortformen aus Texten der letzten 25 Jahre, die eine Vielzahl unterschiedlicher Textsorten (Romane, Sachbücher, Zeitungs- und Zeitschriftenjahrgänge u. a.) repräsentieren.

Unterschieden werden 5 Häufigkeitsklassen zwischen den Polen „hoch“ und „niedrig“.

Häufigkeitsklasse Bedeutung
▒▒▒▒▒
Das Wort ist durchschnittlich mehr als 1 000 Mal in einer Million Wortformen des Dudenkorpus belegt.
▒▒▒▒
Das Wort ist durchschnittlich mehr als 100 Mal in einer Million Wortformen des Dudenkorpus belegt.
▒▒▒░░
Das Wort ist durchschnittlich mehr als 10 Mal in einer Million Wortformen des Dudenkorpus belegt.
▒▒░░░
Das Wort ist durchschnittlich mehr als ein Mal in einer Million Wortformen des Dudenkorpus belegt.
░░░░
Das Wort ist durchschnittlich seltener als ein Mal in einer Million Wortformen des Dudenkorpus belegt.

Die Worthäufigkeit entspricht nicht der Bekanntheit eines Wortes oder dessen Frequenz im gesamten Sprachgebrauch. Gesprochene Sprache und private Chats z. B. sind nicht Teil des Dudenkorpus. Die Einordnung eines Wortes in eine Häufigkeitsklasse gibt aber einen Eindruck davon, wie verbreitet das Wort im letzten Vierteljahrhundert in unterschiedlichen Schriftstücken war. Nicht berechnet wird die Worthäufigkeit bei Neuaufnahmen, Homonymen bzw. Homografen und flektierten Formen.

Auf den ersten Blick sind Tendenzen bei der Wortart erkennbar: Konjunktionen wie und oder weil finden sich in vielen Sätzen. Auch die kaum umfangreichere Gruppe der Präpositionen (von, auf etc.) ist überproportional häufig vertreten. Substantive wie Zimmerpflanze oder Kaffeemaschine hingegen sind Sprecherinnen und Sprechern nicht minder bekannt, werden aber schlicht seltener verwendet.

Viele weitere Auswertungen unserer Korpusdaten finden Sie in der Rubrik Sprache in Zahlen. Dort nennen wir unter anderem die häufigsten und längsten Wörter im Dudenkorpus, die durchschnittliche Länge eines deutschen Wortes und die häufigsten Buchstaben, den Anteil der Fremdwörter am deutschen Wortschatz u. v. m.