Ngrams sagen mehr als tausend Worte

Bei TED habe ich kürzlich den Google Books Ngram Viewer (books.google.com/ngrams/) kennengelernt und er lässt mich nicht wieder los.

TEDxBoston 2011 (Lieberman Aiden / Michel) von TED unter Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported

Ich war ja ohnehin schon ein großer Freund von etymologischer Forschung, Duden-ergänzender Schreibweisen-Volksbefragung per Suchmaschine und Sprachbeobachtungen (anbei eine Empfehlung für und an den Sozusagen!-Podcast von Bayern 2).
Bisher beschränkten sich die sprachanalytischen Suchmaschinen-Spielchen ja im Wesentlichen darauf, herauszufinden, welche Schreibweise oder Wortfolge im WWW besonders beliebt ist. Nun steht der gesamte Bestand der für Google Books erfassten Druckwerke als Ausgangsmaterial bereit. Statt also nur die Frage zu stellen, ob man seit 1999 mehrheitlich „der Blog“ oder „das Blog“ schreibt, kann man etwa schnell eine Grafik zur Verteilung der Worte Astronomin, Astrologe und Scharlatan in der deutschsprachigen Literatur seit 1850 erstellen. Oder zum Zusammenkommen von Geld und Liebe von 1750 bis heute?
Wie wäre es mit „gold“, „money“ & „fear“ in englischsprachiger Literatur seit 1700?
Mit dem Interesse an future & past von 1555 bis 2005?
Jetzt fange ich schon wieder damit an… Wem einfache Graphen nicht genug sind: Es gibt bei Google auch die Rohdaten zum Download.

telefreizeit

Freie Zeit, die IT-gestützt ortsunabhängig genutzt wird.

Ngrams sagen mehr als tausend Worte