Ngrams sagen mehr als tausend Worte

Bei TED habe ich kürzlich den Google Books Ngram Viewer (books.google.com/ngrams/) kennengelernt und er lässt mich nicht wieder los.

TEDxBoston 2011 (Lieberman Aiden / Michel) von TED unter Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported

Ich war ja ohnehin schon ein großer Freund von etymologischer Forschung, Duden-ergänzender Schreibweisen-Volksbefragung per Suchmaschine und Sprachbeobachtungen (anbei eine Empfehlung für und an den Sozusagen!-Podcast von Bayern 2).
Bisher beschränkten sich die sprachanalytischen Suchmaschinen-Spielchen ja im Wesentlichen darauf, herauszufinden, welche Schreibweise oder Wortfolge im WWW besonders beliebt ist. Nun steht der gesamte Bestand der für Google Books erfassten Druckwerke als Ausgangsmaterial bereit. Statt also nur die Frage zu stellen, ob man seit 1999 mehrheitlich „der Blog“ oder „das Blog“ schreibt, kann man etwa schnell eine Grafik zur Verteilung der Worte Astronomin, Astrologe und Scharlatan in der deutschsprachigen Literatur seit 1850 erstellen. Oder zum Zusammenkommen von Geld und Liebe von 1750 bis heute?
Wie wäre es mit „gold“, „money“ & „fear“ in englischsprachiger Literatur seit 1700?
Mit dem Interesse an future & past von 1555 bis 2005?
Jetzt fange ich schon wieder damit an… Wem einfache Graphen nicht genug sind: Es gibt bei Google auch die Rohdaten zum Download.

Der Blick auf vernebelte Häuserfronten

Fortsetzung meiner Notizen zur Google-Diskussion „Ungestillter Datenhunger, ungeliebter Datenschutz“ am 18.01.2011 im Bremer Rathaus (siehe auch: Teil 1).
Auch Google Street View stand auf der Liste. Klöker moderierte an: Macht die Vernebelung bzw. Verpixelung von ganzen Straßenzügen den Dienst für Google Deutschland uninteressant?

Meyerdierks: Street View ist für Google Deutschland sicherlich nicht uninteressant, sonst hätten wir uns auch nicht die Mühe gemacht, das Produkt trotz der Widerstände auf den Markt zu bringen. Street View wird von Anfang an (auch bevor deutsche Städte dabei waren) von Deutschland aus intensiv genutzt. Interessant ist, dass einige Nutzer aus anderen Ländern bei Google angefragt haben sollen, warum denn Deutschland so anders aussieht als andere europäische Länder.

Dr. Sommer: Alles in allem ist das für Google Deutschland wohl jetzt schon eine ganz erfolgreiche Geschichte. Beachtenswert ist, dass das wohl der erste und vielleicht letzte Anwendungsfall eines Vorab-Widerspruchs dieser Art in Deutschland war.
Microsoft (mit bing Maps) war wohl etwas unvorsichtig mit der schnellen Zusage, all das einzuhalten was zwischen Google und den Datenschützern vereinbart wird. Für andere Anbieter solcher Geo-Dienste entstehen durch den 13-Punkte-Plan keine Verpflichtungen.

(Kleiner Exkurs: Das Dokument mit den 13 Zusagen von Google zu Street View an den Hamburgischen Beauftragten für Datenschutz und Informationsfreiheit ist derzeit nicht mehr im Internetangebot des LfDI FHH abrufbar, da dieses aus Datenschutzgründen durch den LfDI offline gestellt wurde. Exkurs: Beim Aufruf von Zählpixeln der Informationsgemeinschaft zur Feststellung der Verbreitung von Werbeträgern e.V. – IVW – werden IP-Adressen an den von der IVW beauftragten Dienstleister INFOnline übertragen. Dort werden zwar ausschließlich aggregierte Daten weiterverarbeitet, der LfDI hat aber offenbar Zweifel an der Rechtmäßigkeit der Speicherung der IP-Adressen zum Zweck der Aggregation. Kompliziert.)

Sommer bedauert, dass es eine gesetzliche Klarstellung nicht geben wird. Die Länder hatten sich zwar Mitte 2010 im Bundesrat auf einen Gesetzentwurf zur Änderung des Bundesdatenschutzgesetzes geeinigt. Das Gesetzesvorhaben ist allerdings vom Bundeskabinett nicht weiterverfolgt worden.
Allerdings haben sich die wichtigsten Anbieter von Geodatendiensten auf eine Selbstverpflichtung geeinigt, formuliert unter Federführung des Verbands BITKOM.

Klöker: Warum hat sich Google auf Verhandlungen eingelassen?
Meyerdierks: Im Grunde wollten wir Street View einfach so einführen wie in anderen europäischen Ländern. Nun entstand aber in Deutschland ein intensiver öffentlicher Druck auf uns. In der Hoffnung auf mehr Planungssicherheit und Ruhe bei der Produkteinführung haben wir uns für ausführlichere Gespräche mit den Datenschutzbehörden im Vorfeld entschieden. Trotz der schon im April vereinbarten Schritte kam es dann immer Sommer noch zu einer breiten öffentlichen Diskussion.
Fassadenansichten sind öffentlich zugängliche Informationen und sollten es auch bleiben. Wenn man jemandem das Recht abspricht, Straßenpanora-Aufnahmen zu verbreiten, spricht man sich auch selber das Recht ab Panoramafotos aus dem Urlaub ins Netz zu stellen. Es gibt heute schon Widersprüche gegen nutzergenerierte Fotos. (Hat das mit der Aktion „Verschollene Häuser“ zu tun?)

Sommer: Warum hat Google den gewaltigen Aufwand mit dem Vorab-Widerspruch betrieben?
Meyerdierks: Der Aufwand war tatsächlich groß, er überstieg den Aufwand zur Herstellung des Produkte um ein Vielfaches. Es gab etwa 200 Leute, die nur damit beschäftigt waren, Widersprüche zu bearbeiten. Ein mittelständisches Unternehmen hätte so etwas nicht leisten können. Übrigens müssen wir Personen, die ihren Widerspruch jetzt zurücknehmen wollen enttäuschen, da wir auch die Rohdaten gelöscht haben.

Video: Google über Datenschutz bei Street View

Sommer: Spätestens wenn in Street View Werbung geschaltet wird, sollte sich das Geld wieder hereinholen lassen. [Meyerdierks lächelt vielsagend. Ich frage mich, ob nicht vielleicht sogar verpixelte Häuserfronten für Werbebanner besonders gut geeignet sind?]

In Kürze mehr zu: Geodaten, Open Data und Informationsfreiheit