Alles, was logisch mit allem anderen verbunden ist, generiert Daten, und je weniger Geld eine Wirtschaft hat, desto reichhaltiger sind diese Verbindungen. Big Data: Spielt die Größe eine Rolle?
Autor: Timandra Harkness
Herausgeber: Bloomsbury Sigma
Seiten: 304
Preis: 499
Kleine Daten: Die winzigen Hinweise, die riesige Trends aufdecken
Autor: Martin Lindström
Herausgeber: Hachette Indien
Seiten: 245
Preis: 399
Obstbaum mit lila Blüten
Die kurze Antwort auf die Frage auf dem Cover des Buches der Komikerin und Mathematik-Proselytisin Timandra Harkness lautet: Natürlich spielt die Größe keine Rolle. Es spielt keine Rolle, außer in den King Kong- und Godzilla-Filmen. Bei allen anderen ist die Herangehensweise entscheidend. Big-Data-Ansätze sind durch stark verteilte und parallelisierte Speicher- und Verarbeitungsstrategien definiert. Die Größe des Datensatzes ist sekundär, aber es beginnt wirklich zu brummen, wenn Volumes übertaktet werden.
Harkness, die eine entzückend leichte Hand hat, weist darauf hin, dass die Datenmenge da draußen – die sie sich als Terabyte-Festplatten in Koffern auf einem Gepäckwagen am Flughafen vorstellt – so schnell wächst, dass die Zahlen schon veraltet sind veröffentlicht. Alles, was logisch mit allem anderen verbunden ist, generiert Daten, und je weniger Geld eine Wirtschaft hat, desto reichhaltiger sind diese Verbindungen. Wird eine Fahrkarte über eine elektronische Geldbörse aufgeladen, die mit einem Bankkonto und einer Handynummer verbunden ist (die ständig Anruf- und Standortdaten meldet), werden genügend Daten generiert, um den Besitzer zu profilieren.
Die Kurve wird steiler, wenn das Internet der Dinge einsetzt. Mit dem Internet verbundene Autos, Kühlschränke, Gepäckanhänger, Versandpaletten und dergleichen werden Daten wie Schaum generieren, und Algorithmen werden geschrieben, um sie zu minen. Hierin liegt der operative Hauptunterschied zwischen traditionellen statistischen Methoden und Big-Data-Ansätzen: Letztere hängen vollständig von der künstlichen Intelligenz ab, die mitlernt. Sie unterrichten es zuerst in den Grundlagen der Mustererkennung und während es sich selbst verbessert, sollte es theoretisch einen Punkt erreichen, an dem es durch das Datenmeer pflügt und nach Mustern sucht, die Sie nicht erwartet haben, aber für die Sie sich interessieren würden.
Interessanterweise sucht die menschliche Intelligenz des Markenguru Martin Lindstrom nach ähnlichen Mustern. Da sie aus eher kleinen Stichprobenmengen ausgewählt werden, können seine Schlussfolgerungen je nach ihrer Nützlichkeit als anekdotisch oder als Einsicht behandelt werden. In die erste Kategorie fällt seine außergewöhnliche Beobachtung, dass Geschäftsreisende mit Anzug und Stiefel auf Flughäfen ihre Bordkarten tendenziell nach unten zeigend in der Tasche haben. Denn sie wollen verschleiern, dass sie wirtschaftlich fliegen. Dies hat einen ausgezeichneten Unterhaltungswert, aber keinen Nutzen. Diese Ehre gebührt Lindstroms Beobachtung, die sich anscheinend um Lego drehte, das gegenüber der sofortigen Befriedigung des digitalen Spielens an Boden verlor. Er fragte einen 11-jährigen Lego-Fan, was sein wertvollster Besitz sei. Es stellte sich heraus, dass es sich um ein Paar alter Turnschuhe handelte, die genau im richtigen Winkel abgenutzt waren, um der Welt zu verkünden, dass ihr Besitzer ein Champion Skateboarder war. Aus der Befriedigung richtete Lego seinen Fokus auf sichtbare Leistungsnachweise, wie die teuren Modelle des Millennium Falcon, mit denen auch Erwachsene spielen.
gelbe Blüte mit schwarzer Mitte
Aufschlussreich ist, dass Lindstrom Big Data misstraut. Denn eines Tages wird KI menschliche Gurus ersetzen. Mustererkennung ist viel zuverlässiger als Einsicht. Es ist eine angeborene menschliche Fähigkeit, die Maschinen jetzt lernen. Harkness spielt auf die bahnbrechende Arbeit des britischen Epidemiologen John Snow an, der mithilfe statistischer Verfahren den Cholera-Ausbruch 1854 in London auf eine einzige Handpumpe in Soho zurückführte. Heutzutage durchkreuzen KIs die Google-Suche nach medizinischer Beratung, von der aus sie Wellenfronten herannahender Epidemien abbilden und den Gesundheitsdiensten strategische Tiefe verleihen. Big Data wird bereits von Unternehmen und Regierungen genutzt und wird unsere Welt auf noch unvorstellbare Weise beeinflussen. Wenn es freundlich ist, wird Raum für menschliche Einsicht bleiben.