Amazon und die verschimmelnden Erdbeeren
Erdbeeren dabei zuzusehen, wie sie langsam verschimmeln, ist eine Vorstellung, die auf die meisten Menschen nicht sehr attraktiv wirkt. Dr. Ralf Herbrich allerdings kann von verschimmelnden Erdbeeren derart anregend erzählen, dass seine Keynote im Gedächtnis blieb. Herbrich leitet das Amazon Development Center Germany in Berlin, und die Erdbeeren sind ein Teil von Amazons Vorstoß ins Geschäft mit frischen Lebensmitteln. Wer selbst frische Lebensmittel liefern will, tut gut daran, zu wissen, wie lange die Äpfel, Gurken und Erdbeeren noch halten werden, die man im Lager hat. Heute weiß das niemand. Amazon wird es bald wissen: Data Scientists am Berliner Standort bauen Machine-Learning-Pipelines, die aus Bildern von Obst und Gemüse die restliche Haltbarkeit schätzen können. Dies ist jedoch nur ein Beispiel der Amazon-Philosophie, wo immer möglich die zahlreichen Entscheidungen, die täglich millionenfach zu treffen sind, mit Machine Learning zu unterstützen und zu steuern.
Die Predictive Analytics World 2016 - Aussteller mit großen Namen
In der anschließenden Kaffeepause war zu merken, dass die Veranstaltung wieder enorm gewachsen ist. Auch die großen Konzerne haben die Konferenz für sich entdeckt, neben Amazon waren auch Microsoft und IBM mit Vorträgen vertreten. Glücklicherweise ging das Wachstum nicht auf Kosten der einzigartigen inhaltlichen Tiefe, die die Predictive Analytics World unangefochten zur besten Data-Science-Konferenz im deutschsprachigen Raum macht. Dazu trug auch das neue Konzept der Deep Dives bei, einstündiger Einheiten mit Voranmeldung, die sich an diejenigen Experten wenden, die keine Angst davor haben, sich auch mit den kopfschmerzträchtigen Details des jeweiligen Vortragsthemas auseinanderzusetzen.
Die Themenhighlights
Auch der Dauerbrenner Marketingattribution war prominent mit einem interessanten Vortrag aus dem Otto-Konzern vertreten. Das methodische Niveau war hoch (Shapley-Regression etc.), doch blieb gerade im Wechselspiel der fachlichen Referentin mit dem Statistiker das seltsame Gefühl, dass das Modell eine sehr ausgefeilte Antwort ist, die aber nur bedingt zur fachlichen Frage passt, ein häufiges Problem im Umfeld der Marketingattribution. Ein weiteres hochkarätiges Thema wurde gleich im Anschluss behandelt, es ging um Pricing. Ein sehr interessanter Akzent lag auf den prozessmäßigen Voraussetzungen von Predictive Pricing im E-Commerce, also z. B. dafür zu sorgen, dass bei Retouren wirklich der Preis gutgeschrieben wird, zu dem der Kunde bestellt hat, selbst wenn sich dieser ständig ändert. Ein weiterer oft vernachlässigter Aspekt war die vorbereitende Einschätzung, wie hoch das Potenzial für Predictive Pricing in welchen Teilen des Sortiments überhaupt ist und wie ich dafür sorgen kann, dass automatisch angepasste Preise für den Endkunden auch sinnvoll und seriös wirken.
Der Vortrag von Paul Mlaka - ein krönender Abschluss der PAW 2016
Ein Highlight des zweiten Konferenztages war ohne Zweifel der Vortrag von Paul Mlaka. Seinen Erfolg hat er nicht durch ein besonders ausgefeiltes Modell oder große Datenmengen erreicht, sondern durch tiefe fachliche Kenntnis und eine erstaunliche Datenquelle. Aber der Reihe nach: Wie einige der besonders interessanten Vorträge kam auch dieser von einem Exoten - in dem Sinne, dass Paul Mlaka mit seinem Studium des Bauingenieurwesens an der amerikanischen Militärakademie West Point einen völlig anderen Hintergrund hat als die meisten anderen Konferenzteilnehmer. Mlaka ist mittlerweile als Berater für Unternehmen unterwegs, die vor allem von Aufträgen der öffentlichen Hand leben. In dieser Eigenschaft hat er ein junges Bauunternehmen bezüglich dessen Gebotsstrategie bei öffentlichen Ausschreibungen beraten. Mit Hilfe einfacher prädiktiver Modelle in Excel (!) konnte er dafür sorgen, dass sein Auftraggeber die Gebote der Wettbewerber sehr genau vorhersagen und sie jeweils knapp unterbieten konnte. Die Grundlage dafür lieferte ihm zum einen sein profundes fachliches Wissen über die Kalkulationsgrundlagen in der Branche, das es ihm erlaubte, die richtigen Prädiktoren zusammenzustellen. Mindestens ebenso erstaunlich wie die Prädiktoren ist in diesem Beispiel aber die Zielvariable: die historischen Gebote vergangener Ausschreibungen. Man sollte denken, dass solche Daten schlicht nicht verfügbar sind, weil sie nur der ausschreibenden Behörde zur Verfügung stehen und von dieser unter Verschluss gehalten werden. Seit einem Gesetz, das von Präsident Obama erlassen wurde, sind diese Daten jedoch öffentlich zugänglich! Eine wahrhaft erstaunliche Datenquelle also - und ein schöner Abschluss für diese kurze Sammlung von Eindrücken aus Berlin.
Paul Mlaka bei seinem Vortrag auf der PAW 2016 in Berlin (Bildmaterial vom Konferenzveranstalter)