Blog

Handfestes Know-how, Tipps & Tricks und die Insights unserer Datenprofis findest Du hier in unseren Blogbeiträgen

Nahaufnahme von Händen auf einer Laptop-Tastatur
Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.
Ein Korb voller Schlangen: Python Module für Data Science
Ein Korb voller Schlangen: Python Module für Data Science

Ein Korb voller Schlangen: Python Module für Data Science

Wer meine früheren Blogeinträge gesehen hat, der weiß, dass ich sowohl ein großer Fan von R als auch von Python in der täglichen Arbeit bin.

So mächtig R auch im Funktionsumfang für Datenanalyse und Modellierung ist, so schnell wird der Elan beim "number crunching" auch gedämpft, wenn der Arbeitsspeicher auf Oberkante läuft.

Eine schöne Serverinstallation mit viel Blech (z. B. 96 Gig-RAM) wirkt dabei Wunder.

Da diese Option nicht immer zur Verfügung steht, habe ich aus der Not eine Tugend gemacht und mich der performanteren Alternative, nämlich den Python-basierten R-Alternativen zugewandt, zumal ich eh schon seit langem Python für ETLs und Datenaufbereitungen einsetze.

Mehr lesen
Zeitreihenanalyse leicht gemacht – ganz ohne Analysetool
Zeitreihenanalyse leicht gemacht – ganz ohne Analysetool

Zeitreihenanalyse leicht gemacht – ganz ohne Analysetool

Ausgangssituation

Bei einem Telekommunikationsunternehmen soll der Bereich Controlling bei der Prognose der monatlichen Entwicklung von Gross-Adds-Zahlen unterstützt werden. "Gross Adds" ist die Kennzahl, die die Brutto-Neukundenzuwächse innerhalb einer bestimmten Periode wiedergibt, wobei die Zahl der verlorenen Kunden nicht berücksichtigt wird. Die Kennzahl "Gross Adds" wird vor allem in der Telekommunikationsbranche verwendet und gibt die Anzahl der neu abgeschlossenen Verträge (Postpaid und Prepaid) wieder.

Mehr lesen
HowTo: Verbinden von Zellen mit arcplan 8.6
HowTo: Verbinden von Zellen mit arcplan 8.6

HowTo: Verbinden von Zellen mit arcplan 8.6

arcplan ermöglicht es, einheitliche Berichte zu erstellen, die die tägliche Arbeit der Mitarbeiter eines Unternehmens unterstützen und somit auch effizienter gestalten. Dies ist insbesondere der Fall, wenn Berichte ihre enthaltenden Daten aussagekräftig, prägnant und benutzerfreundlich darstellen. Große Mengen an Informationen werden auch deswegen oft strukturiert und in Form von Tabellen aufbereitet. Um Beziehungen beziehungsweise Hierarchien der Daten innerhalb der Tabelle abzubilden und Redundanzen zu vermeiden, ist es notwendig, geeignete Spalten und Zeilenüberschriften auszuwählen, welche darüber hinaus auch noch zielführend platziert sein sollten.

Mehr lesen
Hochleistungs(denk)sport mit R
Hochleistungs(denk)sport mit R

Hochleistungs(denk)sport mit R

Dieser Beitrag beschäftigt sich grundsätzlich und in sehr kurzer Form mit folgenden drei Fragen:

  • Woran denkt ein datengetriebener Mensch, wenn er Behauptungen hört?
  • Welches Tool ist für Datenanalysen praktischer: R, Python, Java, MATLAB?
  • Können Sportdisziplinen das nächste Gebiet zur Anwendung der Datenanalysen und des maschinellen Lernens sein?
Mehr lesen
HOWTO: Große Dateien verarbeiten mit Standard-Python
HOWTO: Große Dateien verarbeiten mit Standard-Python

HOWTO: Große Dateien verarbeiten mit Standard-Python

Vorgefertigte Datensätze, die den Rahmen sprengen

Häufig werde ich mit bereitgestellten Rohdaten für Analysen konfrontiert, welche sich unkomprimiert durchaus auf Dateien von einem halben Gigabyte oder mehr erstrecken. Ab einem Gigabyte kommen die Desktop-gestützten Statistik-Tools langsam ins Schwitzen. Es gibt natürlich je nach Tool Möglichkeiten, nur einen Teil der Spalten zu selektieren oder nur die ersten 10.000 Zeilen zu laden usw.

Aber was macht man, wenn man aus der Datenlieferung nur eine zufällige Stichprobe ziehen möchte? Man darf sich nie darauf verlassen, dass die Datei zufällig sortiert ist. Sie kann durch Prozesse im Datenbankexport bereits systematische Reihenfolgeeffekte beinhalten. Es kann aber auch vorkommen, dass man z.B. nur ein Zehntel einer Gruppierung analysieren möchte, wie etwa die Einkäufe jedes zehnten Kunden. Dazu muss die komplette Datei gelesen werden, sonst kann man nie sicherstellen, dass alle Einkäufe der gefilterten Kunden berücksichtigt wurden.

Mehr lesen
Uplift-Modeling als Zusatz zum klassischen Response-Modeling
Uplift-Modeling als Zusatz zum klassischen Response-Modeling

Uplift-Modeling als Zusatz zum klassischen Response-Modeling

Uplift-Modeling kann Kampagnenmanager bei der Kampagnensteuerung und -planung unterstützen, da es das klassische Response-Modell des Kampagnenscorings ergänzt. Uplift-Modeling geht von der Grundidee aus, dass man die Kampagnenreagierer in zwei Gruppen einteilt: diejenigen, die auch ohne die Kampagne reagiert hätten, und die, die das ohne die Kampagne nicht getan hätten. Während klassisches Scoring unterschiedslos auf beide Gruppen abzielt, versucht das Uplift-Scoring, exklusiv nur die zweite Gruppe zu isolieren und dabei die erste möglichst zu ignorieren. Zu diesem Zweck werden die Responseinformationen aus der Kontrollgruppe verwendet, die im klassischen Kampagnenscoring ungenutzt bleiben.

Mehr lesen
Anleitung: HICHERT (IBCS) out of the Box
Anleitung: HICHERT (IBCS) out of the Box

Anleitung: HICHERT (IBCS) out of the Box

arcplan ist das erste Software-Tool für Business Intelligence (BI), das von der BARC und HICHERT+FAISST das renommierte HICHERT®IBCS-Gütesiegel erhalten hat. Durch die ausgesprochen hohe Flexibilität des Tools arcplan Enterprise war es möglich, jede Anforderung an Grafiken, Tabellen, Strukturen und Kommentare zu 100 % zu erfüllen. Seitdem hat arcplan weitere Entwicklungsarbeit investiert, um dem Anwender (Berichtsentwickler) das Erstellen von "IBCS-konformen" Berichten zu erleichtern und somit viel Zeit und Ressourcen bei der Berichtserstellung einzusparen. arcplan 8.5 bietet nun ein Portfolio von fertigen und zu 100 % IBCS-konformen Grafiken an, die mit wenigen Klicks in die Applikation eingebunden werden können. Selbstverständlich bieten auch die "Quicksteps" die volle arcplan-Flexibilität und können verändert, erweitert und an die spezifischen Anforderungen angepasst werden.

Mehr lesen
HOWTO: Einfaches Web Scraping mit Python
HOWTO: Einfaches Web Scraping mit Python

HOWTO: Einfaches Web Scraping mit Python

Erschlagendes Angebot im Webshop

Vor zwei Wochen wurde ich von einem oft genutzten Online-Versand, dessen Namen an ein Fluss in Südamerika erinnert, per freundlicher Info-Mail auf eine Aktion aufmerksam gemacht. Und zwar wurden mir drei Musik-CDs aus einer großen Auswahl für 15€ angeboten.

Ich erwerbe immer noch gerne, wie früher, Musik auf physischen Tonträgern und wollte mir das Angebot genauer ansehen. Nun stellte sich heraus, dass etwa 9,000 CDs offeriert wurden, und das über etwa 400 Seiten im Online-Shop. Dieser Shop bietet mir die Möglichkeit, das Angebot nach Beliebtheit oder nach Kundenbewertung zu sortieren. Wenn ich jedoch die Beliebtheit absteigend betrachte, finde ich viele Titel, die nicht mehr ganz meiner Altersklasse entsprechen. Andererseits, wenn ich nach Kundenbewertung sortiere, stellt sich heraus, dass der Shop die Bewertungen ungewichtet verarbeitet. D.h. irgendeine CD mit volkstümlichen Schlagern wird mit nur einer 5-Sterne Bewertung vor einer anderen CD mit 4.9 Sternen auf 1000 Bewertungen aufgeführt.

Mehr lesen
Howto: Transaktionssichere Eingaben
Howto: Transaktionssichere Eingaben

Howto: Transaktionssichere Eingaben

arcplan-Applikationen bieten oft die Möglichkeit, dass ein Benutzer durch Eingaben in die Applikation bzw. in die dahinter liegende Datenbank zurückschreibt. Dies ist im Besonderen bei Planungsapplikationen, aber auch vereinfacht bei Kommentareingaben der Fall.

Mehr lesen
R Tipps und Tricks - Teil 1
R Tipps und Tricks - Teil 1

R Tipps und Tricks - Teil 1

R, der Open-Source-Allrounder mit schwerem Einstieg

Vor etwa drei Jahren bin ich von kommerziellen Statistiklösungen, wie SPSS, auf R umgestiegen. Mittlerweile kann ich mit Überzeugung sagen, dass ich erstmal kein anderes Tool mehr für Advanced Analytics brauche. Vor allem in Verbindung mit der IDE "R-Studio" hat die Software einen Reifegrad erreicht, um sie bedenkenlos in großen Data-Science-Projekten einzusetzen.

Man braucht sich allerdings nicht vormachen, dass man R einfach installiert und loslegt. Die Lernkurve ist vergleichsweise steil und es gibt nicht nur in Bezug auf die verschiedenen Pakete viele unterschiedliche Wege, dasselbe zu tun. Nicht selten hab ich mich geärgert, dass ich mitten im Auswerten plötzlich über einen banalen Schritt gestolpert bin, dessen Umsetzung ich für R erst recherchieren musste. Ich möchte daher in diesem und hoffentlich vielen folgenden Teilen Tipps und Tricks für R aufgreifen, die ich gerne schon früher als Einsteiger gekannt hätte.

Mehr lesen
Kampagnenmanagement im Mobile-Engagement-Umfeld
Kampagnenmanagement im Mobile-Engagement-Umfeld

Kampagnenmanagement im Mobile-Engagement-Umfeld

Schaffung von Kampagnenintelligenz im Mobile-App-Kanal

Mobile Engagement ist das nächste große Thema im BI-Umfeld - zu Recht. Potentielle Kundenkontakte an jedem Ort und in verschiedensten Kontexten bieten riesige Chancen für relevante Kommunikation und hochwirksames Beziehungsmanagement. Vor diesem Hintergrund sollte der Kanal "Mobile App" mit all seinen Möglichkeiten in die intelligente Steuerung von Kampagnen einbezogen werden. Bestehende Mobile-App-Engagement-Lösungen bieten dafür (nur) die Grundvoraussetzungen - und bedürfen damit professioneller Integration in die bestehende CRM-Strategie und zentrale Kampagnenintelligenz.

Mehr lesen
Der Customer Lifetime Value: Populäre Irrtümer und ungeschminkte Wahrheiten
Der Customer Lifetime Value: Populäre Irrtümer und ungeschminkte Wahrheiten

Der Customer Lifetime Value: Populäre Irrtümer und ungeschminkte Wahrheiten

Lange Zeit war der Customer Lifetime Value in wissenschaftlichen Veröffentlichungen wesentlich häufiger anzutreffen als in der Realität. Doch mittlerweile findet er seinen Weg in die praktische Anwendung. Triebfeder ist vor allem die Digitalwirtschaft. Die zunehmende Verbreitung des Customer Lifetime Values eröffnet große Chancen für eine gezielte Akquisition und Steuerung von Kundenbeziehungen. Sie legt aber auch die Tatsache offen, dass gewisse Missverständnisse weit verbreitet sind.

Mehr lesen