Blog

Handfestes Know-how, Tipps & Tricks und die Insights unserer Datenprofis findest Du hier in unseren Blogbeiträgen

Nahaufnahme von Händen auf einer Laptop-Tastatur
Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.
Die Highlights des Spark Summits 2016 in Brüssel
Die Highlights des Spark Summits 2016 in Brüssel

Die Highlights des Spark Summits 2016 in Brüssel

Diesen Blog-Eintrag verfasse ich mal nicht in einer ruhigen Minute in unseren b.telligent-Büros, sondern live aus Brüssel vom Spark Summit. Für Data Scientists bietet es einen enormen Umfang an Machine-Learning-Verfahren, sowohl klassisch für statische Datensätze als auch für Streamingdaten in Echtzeit. Jeder mit Praxiserfahrung in der Python-Bibliothek sklearn wird sich sofort zuhause fühlen, da diese als Vorbild verwendet wurde.

Mehr lesen
Analyse oder App - was stellt ein Data-Science-Team eigentlich her?
Analyse oder App - was stellt ein Data-Science-Team eigentlich her?

Analyse oder App - was stellt ein Data-Science-Team eigentlich her?

Eine besonders fruchtbare aktuelle Diskussion dreht sich um die Frage, was ein Data-Science-Team eigentlich sinnvollerweise herstellt. Die beiden Möglichkeiten sind dabei schnell benannt: Auf der einen Seite steht die "Analyse", also ein einmalig erstelltes, eher statisches Endergebnis; die meisten denken hier sofort an eine PowerPoint-Präsentation. Auf der anderen Seite steht die "App", also ein interaktives, ständig mit frischen Daten versorgtes Endprodukt, häufig in Form einer Website oder einer Mobile App.

Mehr lesen
Wie der stationäre Handel mit PoS-Trackingdaten gegenüber Onlineshops aufholt
Wie der stationäre Handel mit PoS-Trackingdaten gegenüber Onlineshops aufholt

Wie der stationäre Handel mit PoS-Trackingdaten gegenüber Onlineshops aufholt

Aufgrund zunehmender Herausforderungen der Digitalisierung läuft E-Commerce dem stationären Handel mehr und mehr den Rang ab. Laut dem Kölner IfH-Institut verstärkt sich dieser Trend in den nächsten Jahren zunehmend. Bei Rückgang des Umsatzes im stationären Handel soll parallel der Umsatz des Onlinehandels bis 2020 auf ca. 77 Milliarden Euro ansteigen.

Mehr lesen
Der lokale Verbindungspfeil von Longview BI (ehemals arcplan)
Der lokale Verbindungspfeil von Longview BI (ehemals arcplan)

Der lokale Verbindungspfeil von Longview BI (ehemals arcplan)

Der lokale Verbindungspfeil ermöglicht eine Einschränkung von Strukturen, ohne dabei auch die Daten einzuschränken. Diese Funktion gibt es schon viele Jahre, gerät aber schnell in Vergessenheit und ist bei vielen Anwendungsarchitekten und -entwicklern vollkommen unbekannt. Daher ist dies ein Blog, um diese Funktion einmal wieder aufzufrischen bzw. bekannt zu machen.

Notiz: arcplan Information Services GmbH ist nach der Fusion mit Longview umbenannt worden und heißt nun Longview Europe GmbH.

Mehr lesen
Das Advanced Data Store Object (ADSO) und seine Tabellen
Das Advanced Data Store Object (ADSO) und seine Tabellen

Das Advanced Data Store Object (ADSO) und seine Tabellen

Mit SAP BW on HANA kommt das ADSO mit neuen Tabellenstrukturen und Funktionen. Im Vergleich zu den InfoProvidern, die auf nicht auf HANA basierenden SAP BW-Systemen genutzt werden, besitzen ADSOs die Fähigkeit, ihre Funktion ohne Verlust der abgelegten Daten zu ändern. Dies schließt auch eine Änderung der Inhalte von Tabellen mit ein, wenn der Typ verändert wird.

Ein ADSO besteht dabei immer aus drei Tabellen, die je nach ADSO-Typ gefüllt und verarbeitet werden. Nicht genutzte Tabellen werden vom System trotzdem angelegt. Somit ist die Nutzung in Routinen, HANA-Experten-Skripten etc. möglich, aber generell nicht immer richtig.

Mehr lesen
Der Bedarf an kundenzentrischem Datawarehousing und die Chancen, die dieses eröffnet
Der Bedarf an kundenzentrischem Datawarehousing und die Chancen, die dieses eröffnet

Der Bedarf an kundenzentrischem Datawarehousing und die Chancen, die dieses eröffnet

Die Rolle des Kunden

Die zentrale Rolle des Kunden für die Unternehmensausrichtung wird in der Wissenschaft seit Jahrzehnten diskutiert:

"It costs much more to acquire a customer than it does to keep a customer. That is why a sale to a customer is good, but a relationship with a customer is great." [1]

"Personal data are the fuel of the modern economy." [2]

"In a global information-based economy, data about customers are one of the most important sources for competitive advantage." [3]

Mehr lesen
SCD-Handling mit dem Oracle Data Integrator 12
SCD-Handling mit dem Oracle Data Integrator 12

SCD-Handling mit dem Oracle Data Integrator 12

Seitdem das Supportende für den OWB offiziell bekannt gemacht wurde, ist der Oracle Data Integrator (ODI) das ETL-Tool der Wahl in der Oracle-Welt. Die Entwicklung ist zu der Version 12 fortgeschritten, die einige Änderungen und Verbesserungen gebracht hat. Die GUI hat sich dem OWB noch weiter angenähert, jedoch stehen einige Möglichkeiten zur Verfügung, die der OWB so nicht bot. In diesem Eintrag wollen wir uns mit der Implementierung von Slowly Changing Dimensions im ODI beschäftigen.

Mehr lesen
Best Practice für SQL-Statements in Python
Best Practice für SQL-Statements in Python

Best Practice für SQL-Statements in Python

Best Practice für SQL-Statements in Python

Dank eines verpflichtenden Interfaces für Datenbank-Connectors, der "Python Database API Specification v2.0, PEP249", wurden alle aktuellen Connectors so entwickelt, dass Datenbankverbindungen und die SQLs für Datenabrufe und Datentransaktionen über dieselben Befehle gestartet werden können. Mehr oder weniger erhält man auch überall im gleichen Format Ergebnisse zurück. In diesem Punkt gibt es gefühlt noch die größten Abweichungen von der geforderten Vereinheitlichung.
Das sollte aber niemanden davon abschrecken, Python-Skripte als eine flexible Methode für Automatisierungen von Datenbankoperationen zu verwenden.

Mehr lesen
Aufbau eines schlagkräftigen Data-Science-Teams
Aufbau eines schlagkräftigen Data-Science-Teams

Aufbau eines schlagkräftigen Data-Science-Teams

Data Science erlebt in den letzten Jahren eine zunehmende Professionalisierung und Standardisierung. Der oft intrinsisch motivierte Datenbastler und Frickler, der die Nische "Analyse" in seinem Unternehmen mit sehr hohem unternehmensinternen Daten- und Prozesswissen besetzt, kommt an seine Grenzen. Zunehmende Anforderungen, gerade im Zuge der stärkeren Kundenfokussierung über alle Branchen hinweg, zwingen Unternehmen dazu, die Strukturen im Bereich Data Science zu professionalisieren: Dies reicht vom Wissen über zur Verfügung stehende Datenquellen und deren Aufbereitung bis zu schon im Unternehmen genutzten Data-Science-Produkte.

Mehr lesen
Von SAS zu R und zurück: SAS-Daten nach R transferieren
Von SAS zu R und zurück: SAS-Daten nach R transferieren

Von SAS zu R und zurück: SAS-Daten nach R transferieren

SAS und R sind Themen, die dicht beieinanderliegen: Beides sind populäre Werkzeuge für Leute wie uns, die Probleme aus dem Umfeld von Statistik und Machine Learning auf mehr oder weniger großen Datenmengen lösen möchten. Trotz dieser scheinbaren Nähe gibt es wenig Berührungspunkte zwischen den beiden Communitys, und nur wenige arbeiten mit beiden Werkzeugen. Als passionierte Über-den-Tellerrand-Blicker finden wir das schade und möchten mit diesem Blogeintrag eine Miniserie starten, in der wir uns in loser Folge mit Themen beschäftigen, die beide Welten miteinander verbinden. Für diesen ersten Blogeintrag werden wir uns mit den Möglichkeiten beschäftigen, Daten zwischen den Systemen auszutauschen. Da es eine große Vielzahl an Wegen gibt, beschränken wir uns für diese Folge auf den Transfer von SAS zu R; der entgegengesetzte Weg folgt in einem späteren Eintrag.

Mehr lesen
Best Practice: Kampagnendurchführung
Best Practice: Kampagnendurchführung

Best Practice: Kampagnendurchführung

Um eine Kampagne erfolgreich durchführen zu können, ist es wichtig, auf einen geschlossenen Prozess im Unternehmen für die Kampagnenplanung zurückgreifen zu können. Liegt ein derartiger definierter und einheitlicher Prozess nicht vor, wird nicht nur wertvolles Potential verschenkt, sondern auch das Risiko eingegangen, dass Erfolge auf lange Sicht ausbleiben.

Mehr lesen
Boosting für den naiven Bayes-Klassifikator
Boosting für den naiven Bayes-Klassifikator

Boosting für den naiven Bayes-Klassifikator

Es gibt viele Bereiche, in denen sich die Neurowissenschaft und das maschinelle Lernen überlappen. Einer davon ist das Kombinieren des Lernens während mehrerer Lernepisoden mit kleinen Erfolgen, um am Ende ein daraus verschmolzenes, stärkeres, gelerntes Modell für eine bestimmte Aufgabe zu nutzen. Dieser Vorgang wird im maschinellen Lernen als "Boosting" (auf Deutsch "Verstärken") bezeichnet. Gerade in der IT-Branche ist das Entwickeln von Lösungen dieser Art ein sehr interessantes Thema, weshalb nachstehend eine kurze Einführung in das maschinelle Lernen erfolgen soll, die die Grundideen sowie die Anwendung des naiven Bayes-Klassifikators in R darstellt.

Mehr lesen