Tableau Sets – Data Subsets dynamisch erstellen und nutzen

Tableau Sets – Data Subsets dynamisch erstellen und nutzen

In der Arbeit mit Tableau stolpert man früher oder später über den Begriff der Tableau Sets. Im Folgenden wird erläutert, was Sets sind und wie sie sich von Gruppierungen unterscheiden. Außerdem zeigen wir, wie man Sets in Tableau erstellen kann und somit für mehr Interaktivität sorgt.

Table of Contents

Was sind Sets?

Durch Sets können Entwickler:innen eine Dimension anhand ihrer eigenen Inhalte oder einer anderen Spalte in Subsets aufteilen und so neue Perspektiven erschaffen. Dadurch können Segmente der Daten isoliert und neue Insights generiert werden.

Es gibt drei verschiedene Arten von Sets:

Ein Datensatz ist dabei innerhalb oder außerhalb der festgelegten Kondition oder Zuteilung zu finden, d. h., es handelt sich um eine binäre Betrachtungsweise.

Die binäre Betrachtung und die verschiedenen Arten von Sets lassen sich anhand von Beispielen verdeutlichen:

  • Schwellenwert/Threshold – Kundenkartei eines Ladens

Ein Kunde soll als Stammkunde gelten, sobald er öfter als 5-mal im Monat (Threshold) dort einkauft. Kunden können also innerhalb des Segments der Stammkunden sein (>5 Einkäufe im Monat) oder außerhalb (<5 Einkäufe im Monat).

  • Top-Ranking von Verkaufsfilialen

In der Unternehmenszentrale möchte man die Top 3 der Filialen anhand des Umsatzes herausfinden. Die Einteilung erfolgt hier ohne festen Schwellenwert des Umsatzes.

  • Manuelle Auswahl – Lieblingskunden

Ein Handwerker entscheidet sich dafür, seinen Lieblingskund:innen einen Rabatt zu schicken. Die Gruppe der Lieblingskund:innen kann nur durch manuelle Zuteilung durch datenversierte Entwickler:innen erstellt werden.

Kategorisierungen, die nicht durch eine binäre Logik abgebildet werden können, sind mit Sets nicht möglich.

Wie unterscheiden sich Sets und Gruppierungen?

Neben den Sets gibt es in Tableau auch noch die Möglichkeit, Gruppierungen zu erstellen.

Beide Funktionen scheinen auf den ersten Blick sehr ähnlich, doch in welchen Punkten unterscheiden sie sich?

Wie wir bereits wissen, erstellen Sets Segmente der Daten, die bestimmte definierte Konditionen erfüllen. Dabei können mehrere Dimensionen zur Definition herangezogen werden. Beispielsweise werden die drei bevölkerungsreichsten Bundesländer gesucht: Die Aufteilung der Bundesländer-Dimension erfolgt in zwei Segmente (innerhalb der Top 3 und der Rest) mittels der Kennzahl „Bevölkerungszahl“.

Bei der Gruppierung hingegen kann man die Werte einer Dimension auf einer höheren Ebene statisch zu neuen Kategorien zusammenfassen. Dabei spielt es keine Rolle, wie viele Kategorien man anlegt. Am Beispiel verdeutlicht: Man möchte die Bundesländer in die Regionen Nord, Ost, Süd und West einteilen. Durch die Gruppierung könnte man jedes Bundesland manuell einer Region zuordnen.

Hier noch einmal die Unterschiede gegenübergestellt:

Wie erstelle ich Sets?

Die Datenvorbereitung ist abgeschlossen, und wir wissen, dass Sets eine Segmentierung der Daten anhand einer Dimension vornehmen. Doch wie erstelle ich so ein Set und was ist der Unterschied zwischen festgelegten und dynamischen Sets?

Festgelegte Sets beinhalten mehrere Dimensionen und werden ganz einfach in einer Grafik ausgewählt. Deswegen eignen sie sich vor allem für Ad-hoc-Analysen. Nach der Auswahl sind die Elemente des Sets fix und können nicht geändert werden. Das entstandene Feld kann aber z. B. für Filter oder Berechnungen weiterverwendet werden.

Dynamische Sets werden durch Rechtsklick auf die Dimension, die segmentiert werden soll, erstellt. Es öffnet sich ein Bearbeitungsfenster mit drei Optionen:

  • Allgemein – Hier kann auch ein festgelegtes Set erstellt werden, die ausgewählten Einträge können eingeschlossen oder ausgeschlossen werden. Neue Datensätze würden immer zur „Sonstiges-Gruppe“ hinzugefügt werden.
  • Bedingung – Einstellung eines Schwellenwerts (Thresholds) für eine weitere Dimension.
  • Oberste – Festlegung der Top- oder Bottom-N-Einträge nach Bewertung einer weiteren Dimension.

Sowohl Bedingung als auch die Oberste-Funktion berücksichtigen neue Datensätze und kategorisieren sie nach den getroffenen Konditionen. Außerdem können Parameter den Threshold bzw. die Auswahl der N-Einträge interaktiver gestalten.

Nach Erstellung erhält man eine neue Spalte mit den Einträgen IN/OUT, die dann z. B. für Grafiken, Filter und Berechnungen weiterverwendet werden kann.

Du hast Fragen? Kontaktiere uns

Olaf Bowe

Your contact person

Olaf Bowe

Domain Lead Insights & Information Design

Ähnliche Beiträge

chevron left icon
Vorheriger Beitrag
Nächster Beitrag
chevron right icon

Kein vorheriger Beitrag

Kein nächster Beitrag