Datenvisualisierung mit Tableau

Unser Ziel als Datenanalysten besteht darin, die Erkenntnisse unserer Daten so zu arrangieren, dass jeder, der sie sieht, ihre Auswirkungen und die daraus zu ziehenden Konsequenzen klar versteht.

Tableau ist eine Datenanalyse- und Visualisierungstool, das heutzutage breit in der Branche eingesetzt wird. Viele Unternehmen halten es sogar für unentbehrlich für datenwissenschaftliche Arbeiten. Tableaus Einfachheit entsteht durch seine Drag-and-Drop-Oberfläche. Diese Funktion ermöglicht es, Aufgaben wie Sortieren, Vergleichen und Analysezwecken sehr einfach und schnell durchzuführen. Tableau ist auch mit mehreren Quellen kompatibel, einschließlich Excel, SQL Server und cloudbasierten Datenlagern, was es zu einer hervorragenden Wahl für Datenwissenschaftler macht.

1. Einführung in Tableau

Übersicht

Tableau Software ist ein in Seattle, Washington ansässiges Softwareunternehmen, das interaktive Datenvisualisierungsprodukte mit Schwerpunkt auf Business Intelligence produziert. Tableau wurde an der Informatikabteilung der Stanford University zwischen 1997 und 2002 gegründet(Wikipedia)

Die Hauptprodukte von Tableau sind:

Tableau Desktop, Tableau Public und Tableau Online, die alle die Erstellung von Datenvisualisierungen bieten, und die Wahl hängt vom Typ der Arbeit ab.

Installation

Je nachdem, welches Produkt Sie wählen, laden Sie die Software auf Ihren Computer herunter. Nachdem Sie die Lizenzvereinbarung akzeptiert haben, können Sie die Installation durch Klicken auf das Tableau-Icon überprüfen. Wenn das folgende Fenster erscheint, können Sie loslegen.

2. Einstieg

In diesem Abschnitt lernen wir einige grundlegende Operationen in Tableau kennen, um uns mit der Oberfläche vertraut zu machen.

Tableau-Arbeitsbereich

Der Tableau-Arbeitsbereich umfasst eine Sammlung von Arbeitsblättern, Menüleiste, Symbolleiste, Marks Card, Regale und viele andere Elemente, die wir in den folgenden Abschnitten kennenlernen werden. Blätter können Arbeitsblätter, Dashboards oder Geschichten sein. Das Bild unten hebt die wichtigsten Komponenten des Arbeitsbereichs hervor. Weitere Vertrautheit wird jedoch entstehen, wenn wir mit echten Daten arbeiten.

source:Tableau.com

Verbinden mit einer Datenquelle

Um mit Tableau arbeiten zu beginnen, müssen wir Tableau mit der Datenquelle verbinden. Tableau ist kompatibel mit vielen Datenquellen. Die von Tableau unterstützen Datenquellen erscheinen links von dem Startbildschirm. Einige häufig verwendete Datenquellen sind Excel, Textdatei, relationale Datenbank oder sogar auf einem Server. Man kann auch zu einer Cloud-Datenbankquelle wie Google Analytics, Amazon Redshift usw. verbinden.

Der Startbildschirm von Tableau Desktop zeigt die verfügbaren Datenquellen auf, die ein Benutzer verbinden kann. Dies ist auch von der Version von Tableau abhängig, da die kostenpflichtige Version mehr Möglichkeiten bietet. Links auf dem Bildschirm befindet sich ein Verbinden-Bereich, der die verfügbaren Quellen hervorhebt. Dateitypen werden zunächst gelistet, gefolgt von häufig verwendeten Servertypen oder Servern, die kürzlich verbunden wurden. Man kann unter dem Öffnen-Tab vorher erstellte Arbeitsbücher öffnen. Tableau Desktop bietet auch einige Beispielarbeitsbücher unter Beispiel-Arbeitsbücher an.

Hands On

Verbinden Sie sich mit dem Beispiel-Superstore-Datensatz

Wir arbeiten mit dem Beispieldatensatz Superstore-Datensatz, der mit Tableau vorinstalliert ist. Wir laden jedoch die Datei von hier herunter, um zu erkennen, wie man eine Excel-Datenquelle anschließt. Die Daten stammen aus einem Superstore und beinhalten Informationen über Produkte, Verkäufe, Gewinne usw. Unser Ziel als Datenanalysten besteht darin, die Daten zu analysieren und kritische Verbesserungsbereiche in dieser fiktiven Firma zu finden.

Schritte

  1. Importiere die Daten in den Tableau-Arbeitsbereich von dem Computer.

  2. Unter dem Registerkartenabschnitt „Blätter“ werden drei Blätter sichtbar, namely Orders, People und Returns. Wir arbeiten jedoch nur mit den Daten der Bestellungen. Doppelklick auf das Blatt „Orders“, und es öffnet sich wie eine Tabellenkalkulation.
  3. Wir bemerken, dass die ersten drei Zeilen der Daten etwas anders aussiehen und nicht im gewünschten Format sind. Hier nutzen wir den Dateninterpretator, der ebenfalls unter den Registerkartenabschnitten „Blätter“ zu finden ist. Durch Klicken auf ihn erhalten wir ein formatiertes Blatt.

Hands On

Erstellen eines Anzeiges

Wir beginnen mit der Generierung eines einfachen Diagramms. In diesem Abschnitt werden wir uns mit unseren Daten vertraut machen und Fragen zu den Daten stellen, um Einblicke zu gewinnen. Es gibt einige wichtige Begriffe, die wir in diesem Abschnitt erörtern werden.

Dimension

Measures

Aggregation

Dimensionen sind qualitative Daten, wie z.B. ein Name oder ein Datum. Standardmäßig klassifiziert Tableau Daten, die qualitative oder kategorische Informationen enthalten, als Dimension, z.B. jeder Feldname mit Text- oder Datumswerten. Diese Felder erscheinen normalerweise als Spaltenköpfe für Datenreihen, wie z.B. Kunde Name oder Bestelldatum und definieren außerdem die Granularität, die in der Ansicht angezeigt wird.

Measures sind quantifizierte numerische Daten. Standardmäßig behandelt Tableau jedes Feld mit diesen Datentypen als Maßnahme, z.B. Umsatzzuordnungen oder Gewinn. Daten, die als Maßnahme klassifiziert sind, können auf Basis einer gegebenen Dimension aggregiert werden, z.B. Gesamtumsatz (Maßnahme) nach Region (Dimension).

Aggregation ist die Zusammenfassung von Daten auf Zeilenebene zu einer höheren Kategorie, wie die Summe der Verkäufe oder der Gesamtgewinn.

Tableau sortiert die Felder in Measures und Dimensions automatisch. Bei Anomalien kann man dies jedoch auch manuell ändern.

Schritte

  1. Gehen Sie zum Arbeitsblatt. Klicken Sie auf die Registerkarte Sheet 1 unten links im Tableau-Arbeitsbereich.

  2. Sobald Sie sich im Arbeitsblatt befinden, ziehen Sie aus Dimensions im Datenbereich das Order Date in das Spaltenregal.

    Beim Ziehen des Order Date in das Spaltenregal wird eine Spalte für jedes Jahr der Bestellungen im Datensatz erstellt. Unter jeder Spalte ist ein ‚Abc‘-Indikator sichtbar, der darauf hinweist, dass hier Text- oder Zahlen- oder Textdaten gezogen werden können. Wenn wir hingegen Sales hierher zögen, würde eine Kreuztabelle erstellt, die die Gesamtverkäufe für jedes Jahr zeigt.

  3. Ähnlichermaßen kann aus dem Meßgrößen-Tab das Feld Umsatz auf die Zeilenleiste gezogen werden.

Tableau erstellt einen Diagramm mit Umsätzen, die als Summe aggregiert sind. Der Gesamtumsatz aggregiert für jedes Jahr nach dem Bestelldatum wird angezeigt. Tableau erstellt immer einen Linien diagrams für einen Ansicht, die ein Zeitfeld enthält, in diesem Beispiel ist das das Bestelldatum.

Hände am Handel

Was vermittelt das oben genannte Linien diagramm? Na ja, es zeigt an, dass der Umsatz recht versprechend aussieht und mit der Zeit zunimmt. Dies ist eine wertvolle Einsicht, aber es sagt kaum etwas über die Produkte, die zu steigenden Umsätzen beitragen. Lassen Sie uns weitere Untersuchungen durchführen, um mehr Einsichten zu erhalten.

Ansicht verfeinern

Lassen Sie uns tiefer gehen und versuchen, weitere Einsichten zu finden, welche Produkte mehr Umsätze驱动. Lassen Sie uns beginnen, indem wir die Produktkategorien hinzufügen, um den Umsätzen auf eine andere Weise zuzuschreiben.

Schritte

  1. Die Kategorie befindet sich im Bereich der Dimensionen. Ziehen Sie sie auf die Spaltenleiste und platzieren Sie sie neben YEAR(Bestelldatum). Die Kategorie sollte sich rechts neben Jahr befinden. Dadurch ändert sich die Ansicht sofort in einen Balkendiagrammtyp von einer Linie. Das Diagramm zeigt den Gesamtverkauf für jedes Produkt pro Jahr.

    Mehr erfahren

    Um Informationen zu jedem Datenpunkt (d.h. Markierung) in der Ansicht zu sehen, positionieren Sie den Mauszeiger über einer der Balken, um ein Pop-up zu entdecken. Der Pop-up zeigt den Gesamtverkauf für diese Kategorie an. Hier ist der Pop-up für die Kategorie Büromaterialien für 2016:

    Um Labels zur Ansicht hinzuzufügen, klicken Sie auf Markenlabels anzeigen in der Werkzeugleiste.

    Das Balkendiagramm kann auch horizontal anstatt vertikal dargestellt werden. Klicken Sie auf Tauschen in der Werkzeugleiste, um das zu erreichen.

 2. Die obige Ansicht zeigt die Verkäufe nach Kategorie, d.h. Möbel, Büromaterialien und Technologie. Wir können auch ableiten, dass die Verkäufe für Möbel schneller wachsen als die Verkäufe für Büromaterialien, mit Ausnahme von 2016. Daher wäre es klug, die Verkaufsbemühungen auf Möbel zu konzentrieren, anstatt auf Büromaterialien. Aber Möbel ist eine sehr breite Kategorie und umfasst viele verschiedene Artikel. Wie können wir erkennen, welcher Möbelartikel der größte Verkäufer ist?

Um diese Frage zu beantworten, entscheiden wir uns, Produkte nach Unterkategorie zu untersuchen, um zu sehen, welche Artikel die besten Verkäufer sind. Lassen Sie uns sagen, wir wollen für die Kategorie Möbel Details nur über Bücherregale, Stühle, Dekoration und Tische anschauen. Wir können das doppelklicken oder per Ziehen der Unterkategorie-Dimension auf die Spaltenladebühne tätigen.

Die Unterkategorie ist ein weiterer diskretes Feld. Sie teilt die Kategorie weiter auf und zeigt einen Balken für jede Unterkategorie aufgeteilt nach Kategorie und Jahr. Allerdings ist das eine Menge an Daten, die visuell nicht leicht verständlich sind. In der nächsten Abschnitt lernen wir über Filter, Farbe und andere Möglichkeiten, um die Ansicht verständlicher zu machen.

Hands On

3. Betonung der Ergebnisse

In diesem Abschnitt versuchen wir uns auf konkrete Ergebnisse zu konzentrieren. Filter und Farben sind Möglichkeiten, um mehr Fokus auf die Details zu legen, die uns interessieren.

Filter hinzufügen zum Anzeigen

Filter können verwendet werden, um Werte in der Ansicht einzubeziehen oder auszuschließen. Hier versuchen wir zwei einfache Filter zu einer Worksheet hinzuzufügen, um das Betrachten der Produktverkäufe nach Unterkategorien für ein bestimmtes Jahr zu erleichtern.

Schritte

Im Datenbereich, unter Dimensionen, klicken Sie mit der rechten Maustaste auf Auftragsdatum und wählen Sie Anzeige Filter aus. Diese Aktion wiederholen Sie auch für das Feld Unter-> Kategorie.

Filter sind eine Art Karten und können auf der Worksheet mithilfe eines einfachen Ziehens und Ablegens verschoben werden.

Farben hinzufügen zum Anzeigen

Farben können hilfreich sein, um ein Muster visuell zu erkennen.

Schritte

Im Datenbereich, unter Messgrößen, ziehen Sie Gewinn zu Farbe auf die Merkmale-Karte.

Es ist zu sehen, dass Buchständer, Tische und sogar Maschinen zu negativen Gewinnen, d.h. Verlusten, beitragen. Ein kraftvoller Insights.

Hands On

Wesentliche Ergebnisse

Lassen Sie uns die Filter genauer anschauen, um mehr über die nicht rentablen Produkte zu erfahren.

Schritte

  1. Im Anzeigefenster, im Filterkarteikon Unterkategorie, entfernen Sie alle Kästchen ausgenommen Bücherregale, Tische und Maschinen. Dies offenbart eine interessante Tatsache. Obwohl in manchen Jahren tatsächlich Bücherregale und Maschinen rentabel waren. Allerdings wurden Maschinen 2016 nicht mehr rentabel.
  2. Wählen Sie Alle im Filterkarteikon Unterkategorie, um alle Unterkategorien erneut anzuzeigen.
  3. Von den Dimensionen ziehen Sie Region auf die Spalte Zeilen und platzieren Sie ihn links neben dem Tab Sum(Sales). Wir bemerken, dass die Maschinen im Süden immer schlechter verkauft sind als in Ihren anderen Regionen.
  4. Geben wir nun einer Seite einen Namen. Am unteren linken Rand des Arbeitsbereichs doppelklicken Sie auf Blatt 1 und geben Sie Verkauf nach Produkt und Region ein.
  5. Um die Ansicht zu behalten, lässt Tableau es zu, dass wir unser Arbeitsblatt duplizieren, sodass wir an der Stelle fortfahren können, an der wir aufgehört haben.
  6. In Ihrem Arbeitsbuch klicken Sie mit der rechten Maustaste auf das Blatt Verkauf nach Produkt und Region und wählen Sie Duplizieren, und benennen Sie das duplizierte Blatt in Verkauf-Süd um.
  7. Im neuen Blatt ziehen Sie von den Dimensionen Region auf die Leiste Filter, um ihn als Filter im Anzeigefenster hinzuzufügen.
  8. In der Filter-Region-Eingabemaske löschen Sie alle Kästchen ausgenommen Süd und klicken Sie dann auf OK. Jetzt können wir den Verkauf und das Gewinnwachstum im Süden konzentrieren. Wir stellen fest, dass der Verkauf von Maschinen 2014 und erneut 2016 Verluste geschrieben haben. Wir werden dies in der nächsten Abschnitt untersuchen.
  9. Lastly, vergessen Sie nicht, die Ergebnisse zu speichern, indem Sie Datei > Speichern unter wählen. Nennen wir unser Arbeitsbuch Regionale Verkäufe und Gewinne.

Praktische Anleitung

4. Kartenansicht

Erstellen einer Kartenansicht

Kartenansichten sind hilfreich, wenn wir geografische Daten betrachten (das Feld Region). In dem aktuellen Beispiel erkennt Tableau automatisch, dass die Felder Land, Bundesstaat, Stadt und Postleitzahl geografische Informationen enthalten.

Schritte

  1. Erstellen Sie ein neues Arbeitsblatt.
  2. Fügen Sie Bundesstaat und Land unter dem Daten-Bereich der Merkzettelkarte unter Detail hinzu. Wir erhalten die Kartenansicht.
  3. Ziehen Sie Region auf die Filter-Leiste und filtern Sie dann auf Süd herunter. Die Kartenansicht zoomt jetzt nur noch auf die Südregion und ein Marker repräsentiert jeden Bundesstaat.
  4. Ziehen Sie die Verkäufe-Messgröße auf die Farbe-Registerkarte der Merkzettelkarte. Wir erhalten eine gefüllte Karte mit Farben, die den Verkaufsbereich in jedem Bundesstaat anzeigen.
  5. Wir können das Farbschema ändern, indem wir auf Farbe in der Merkzettelkarte klicken und Farben bearbeiten wählen. Wir können mit den verfügbaren Paletten experimentieren.
  6. Wir beobachten, dass Florida hinsichtlich der Verkäufe am besten abschneidet. Wenn wir über Florida schweben, zeigt es einen Gesamtumsatz von 89.474 USD, im Vergleich zu South Carolina beispielsweise, das nur 8.482 USD Umsatz hat. Überlegen wir jetzt die Leistung anhand von Gewinn, da Gewinn ein besserer Indikator als nur Verkäufe ist.
  7. Verschieben Sie Profit zu Color auf der Marks-Karte. Wir sehen nun, dass Tennessee, North Carolina und Florida einen negativen Gewinn haben, obwohl es aussah, als würden sie in den Verkäufen gut abschneiden. Benennen Sie die Tabelle in Profit Map

Hands On

Im Detail gehen

Maps ermöglichen es uns, die Daten breit zu visualisieren. Im letzten Schritt haben wir entdeckt, dass Tennessee, North Carolina und Florida einen negativen Gewinn haben. In diesem Abschnitt zeichnen wir einen Balkendiagramm, um die Ursache für den negativen Gewinn zu erkunden.

Schritte

  1. Duplizieren Sie die Tabelle Profit Map und nennen Sie sie Negative Profit Balkenchart.

  2. Klicken Sie auf Zeige mir in der Tabelle Negative Profit Bar Chart. Zeige mir zeigt die verschiedenen Möglichkeiten, wie ein Diagramm zwischen den in der Tabelle genannten Elementen geplottet werden kann. Wählen Sie aus Zeige mir die Option für horizontale Balken aus, und die Ansicht aktualisiert sich sofort von vertikalen auf horizontale Balken.

  3. Man kann mehrere Balken auf einmal auswählen, indem man einfach mit der Maus klickt und während des Drückens die Maus über sie zieht. Wir wollen uns nur auf die drei Staaten konzentrieren, nämlich Tennessee, North Carolina und Florida. Daher werden wir nur die Balken auswählen, die zu ihnen gehören.

    Mehr erfahren

    Erstellen von Hierarchien
    Hierarchien sind praktisch, wenn wir ähnliche Felder gruppieren möchten, um schnell zwischen Ebenen in der Visualisierung herunter zu bohren.

    1. Im Datenbereich kann man ein Feld ziehen und es direkt auf ein anderes Feld ablegen oder mit der rechten Maustaste auf das Feld klicken und auswählen
    2. Ziehe weitere Felder in die Hierarchie. Die Felder können auch in der Hierarchie neu geordnet werden, indem man sie einfach an eine neue Position zieht. In der aktuellen Visualisierung werden wir die folgenden Hierarchien erstellen: Standort, Bestellung und Produkt.
  4. Auf der Zeilenleiste klicken Sie auf das plusförmige Symbol neben dem State-Feld, um bis zum City-Niveau herunterzuarbeiten.

    1. Das sind viele Daten. Wir können N-Filter verwenden, um zu filtern und die schlechtesten Leistungen aufzudecken. Dazu ziehen Sie City aus dem Daten-Bereich auf die Filterleiste. Klicken Sie auf „Nach Feld“ und dann auf das Dropdown-Menü Oben und wählen Sie Unten, um die schlechtesten Leistungen aufzudecken. Geben Sie 5 in das Textfeld ein, um die fünf schlechtesten Leistungen in der Datensatz zu zeigen.

Wir sehen jetzt, dass Jacksonville und Miami, Florida; Burlington, North Carolina; sowie Knoxville und Memphis, Tennessee die am schlechtesten performing Städte hinsichtlich des Gewinns sind. Es gibt einen weiteren Hinweis in der Ansicht — Jacksonville, North Carolina — der hier nicht hingehört, da er profitträchtige Verkäufe hat. Dies bedeutet, dass es ein Problem mit dem Filter ist, den wir angewendet haben. Wir werden uns der Tableau-Reihenfolge der Operationen bedienen.

  1. Auf der Filterleiste klicken Sie mit der rechten Maustaste auf die Inklusionen (Land, Staat) und wählen Zum Kontext hinzufügen. Wir stellen fest, dass jetzt Concord(North Carolina) in der Ansicht auftritt, während Miami(Florida) verschwunden ist. Das macht jetzt Sinn.

  2. aber Jacksonville (North Carolina) ist immer noch vorhanden, was falsch ist. Auf der Zeilenleiste klicken Sie auf das plusförmige Symbol auf der Stadt-Registerkarte, um auf die Postleitzahlen-Ebene zu gehen. Klicken Sie mit der rechten Maustaste auf die Postleitzahl für Jacksonville, NC, 28540, und wählen Sie dann Ausschließen, um Jacksonville manuell auszuschließen.

  3. Ziehen Sie die Postleitzahl aus dem Zeilenregal. Dies ist die endgültige Ansicht.

Hands On

Wichtige Erkenntnisse

Konzentrieren wir uns jetzt nur auf die verlustbringenden Einheiten, d.h. die Produkte, und identifizieren wir auch die Standorte, an denen solche Produkte verkauft werden.

Schritte

  1. Ziehen Sie Sub-Category zu den Zeilen, um weiter herunterzubrechen.
  2. Ziehen Sie in ähnlicher Weise Profit auf Color auf der Markierungskarte. Dies ermöglicht es uns, Produkte mit negativem Gewinn schnell zu erkennen.
  3. Klicken Sie mit der rechten Maustaste auf das Order Date und wählen Sie Show Filter. Es scheint, dass Maschinen, Tische und Ordner schlecht abschneiden. Was sollten wir also tun? Eine Lösung wäre, den Verkauf dieser Produkte in Jacksonville, Concord, Burlington, Knoxville und Memphis einzustellen? Überprüfen wir, ob unsere Entscheidung richtig ist.
  4. Gehen wir zurück zum zuvor erstellten Profit Map-Registerblatt.
  5. Klicken Sie auf das Feld Unterkategorie, um die Option Filter anzeigen auszuwählen.
  6. Ziehen Sie Profit aus der Sektion Maße auf die Karte Bezeichnung Markierungen.
  7. Klicken Sie erneut auf Bestelldatum und wählen Sie Filter anzeigen. Löschen Sie im Filter die Einträge, die unserer Meinung nach zum negativen Gewinn beitragen. Entfernen Sie also die Kontrollkästchen vor Bindern, Maschinen und Tischen. Jetzt bleiben nur noch die gewinnbringenden Unternehmen übrig. Dies zeigt, dass Unternehmen wie Binder, Maschinen und Tische tatsächlich in einigen Bereichen Verluste verursachten und wir in unseren Erkenntnissen recht hatten.

Praxis

5. Dashboard

Ein Dashboard ist eine Sammlung verschiedener Ansichten, die es ermöglicht, verschiedene Daten gleichzeitig zu vergleichen.

Erstellen eines Dashboards

Schritte

  1. Klicken Sie auf die Schaltfläche Neues Dashboard.
  2. Ziehen Sie Verkäufe im Süden in das leere Dashboard
  3. Ziehen Sie Profitkarte in das Dashboard und legen Sie sie auf die Ansicht „Verkäufe im Süden“ ab. Beide Ansichten können gleichzeitig betrachtet werden. Um Daten so darzustellen, dass andere sie verstehen können, können wir das Dashboard nach unseren Wünschen anordnen.
  4. Klicken Sie in der Dashboardansicht der Tabelle Verkäufe Süd unter Region und entfernen Sie die Option Kopfzeile anzeigen. Wiederholen Sie denselben Vorgang für alle anderen Kopfzeilen. Dies hilft, nur die relevanten Informationen hervorzuheben und unwichtige Informationen auszublenden.
  5. Auf der Profit Map kann auch der Titel ausgeblendet werden und führen Sie dieselben Schritte für die Karte Verkäufe Süd aus.
  6. Wir können sehen, dass die Unter-Kategorie-Filterkarte und Jahr der Bestelldatum auf der rechten Seite wiederholt wurden. Entfernen wir die Überflüssigkeit, indem wir sie einfach durchstreichen. Klicken Sie abschließend auf Jahr der Bestelldatum. Ein Drop-down-Pfeil erscheint und wählen Sie die Option Einzelergebnis (Slider) aus. Jetzt kann die Magie beginnen. Experimentieren Sie, indem Sie verschiedene Jahre am Schieberegler wählen und beobachten Sie, wie sich die Verkäufe entsprechend ändern.
  7. Ziehen Sie den Filter SUM(Profit) zum unteren Ende des Dashboards unterhalb der Verkäufe im Süden, um einen besseren Überblick zu erhalten.

Praktische Übung

Interaktives Hinzufügen

Um das Dashboard interaktiver zu machen, z. B. zu sehen, welche Unter-Kategorien in welchen Staaten profitabel sind, müssen einige Änderungen vorgenommen werden.

Schritte

  1. Beginnen wir mit der Profit Map. Wenn Sie auf die Karte klicken, erscheint ein Als Filter verwenden-Symbol oben rechts. Klicken Sie darauf. Wenn wir eine Karte wählen, werden die Verkäufe des entsprechenden Staates in der Karte Verkäufe Süd hervorgehoben.
  2. Für Jahr der Bestelldatum, klicken Sie auf die Drop-down-Option und gehen Sie zu Auf Arbeitsblätter anwenden > Ausgewählte Arbeitsblätter. Ein Dialogfenster öffnet sich. Wählen Sie die Option Alle aus und klicken Sie auf OK. Was macht diese Option? Sie wendet Filter auf alle Arbeitsblätter an, die dieselbe Datenquelle haben.
  3. Erkunden und experimentieren. In der Visualisierung unten können wir die Karte Verkäufe Süd filtern, um nur die Produkte zu sehen, die in North Carolina verkauft werden. Danach können wir die Gewinne jährlich leicht erkunden.
  4. Benennen Sie das Dashboard in Regionale Verkäufe und Gewinne um.

Praktisch

So brachten der Verkauf von Maschinen in North Carolina dem Unternehmen keine Gewinne.

6. Geschichte

Ein Dashboard ist eine coole Funktion, aber Tableau bietet uns auch an, unsere Ergebnisse im Präsentationsmodus in Form von Geschichten zu präsentieren, über die wir in diesem Abschnitt sprechen werden.

Eine Geschichte erstellen

Schritte

  1. Klicken Sie auf die Schaltfläche Neue Geschichte.
  2. Ziehen Sie aus dem Story-Bereich links das Arbeitsblatt Verkäufe im Süden (erstellt zuvor) auf die Ansicht.
  3. Bearbeiten Sie den Text in der grauen Box über dem Arbeitsblatt. Dies ist die Bildunterschrift. Benennen Sie sie Verkäufe und Gewinne pro Jahr.
  4. Geschichten sind ziemlich spezifisch. Hier werden wir eine Geschichte über den Verkauf von Maschinen in North Carolina erzählen. Klicken Sie im Story-Bereich auf Duplizieren, um die erste Bildunterschrift zu duplizieren, oder Sie können eine neue erstellen.
  5. Wählen Sie in Unterkategorie auswählen nur Maschinen aus. Dies hilft, die Verkäufe und Gewinne von Maschinen pro Jahr zu messen.
  6. Benennen Sie die Bildunterschrift in Verkäufe und Gewinne von Maschinen pro Jahr um.

Praktisch

Ein Schlussfolgerung ziehen

Es ist klar, dass Maschinen in North Carolina zu einem Verlust von Gewinn führen. Dies kann jedoch nicht durch Betrachten von Gewinn und Verkäufen insgesamt gezeigt werden. Dafür benötigen wir regionalen Gewinn.

Schritte

  1. Wählen Sie im Story-Bereich Leer. Ziehen Sie das bereits erstellte Dashboard Regionale Verkäufe und Gewinn auf die Leinwand.
  2. Bennen Sie es als Niedrigleistende Artikel im Süden ein.
  3. Wählen Sie Duplizieren, um einen weiteren Story-Punkt mit dem Regionalen Gewinn-Dashboard zu erstellen. Wählen Sie North Carolina in der Balkengrafik, da wir daran interessiert sind, mehr darüber zu zeigen.
  4. Wählen Sie alle Jahre.
  5. Fügen Sie eine Beschriftung für Klarheit hinzu, z.B. Gewinn in NC: 2013-2016.
  6. Wählen Sie ein beliebiges Jahr wie 2014. Fügen Sie eine Beschriftung hinzu, z.B. Gewinn in NC: 2014 und klicken Sie dann auf die Schaltfläche Duplizieren. Wiederholen Sie denselben Schritt für alle verbleibenden Jahre.
  7. Klicken Sie auf den Präsentationsmodus und lassen Sie die Story sich entfalten.

Praxis

Jetzt haben wir eine Vorstellung davon, welche Produkte wann auf den Markt in North Carolina eingeführt wurden und wie sie performten. Nicht nur haben wir eine Methode gefunden, um negativen Gewinn zu beheben, sondern haben ihn auch erfolgreich mit Daten untermauert. Dies ist der Vorteil von Story in Tableau.

7. Tableaus Integration mit R, Python & SQL

Neben den verschiedenen visuellen Vorteilen, die Tableau bietet, verfügt es auch über beeindruckende Verbindungskapazitäten direkt aus der Box. Tableau kann problemlos mit Sprachen wie Python und R integriert werden und auch mit Datenbankmanagementsystemen wie SQL. Dies bringt zusätzliche Vorteile hinsichtlich der Funktionalitäten und ist für Datenwissenschaftler nützlich, die mit Python oder R arbeiten sind. Sie können direkt die R- und Python-Skripte in Tableau importieren und den visualisierten Vorteil nutzen, der weit überlegen ist als in diesen Sprachen. Außerdem sind die Visualisierungsfähigkeiten von Tableau einfach zu verwenden und sehr intuitiv, was dem Data Scientist viel Zeit spart.

In diesem Abschnitt werden wir sehen, wie wir Tableau mit diesen externen Quellen verbinden können und die Vorteile dieser Verbindungen erkennen.

Tableau und R

R ist eine populäre statistische Sprache, die zur Durchführung fortschrittlicher vorhersagender Analysen verwendet wird, wie z.B. lineare und nichtlineare Modelle, statistische Tests, Zeitreihenanalyse, Klassifikation, Clustering usw.(Tableau 8.1 und R) Der Einsatz von Tableau in Verbindung mit R bringt die folgenden Vorteile:

  • Es nutzt die statistische Leistung von Tableau, indem es seinen Benutzern Zugriff auf fortschrittliche R-Bibliotheken bietet, um besser und tiefergehende Einsichten aus den Daten zu gewinnen.
  • Tableaus verbesserte Datenexplorationsoptionen und die Fähigkeit, auf mehrere Quellen zuzugreifen, sind für R-Nutzer von Vorteil.
  • Sowie es auch Tableau-Nutzern ermöglicht, die Nutzen der R-Sprache zu nutzen, ohne dass sie die Sprache tatsächlich kennen müssen.

Wie integriert sich Tableau mit R?

R-Funktionen und -Modelle können in Tableau verwendet werden, indem neue berechnete Felder erstellt werden, die dynamisch die R-Engine aufrufen und Werte an R übergeben. Diese Ergebnisse werden dann an Tableau zurückgegeben, um für Visualisierungszwecke verwendet zu werden.

Einrichten von Tableau Desktop mit R

  • Laden Sie Rserve herunter und installieren Sie es.

Sie müssen das Rserve-Paket herunterladen und installieren, damit Tableau eine Verbindung herstellen und die R-Skriptfunktionen nutzen kann. Geben Sie im R-Konsolenfenster die folgenden Befehle ein:

install.packages(“Rserve”) library(Rserve) Rserve() / Rserve(args = ‘ — no-save’)

Verbindung von Tableau zum R-Server herstellen

Nachdem Rserve erfolgreich installiert wurde, öffnen Sie Tableau Desktop und folgen Sie den unten genannten Schritten.

  1. Gehen Sie zu Hilfe > Einstellungen und Voreinstellungen und wählen Sie Externe Dienstverbindung verwalten.

  2. Geben Sie den Servernamen als „Localhost“ (oder „127.0.0.1“) und einen Port von „6311“ ein.

  3. Klicken Sie auf die Schaltfläche „Verbindung testen“. Sie sollten eine erfolgreiche Meldung sehen. Klicken Sie auf OK, um zu schließen.

Beginnen Sie mit dem Einsatz von R-Skripten in Tableau

Nach erfolgreichem Abschluss der oben genannten Schritte können wir in Tableau Desktop neue berechnete Felder erstellen, die auf die SCRIPT_*-Funktionen verweisen, um R-Funktionalität aufzurufen.

Lassen Sie uns anfangen und sehen, wie wir die Kapazitäten von Tableau mit R verwenden können.Wir werden die integrierte Sample Superstore-Datenbank verwenden, um Gewinn sowohl mit R-Skript als auch mit der Drag-and-Drop-Funktion von Tableau zu berechnen. Anschließend vergleichen wir beide Ergebnisse.

Schritte

  1. Öffnen Sie ein Tableau-Arbeitsblatt und verbinden Sie sich mit den Sample Superstore-Daten.
  2. Verbinden Sie mit Rserve. Sobald Tableau Desktop mit Rserve verbunden ist, kann es die R-Engine über berechnete Felder aufrufen.
  3. Wir werden nun ein berechnetes Feld namens Erwarteter Gewinn erstellen.

    Es stehen vier Funktionen für den Einsatz mit R zur Verfügung, die alle mit dem Wort script beginnen. Die Funktionen sind:

    • SCRIPT_REAL: gibt reelle Zahlen als Ergebnis zurück
    • SCRIPT_STR: gibt einen String zurück
    • SCRIPT_INT : gibt Ganzzahlen zurück
    • SCRIPT_BOOL: gibt boolesche Werte zurück
    • Für dieses Beispiel werden wir die SCRIPT_REAL-Funktion verwenden. Wir werden in Tableau eine einfache lineare Regression erstellen.
  4. Öffne die berechnete Spalte und füge den folgenden Skriptcode ein.

    SCRIPT_REAL("fit <- lm(.arg1 ~ .arg2 + .arg3 + .arg4) fit$fitted ", SUM([Profit]), AVG([Sales]), AVG([Quantity]), AVG([Discount]))

    Das oben stehende Skript betrifft das lineare Regressionsmodell in R. Dieses Modell wird eine abhängige Variable (arg1) und drei unabhängige Variable (arg2, arg3, arg4) haben. Diese Argumente sind nur Platzhalter und werden beim Zurückübertragen des Skripts in R mit den Tabellen-Spalten ersetzt, die sie repräsentieren. 5. Geben Sie die Tabellenfelder ein, die sich auf jede Variable beziehen. Die abhängige Variable hier ist Gewinn, daher geben wir zuerst SUM(Profit) ein, da dies auf Argument 1 verweist. Ähnlichermaßen verwenden wir die Durchschnittspreis pro Einheit, Durchschnittsmenge pro Bestellung und Durchschnittsrabatt für die anderen drei Argumente.

  5. Diese Eingaben werden nun alle in das Modell für die Berechnung der erwarteten Gewinnstufen aufgenommen. Wir sind nun bereit, diese Berechnung in Tableau-Visualisierungen zu verwenden. Ziehe Kategorie in die Spalte und dann Gewinn in die Zeile. Ziehe nun Erwarteter Gewinn in die Spalte.

  6. Wir können nun das Modell analysieren, um zu sehen, wie der erwartete Gewinn, berechnet in R, mit den tatsächlichen Gewinnen compares. Wir können diese Analyse weiterführen, indem wir Kundensegmente auf die Farben ziehen und so ein gestapeltes Balkendiagramm erstellen, das auch geordnete Daten verwenden kann, um die Daten nach Jahren oder Quartalen aufzuteilen.

Hands On

Man mag sich fragen, ob alle obigen Berechnungen auch in Tableau durchgeführt werden könnten, ohne R zu verwenden. Warum also sollten wir den Prozess der Installation und Konfiguration von Rserve in Tableau durchführen und Skripte schreiben? R ist eine kraftvolle Sprache aufgrund seiner Fähigkeit zu prognostizieren, indem es weit verbreitete Bibliotheken mit leicht zugänglichen bekannten Algorithmen verwendet. Stellen Sie sich nur vor, wie schön es wäre, in Tableau mit Hilfe eines einfachen R-Skripts Prognosen für unser Geschäft zu treffen und diese dann in Tableaus Visualisierungen einzubinden.

Tableau und Python

Python ist eine weitverbreitete, allgemeine Programmiersprache, die eine Vielzahl von Bibliotheken für statistische Analyse, vorhersagehafte Modelle oder maschinelles Lernen bereitstellt. Die Verbindung von Tableau mit Python ist eine der besten Methoden für prädiktives Analytik. Tabpy ist ein Paket, das dafür entwickelt wurde, dieselben Aufgaben zu erledigen. Um Tableau dazu zu bringen, die Leistung von Python zu nutzen, kann es mit dem TabPy-Server verbunden werden, um Python-Code auf der Stelle auszuführen und die Ergebnisse in Form von Visualisierungen anzuzeigen.

Wie integriert Tableau Python?

Wenn wir TabPy mit Tableau verwenden, können wir in Python berechnete Felder definieren, um so die Leistung einer Vielzahl von maschinellem Lernen-Bibliotheken direkt von unseren Visualisierungen aus zu nutzen.

Tableau Desktop mit Python einrichten

Herunterladen und Installieren von Tabpy.

Der Ausführung eines Python-Codes innerhalb eines Tableau-Arbeitsblatts ist ein Python-Server notwendig. Die TabPy-Plattform ist dafür verantwortlich. Laden Sie TabPy von Github unter folgendem Link herunter. Alternativ können Sie die Schritte unten befolgen:

conda install -c anaconda tabpy-server

Gehen Sie dann in das Verzeichnis, das die heruntergeladene TabPy-Serverdatei enthält, und führen Sie die Datei aus.

python setp.py

Tableau mit TabPy verbinden

Der nächste Schritt besteht darin, Tableau mit TabPy zu verbinden. Dies kann erledigt werden, indem Sie zu Hilfe > Einstellungen und Leistung > Externe Dienstverbindung verwalten:

Testen Sie die Verbindung. Wenn alles reibungslos abläuft, sollten Sie mit einer „erfolgreich verbunden“ Meldung begrüßt werden.

Verwenden Sie Python-Skripte in Tableau.

Die Python-Integration in Tableau ist eine sehr nützliche Funktion. Denken Sie mal an das Problem der Meinungsanalyse. Es ist ein allgemeines Problem in der Maschinenlerngemeinschaft und kann mit verschiedenen maschinellen Lernalgorithmen gelöst werden. Allerdings kann das gleiche mit der Kombination von Tableau und Python in wenigen Zeilen Python-Code erreicht werden. Die Ergebnisse können dann in Tableau可视化ized werden, um weitere Einsichten zu erhalten. Lasst uns das mit einem Beispiel(Nutzen Sie die Stärke von Python in Tableau mit TabPy)

Meinungsanalyse mit Tabpy

veranschaulichen. Wir werden das Datensatzset von mobilen Bewertungen verwenden, das von hier her heruntergeladen werden kann.

Schritte:

  1. Importieren Sie das Datensatzset in Tableau Desktop
  2. Verbinden Sie mit Tabpy. Sobald Tableau Desktop mit Tabpy verbunden ist, kann es über berechnete Felder den Python-Motor aufrufen.
  3. Wir werden nun ein berechnetes Feld namens Sentiment wie folgt erzeugen: `

    SCRIPT_REAL("from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer vs = [] analyzer = SentimentIntensityAnalyzer() for i in range(0,len(_arg1)): a = analyzer.polarity_scores(_arg1[i])['compound'] vs.append(a) return vs",ATTR([Reviews]))`

    Wir verwenden hier die VADER-Sentimentanalyse.-Tools. Es ist ein auf Wörterbuch und Regelbasis basierte Sentimentanalyse-Tools, dass speziell auf die in Social Media geäußerte Meinungen eingestellt ist. Um dieses Tool zu verwenden, müssen Sie es zunächst installieren. Bitte lesen Sie mehr auf ihrer GitHub-Seite.

  4. Nun ziehen Sie Reviews in die Spalten und Sentiment in die Karte Text und Farbmarkierungen und sehen, was passiert. Die Sentimentanalyse der Bewertungen erledigt sich ohne jegliche Mühe. Es wird auch super einfach, die Ergebnisse visuell zu verstehen. Die positive Bewertungen sind in aufsteigender Reihenfolge grün, während die negative in rot sind.

Der obige Beispiel zeigt eindeutig die Stärke, die durch die Integration von Tableau mit Python entsteht. Durch die Verfügbarkeit der Meinungsschwankungswerte können wir darauf eingehen, um detailliertere Informationen zu erhalten. Zum Beispiel kann ich als Geschäftsinhaber negative Kundenbewertungen filtern und über die Gründe nachdenken. Ich kann auch auf positive Bewertungen achten, um mehr über die Produkte zu erfahren, die Kunden zufrieden machen.

Tableau und SQL Server

In unseren Microsoft SQL Server-Daten versteckt sich ein Wert, der unter den Standardberichten und komplizierten Geschäftsintelligenzwerkzeugen verschwindet. Tableau bietet Insights überall an, indem es jeder mit einer fortschrittlichen visuellen Analyse von SQL Server-Daten ausrüsten kann. Wir können Tableau mit SQL Server live verbinden, um optimierte, plattformspezifische Abfragen auszuführen oder die Daten direkt in Tableaus Analysestrahlungsvermögen bringen, um die Belastung der Datenbank zu verringern.

Tableau bietet eine optimierte, live Verbindung zu SQL Server, sodass wir Charts, Berichte und Dashboards direkt mit unseren Daten erzeugen können. Während wir unser Analysequellenmaterial durcharbeiten, erkennt Tableau jedes Schema, das in SQL Server verwendet wird, sodass wir unsere Daten nicht manipulieren müssen.

Lassen Sie uns ein Beispiel durchgehen, das zeigt, wie man eine SQL Server-Datenbank mit Tableau Desktop verknüpft und dann dafür visuelle Darstellungen erstellt.

Schritte:

  1. Login auf dem SQL Server
  2. Öffne Tableau Desktop und kenne dich unter Servern mit MS SQL ein.
  3. Bei der Verbindung von Tableau mit dem SQL Server geben Sie den Servernamen in das sich öffnende Dialogfeld ein und klicken auf OK. Dadurch wird Tableau mit dem SQL Server verbunden. Wählen Sie die gewünschte Datenbank aus. In diesem Beispiel wählen wir salesDB. Wir können auch aus einer Liste von TABLEN wählen, z. B. Sales Log. Die Tabelle wird in die Tableau-Umgebung importiert. Jetzt können wir entscheiden, ob wir die gesamten Daten oder einen Teil davon in ein neues Arbeitsblatt extrahieren möchten. Wir können sogar die Anzahl der zu extrahierenden Zeilen angeben.
  4. Auf dem neuen Arbeitsblatt haben wir die extrahierten Daten von MS SQL, von dort aus können wir mit ihnen wie mit jedem anderen Tableau-Arbeitsblatt arbeiten.

Praktika:

So können wir SQL Server problemlos mit Tableau verbinden und die Daten direkt dort extrahieren. Tableau ermöglicht es den Benutzern, Verbindungen mit einem Klick umzuschalten, um in-Memory-Abfragen auf größere Datensätze anzuwenden.

8. Arbeit speichern

Tableau Desktop

Um ein Tableau-Arbeitsbuch lokal zu speichern, wählen Sie Datei > Speichern. Geben Sie den Arbeitsbuchnamen im Dialogfeld Speichern unter an. Standardmäßig speichert Tableau die Datei mit der Erweiterung .twb.

Tableau Public

Bei Tableau Public werden alle Ansichten und Daten öffentlich gemacht, und jeder im Internet hat Zugriff darauf. Wählen Sie Server > Tableau Public > Auf Tableau Public speichern und geben Sie die Anmeldeinformationen ein.

Tableau Server

In dem Fall, dass die Daten vertraulich sind und die Geschichte mit dem gesamten Team geteilt werden muss, kommt Tableau Server gelegen. Um eine Geschichte auf Tableau Server zu veröffentlichen, wählen Sie Server auswählen > Workbook veröffentlichen oder klicken auf Teilen in der Symbolleiste. Achten Sie jedoch darauf, zunächst ein Konto zu erstellen.

Schlussfolgerung

Das ist alles, was wir benötigen, um eine gute Visualisierung in Tableau zu erstellen, obwohl man möglicherweise in jedem Stadium mehr Überarbeitung vornimmt als hier gezeigt. Also durch Experimentieren und Übung wird Tableau immer vertrautlicher und wird erstaunliche Funktionen freisetzen, um uns bei der Analyse und Präsentation von Daten zu helfen. Kommentieren Sie bitte unten, falls Sie Fragen haben, und eine fröhliche Visualisierung!

Sehen Sie sich unser Tableau-Visualisierungen mit AirBnB-Datensatz Tutorial an.

Source:
https://www.datacamp.com/tutorial/data-visualisation-tableau