Data visualisatie met Tableau

Ons doel als Data Analysts is om de inzichten uit onze data zo uit te leggen dat iedereen die ze ziet in staat is hun implicaties te begrijpen en duidelijk te kunnen handelen op basis daarvan.

Tableau is een gereedschap voor dataanalyse en visualisatie dat breed gebruikt wordt in de industrie vandaag de dag. Veel bedrijven beschouwen het zelfs als onvervangbaar voor werkzaamheden gerelateerd aan data wetenschap. Het gemak van Tableau komt uit het feit dat het een sleep-en-drop-interface heeft. Deze functie helpt taken als sorteren, vergelijken en analyseren gemakkelijk en snel uit te voeren. Tableau is ook compatible met vele bronnen, inclusief Excel, SQL Server en cloudgebaseerde dataopslaglocaties, wat het een uitstekende keuze maakt voor Data Scientists.

1. Inleiding tot Tableau

Overzicht

Tableau Software is een softwarebedrijf gevestigd in Seattle, Washington, dat interactieve datavisualisatieproducten ontwikkelt die gericht zijn op bedrijfsintelligentie. Tableau werd opgericht aan de Stanford Universiteit, afdeling Computerwetenschappen, tussen 1997 en 2002(Wikipedia)

De hoofdproducten die Tableau aanbiedt zijn:

Tableau Desktop, Tableau Public en Tableau Online, die allemaal mogelijkheden bieden voor datavisualisatiecreatie. De keuze hangt af van het soort werk.

Installatie

Afhankelijk van de gekozen productkeuze, downloadt u de software op de computer. Nadat u het licentieovereenkomst hebt geaccepteerd, kunt u de installatie controleren door op het Tableau-pictogram te klikken. Als het volgende scherm verschijnt, bent u klaar om te beginnen.

2. Aan de slag

In dit onderdeel leren we enkele basisbewerkingen in Tableau om zich aan de interface te wennen.

Tableau-werkruimte

De Tableau-werkruimte is een verzameling van werkbladen, menubalk, werkbalk, merktekenskaart, planken en veel andere elementen waarover we in latere onderdelen zullen leren. Bladen kunnen werkbladen, dashboards of verhalen zijn. Het onderstaande plaatje geeft de belangrijkste componenten van de werkruimte aan. Echter, meer bekendheid zal worden verkregen zodra we met actuele gegevens gaan werken.

source:Tableau.com

Verbinden met een gegevensbron

Om te beginnen met werken met Tableau, moeten we Tableau verbinden met de gegevensbron. Tableau is compatibel met veel gegevensbronnen. De door Tableau ondersteunde gegevensbronnen verschijnen aan de linkerzijde van het startscherm. Sommige veelgebruikte gegevensbronnen zijn Excel, tekstbestand, relationele database of zelfs op een server. Men kan ook verbinden met een cloudgegevensbron zoals Google Analytics, Amazon Redshift, etc.

Het startscherm van Tableau Desktop toont de beschikbare gegevensbronnen waarmee je kunt verbinden. Het is ook afhankelijk van de versie van Tableau omdat de betaalde versie meer mogelijkheden biedt. Aan de linkerzijde van het scherm bevindt zich een Verbinden paneel dat de beschikbare bronnen accentueert. Bestandstypen worden eerst genoemd, gevolgd door algemene servertypen, of de servers waarmee onlangs is verbonden. Onder het tabblad Openen kun je eerder gemaakte werkboeken openen. Tableau Desktop biedt ook enkele voorbeeldwerkboeken onder Voorbeeldwerkboeken.

Handson

Verbinden met de Sample-Superstore dataset

We zullen aan de slag gaan met een voorbeeldgedataset genaamd Superstore dataset, dat vanaf de voorgeladen dataset van Tableau uitgelezen wordt. Het bestand zal echter vanaf hier gedownload worden, zodat we kunnen vaststellen hoe we verbinding kunnen maken met een Excel gegevensbron. Het gegevensbestand betreft een supermarkt. Het bevat informatie over producten, verkopen, winsten, enzovoort. Ons doel als Data Analysts is het analyseren van de gegevens en het vinden van kritieke verbeteringsgebieden binnen deze fictieve onderneming.

Stappen

  1. Importeer de gegevens in het Tableau werkruimte vanaf de computer.

  2. Bij het klikken op de tabblad ‘Sheets’ zullen drie bladen zichtbaar worden: Orders, People en Returns. We zullen echter alleen maar gegevens uit het Ordersbestand behandelen. Dubbelklikken op de blad ‘Orders’ en het opent net alsof het een spreadsheet is.

  3. We merken op dat de eerste drie rijen van de gegevens iets anders uitzien en niet in de gewenste indeling zijn. Hier maakten we gebruik van Data Interpreter, dat eveneens onder het tabblad ‘Sheets’ te vinden is. Door erop te klikken krijgen we een mooi geformatteerd blad.

Hands On

Creating a View

We zullen beginnen met het genereren van een eenvoudige grafiek. In dit gedeelte zullen we onze data leren kennen en zullen we beginnen met vragen te stellen over de data om inzichten te krijgen. Er zijn enkele belangrijke termen die we in dit gedeelte zullen tegenkomen.

Dimension

Measures

Aggregation

Dimensions zijn kwalitatief data, zoals een naam of datum. Standaard classificeert Tableau automatisch gegevens die qualitative of categorische informatie bevatten als een dimensie, bijvoorbeeld, elke veld met tekst of datumwaarden. Deze velden verschijnen meestal als kolomheaders voor rijen gegevens, zoals Klantnaam of Besteldatum, en definiëren ook de granulatietype die in de weergave getoond wordt.

Measures zijn quantitatieve numerieke gegevens. Standaard behandelt Tableau elk veld dat deze soort gegevens bevat als een maateenheid, bijvoorbeeld, verkooptransacties of winst. Gegevens die als maateenheid zijn geclassificeerd kunnen worden geaggregeerd op basis van een gegeven dimensie, bijvoorbeeld, totale verkopen (Maateenheid) per regio (Dimensie).

Aggregatie is de gegevens op rijniveau die worden samengevat tot een hogere categorie, zoals de som van de verkopen of het totale profit.

Tableau sorteert automatisch de velden in Maatstaven en Dimensionen. Echter, voor elke afwijking kan dat ook handmatig worden aangepast.

Stappen

  1. Ga naar het werkblad. Klik op de tab Blad 1 in de linkerbenedenhoek van het Tableau-werkgebied.

  2. Eenmaal op het werkblad, sleep vanuit Dimensionen onder het Data pane de Besteldatum naar de kolombalk.

    Bij het sleepen van de Besteldatum naar de kolombalk, wordt in het gegevensset voor elk jaar van bestellingen een kolom aangemaakt. Een ‘Abc’-indicator is zichtbaar onder elke kolom, wat impliceert dat er tekst of numerieke of tekstgegevens hier naartoe kunnen worden gesleept. Andersom, als we de Verkopen hiernaar zouden trekken, zou een kruisvergelijking worden aangemaakt die de totale Verkopen voor elk jaar zou weergeven.

  3. Evenzo, sleep vanuit het tabblad Maten het veld Verkopen naar de rijenplank.

Tableau vult een grafiek met verkopen, geaggregeerd als een som. De totale geaggregeerde verkoop per jaar, volgens orderdatum, wordt weergegeven. Tableau vult altijd een lijndiagram in voor een weergave die een tijdveld bevat, wat in dit voorbeeld de orderdatum is..

Hands On

Wat laat het bovenstaande lijndiagram zien? Wel, het toont aan dat de verkopen er veelbelovend uitzien en lijken toe te nemen in de loop van de tijd. Dit is een waardevol inzicht, maar het zegt weinig over de producten die bijdragen aan de toename van de verkopen. Laten we verder onderzoeken om meer inzichten te verkrijgen.

De weergave verfijnen

Laten we dieper graven en proberen meer inzichten te verkrijgen over welke producten meer verkopen stimuleren. Laten we beginnen met het toevoegen van de productcategorieën om de verkooptotalen op een andere manier te bekijken.

Stappen

  1. Categorie staat onder het venster Dimensies. Sleep het naar de kolomshelf en plaats het naast JAAR(Orderdatum). Categorie moet aan de rechterkant van Jaar geplaatst worden. Door dit te doen, verandert de weergave onmiddellijk van een lijngrafiek naar een staafgrafiek. Het diagram toont de algemene Verkopen voor elk Product per jaar.

    Meer informatie

    Om informatie over elk datapunt (dat wil zeggen, markering) in de weergave te bekijken, ga je met de muis over een van de balken om een tooltip te tonen. De tooltip toont de totale verkoop voor die categorie. Hier is de tooltip voor de categorie Kantoorartikelen uit 2016:

    Om labels aan de weergave toe te voegen, klik je op Markeringlabels weergeven op de werkbalk.

    De staafgrafiek kan ook horizontaal in plaats van verticaal worden weergegeven. Klik op Wissel op de werkbalk voor dezelfde functie.

 2. De bovenstaande weergave toont mooi de verkopen per categorie, d.w.z. meubels, kantoorbenodigdheden en technologie. We kunnen ook afleiden dat de verkoop van meubels sneller groeit dan de verkoop van kantoorbenodigdheden, behalve in 2016. Daarom is het verstandig om de verkoopinspanningen te richten op meubels in plaats van kantoorbenodigdheden. Maar meubels is een brede categorie en bestaat uit veel verschillende items. Hoe kunnen we identificeren welk meubelstuk bijdraagt aan de maximale verkoop?

Om ons te helpen die vraag te beantwoorden, besluiten we te kijken naar producten per Sub-categorie om te zien welke items de grote verkopers zijn. Laten we zeggen voor de Meubels categorie; we willen alleen naar details kijken over boekenkasten, stoelen, meubels en tafels. We zullen dubbelklikken of de Sub-categorie dimensie naar de kolomplank slepen.

De sub-categorie is een ander discreet veld. Het splitst verder de Categorie en toont een balk voor elke sub-categorie verdeeld per categorie en jaar. Het is echter een enorme hoeveelheid gegevens om visueel te begrijpen. In de volgende sectie leren we over filters, kleur en andere manieren om de weergave begrijpelijker te maken.

Aan de slag

3. Resultaten benadrukken

In dit gedeelte zullen we proberen te focussen op specifieke resultaten. Filters en kleuren zijn manieren om meer aandacht te schenken aan de details die ons interesseren.

Filters toevoegen aan de weergave

Filters kunnen worden gebruikt om waarden in of uit de weergave op te nemen. Hier proberen we twee eenvoudige filters aan het werkblad toe te voegen om het gemakkelijker te maken om de verkoop van producten per subcategorie voor een bepaald jaar te bekijken.

Stappen

Klik in het Data-paneel, onder Dimensies, met de rechtermuisknop op Besteldatum en selecteer Toon filter.Herhaal dit ook voor het veld Sub->categorie.

Filters zijn van het type kaarten en kunnen op het werkblad verplaatst worden door ze simpelweg te verslepen en neer te zetten

Kleuren toevoegen aan de weergave

Kleuren kunnen helpen bij de visuele herkenning van een patroon.

Stappen

Neem in het Data-paneel, onder Maten, Profit en sleep deze naar Kleur op de Merkenkaart.

Je kunt zien dat Boekenkasten, Tafels en zelfs Machines bijdragen aan negatieve winst, dat wil zeggen verlies. Een krachtige inzicht.

Aan de slag

Belangrijkste bevindingen

Laten we de filters nader bekijken om meer over de onrendabele producten te ontdekken.

Stappen

  1. In de weergave, in de Sub-Category filter kaart, deselecteer alle keuzes behalve Boekenkasten, Tafels en Machines. Dit toont een interessant feit. Terwijl in sommige jaren, Boekenkasten en Machines effectief winstgevend waren. Echter, in 2016 werd de Machine niet meer winstgevend.
  2. Selecteer Alles in de Sub-Category filter kaart om alle subcategorieën weer te geven.
  3. Van de Dimensions, sleep Regio naar de Rijen plank en plaats hem links van de Sum(Sales) tab. We merken dat machines in het Zuiden een negatief winstverschil hebben vergeleken met uw andere regio’s.
  4. Geef nu een naam aan het blad. Bij de linkeronderhoek van het werkblad, dubbelklik op Blad 1 en typ Verkoop per Product en Regio.
  5. Om de weergave te behouden, laat Tableau ons een werkblad klonen zodat we kunnen doorgaan op een ander blad waar we mee opgehouden hebben.
  6. In uw werkbook, klik rechts op het blad Verkoop per Product en Regio en selecteer Klonen en hernoem het geklonneerde blad naar Verkoop-Zuid.
  7. In het nieuwe werkblad, van Dimensions, sleep Regio naar de Filters plank om het als filter in de weergave toe te voegen.
  8. In het Filter Regio dialoogvenster, selecteer alle keuzes behalve Zuid en klik dan op OK. Nu kunnen we ons focus leggen op de verkopen en winst in de Zuid. We zien dat de verkoop van machines een negatieve winst hadden in 2014 en opnieuw in 2016. We zullen dit onderzoeken in de volgende sectie.
  9. Laat niet vergeet om de resultaten op te slaan door te selecteren Bestand > Opslaan als. Laten we onze werkmap de naam geven Regionale Verkopen en Winsten.

Aan de slag

4. Kaartweergave

Creëer een Kaartweergave

Kaartweergaven zijn nuttig wanneer we geografische gegevens bekijken (het Veld van de Regio). In het huidige voorbeeld herkent Tableau automatisch dat de Velden van Land, Staat, Stad en Postcode geografische informatie bevatten.

Stappen

  1. Maak een nieuwe werkblad.
  2. Voeg Staat en Land onder het Gegevensvenster toe aan Detail op de Merkenkaart. We krijgen een kaartweergave.
  3. Sleep Regio naar de Filters plank en filter vervolgens af op alleen Zuid. De kaartweergave zoomt nu in op alleen de Zuid-regio en een merk representeert elke staat.
  4. Sleep de maat Verkopen naar het tabblad Kleur op de Merkenkaart. We krijgen een ingevulde kaart met kleuren die het verkoopbereik in elke staat tonen.
  5. We kunnen het kleurenschema wijzigen door te klikken op Kleur op de Merkenkaart en Kleuren bewerken te selecteren. We kunnen experimenteren met de beschikbare paletten.
  6. We zien dat Florida het beste presteert in termen van Verkopen. Als we over Florida heen zweven, wordt een totaal van 89.474 USD in verkopen getoond, vergeleken met bijvoorbeeld South Carolina, die slechts 8.482 USD in verkopen heeft. Laten we de prestaties nu meten door Winst, omdat Winst een beter indicator is dan alleen Verkopen.
  7. >

    Drag Winst naar Kleur op het Merkenkaart. We zien nu dat Tennessee, North Carolina en Florida een negatieve winst hebben, hoewel het lijkt alsof ze goed presteren in Verkopen. Hernoem het blad naar Winstkaart

Handen aan de werk

Naar de Details

Maps geven ons de mogelijkheid om de gegevens breed te visualiseren. In de laatste stap ontdekten we dat Tennessee, North Carolina en Florida een negatieve winst hebben. In dit gedeelte maken we een Bar diagram om de reden van de negatieve winst te onderzoeken.

Stappen

  1. Maak een kopie van het Winstkaart werkblad en noem het Negatieve Winst Bar Diagram.

  2. Klik op Laat Me Zien op het Negatieve Winst Bar Diagram werkblad. Laat Me Zien presenteert de verschillende manieren waarop een grafiek kan worden geplooid tussen de items genoemd in het werkblad. Selecteer vanuit Laat Me Zien de horizontale balkoptie en de weergave wordt direct van verticale naar horizontale balken.

  3. Je kunt meer dan één staaf tegelijk selecteren door gewoon te klikken en de muis te verslepen over ze. We willen ons alleen richten op de drie staten, namelijk Tennessee, North Carolina en Florida. Daarom zullen we alleen de staafjes selecteren die daarbij horen.

    Meer informatie

    Hiërarchieën aanmaken
    Hiërarchieën zijn handig wanneer je soortgelijke velden wilt groeperen zodat je snel tussen niveaus kunt doorgraven in de vizualisatie.

    1. In het Gegevensvenster, sleep een veld en laat het direct boven een ander veld vallen of klik met de rechtermuisknop op het veld en selecteer
    2. Sleep extra velden naar de hiërarchie. Velden kunnen ook in de hiërarchie worden herschikt door ze eenvoudig naar een nieuwe positie te slepen. In de huidige vizualisatie zullen we de volgende hiërarchieën aanmaken: Locatie, Bestelling en Product.
  4. Klik op de icon met het plusteken op het veld State op de Rijenregel om naar het niveau van de City te drilleren.

    1. Dat is veel data. We kunnen de N-Filter gebruiken om te filteren en de zwakste prestaties aan te tonen. Voor dat doel sleep je de City vanuit het Data paneel naar de Regelschappij. Kies Voor veld en klik vervolgens op de keuzelijst Top en selecteer Bottom om de zwakste prestaties aan te tonen. Typ 5 in het tekstvak om de laatste 5 prestaties in het gegevensset weer te geven.

Wij zien nu dat Jacksonville en Miami, Florida; Burlington, North Carolina; en Knoxville en Memphis, Tennessee de slechtste presterende steden op winst zijn. Er is nog een andere markering in het overzicht – Jacksonville, North Carolina – die hier niet thuishoort omdat het winstgevende verkoop heeft. Dit betekent dat er een probleem zit in de filter die we hebben toegepast. We zullen de hulp van Tableau Order of Operations inroepen.

  1. Op het Filterscherm, klikt u met de rechtermuisknop op de Inclusions (Country, State) set en selecteert u Toevoegen aan Context. We zien nu dat Concord(North Carolina) in beeld verschijnt terwijl Miami(Florida) verdwenen is. Dit maakt nu meer sense.

  2. Maar Jacksonville (North Carolina) is nog steeds aanwezig wat onjuist is. Op de Rijenbalk, klikt u op het plusvormige icoon op het tabblad City om in detail te gaan tot het niveau van de postcode. Klikt u met de rechtermuisknop op de postcode voor Jacksonville, NC, 28540, en selecteert u vervolgens Uitsluiten om Jacksonville handmatig uit te sluiten.

  3. Sleep de Postcode van de Rij-plank. Dit is het uiteindelijke overzicht.

Hands On

Belangrijkste Bevindingen

Laten we ons nu alleen richten op de verliesgevende entiteiten, d.w.z. de Producten en laten we ook de locaties identificeren waar dergelijke producten worden verkocht.

Stappen

  1. Sleep Sub-Category naar de Rijen om verder in te zoomen.
  2. Sleep op dezelfde manier de Profit naar Color op de Marks-kaart. Dit stelt ons in staat om producten met negatieve winst snel te spotten.
  3. Klik met de rechtermuisknop op de Order Date en selecteer Show Filter. Het lijkt erop dat machines, tafels en ordners slecht presteren. Wat moeten we doen? Een oplossing zou zijn om de verkoop van deze producten in Jacksonville, Concord, Burlington, Knoxville en Memphis te stoppen? Laten we controleren of onze beslissing juist is.
  4. Laten we teruggaan naar het eerder gemaakte Profit Map-blad.
  5. Nu klik je op het veld Sub-Category om de optie Show Filter te selecteren.
  6. Sleep Profit van onder Measures naar de Label Marken kaart.
  7. Opnieuw klik je op Order Date en selecteer Show Filter. Vanuit het filter laat we de items die we denken bijdragen aan een negatieve winst verwijderen. Dus deactiveer de aanvinksters voor Binders, Machines en Tafels respectievelijk. Nu resteren alleen de winstgevende entiteiten. Dit toont dat de entiteiten als Binders, machines en tafels in feite verliezen veroorzaakten in sommige gebieden, en dat ons ontdekkingen correct waren.

Hands On

5. Dashboard

Een dashboard is een verzameling van verschillende weergaven, die het mogelijk maken om verschillende gegevens tegelijkertijd te vergelijken.

Een Dashboard maken

Stappen

  1. Klik op de knop Nieuwe dashboard.
  2. Sleep Verkoop in het Zuiden naar het lege dashboard
  3. Sleep Profit Kaart naar het dashboard en laat hem bovenop de weergave Verkoop in het Zuiden vallen. Beide weergaven kunnen tegelijk worden bekeken. Om gegevens op een manier aan te bieden die door anderen begrepen kan worden, kunnen we het dashboard naar ons eigen smaak aanpassen.
  4. Op de werkblad Verkoop Zuid in de dashboardweergave, klik onder Regio en deactiveer Show Header. Herhaal hetzelfde proces voor alle andere headers. Dit helpt om alleen de nodige informatie uit te laten zien en de minder belangrijke informatie te verbergen.
  5. Op de Profit Kaart verberg de titel evenals voor de Verkoop Zuid kaart dezelfde stappen uitvoeren.
  6. We kunnen zien dat de Subcategorie filter kaart en de Bestel Datum Jaar op de rechterkant zijn herhaald. Laten we de extra’s weghalen door ze simpelweg door te trekken. Kies uiteindelijk op de Bestel Datum Jaar. Een dropdown pijl verschijnt en selecteer de optie voor Eén Waarde (Schuifregelaar). Laat nu de magie losbarsten. Probeer verschillende jaren op de schuifregelaar te kiezen en de Verkoop varieert ook daarmee.
  7. Sleep de SUM(Profit) filter naar beneden aan het dashboard onder de Verkoop in Zuid voor een beter zicht.

Hands On

Interactiviteit Toevoegen

Om het dashboard meer interactief te maken, zoals het zien welke subcategorieën winstgevend zijn in welke staten, moeten er enkele wijzigingen worden aangebracht.

Stappen

  1. Beginnen we met de Profit Kaart. Bij klikken op de kaart verschijnt er een icoon voor Gebruik als filter in de rechterbovenhoek. Klik op het icoon. Als we elke kaart selecteren, worden de Verkopen die bij dat staten passen gemarkeerd op de Verkoop-Zuid kaart.
  2. Voor de Bestel Datum Jaar klik op de dropdown optie en ga naar Toepassen op Werkbladen > Geselecteerde Werkbladen. Een dialoogvenster opent. Selecteer de Alle optie gevolgd door OK. Wat doet deze optie? Het toepast filters op alle werkbladen met dezelfde gegevensbron.
  3. Verkennen en experimenteren. In de visualisatie hieronder kunnen we de kaart Verkopen Zuid filteren om alleen producten te zien die in North Carolina worden verkocht. Vervolgens kunnen we gemakkelijk de winsten jaarlijks verkennen.
  4. Wijzig de naam van het Dashboard naar Regionale Verkopen en Winst.

Aan de slag

Derhalve brengen de verkoop van machines in North Carolina geen winst voor de onderneming.

6. Verhaal

Een dashboard is een leuk kenmerk, maar Tableau biedt ons ook de mogelijkheid om onze resultaten in presentatiemodus te presenteren in de vorm van verhalen, waarover we in dit gedeelte zullen spreken.

Een verhaal bouwen

Stappen

  1. Klik op de knop Nieuw verhaal.
  2. Vanuit het verhaalpaneel links, sleep het werkblad Verkopen in het Zuiden ( eerder gemaakt) naar de weergave.
  3. Bewerk de tekst in de grijze doos boven het werkblad. Dat is de bijschrift. Noem het Verkopen en winst per jaar.
  4. Verhalen zijn vrij specifiek. Hier zullen we een verhaal vertellen over de verkoop van machines in North Carolina. Klik in het verhaalpaneel op Dupliceren om het eerste bijschrift te dupliceren, of maak een nieuw een.
  5. Filter in de Subcategorie alleen Machines te selecteren. Dit helpt om de verkoop en winst van machines per jaar te bepalen.
  6. Wijzig de bijschrift naar Machineverkopen en -winst per jaar.

Aan de slag

Een conclusie trekken.

De machines in North Carolina leiden tot winstverlies. Dit kan echter niet aangetoond worden door naar Winst en Verkopen in het geheel te kijken. Daarvoor hebben we regionale Winst nodig.

Stappen

  1. Selecteer in het Verhaalvenster Leeg. Sleep het al aangemaakte dashboard Regionale Verkopen en Winst naar het canvas.
  2. Geef het de bijschrift Laag presterende items in het Zuiden.
  3. Selecteer Dupliceren om nog een verhaalpunt met het Regionale Winstdashboard aan te maken. Selecteer North Carolina in de staafgrafiek omdat we geïnteresseerd zijn in meer informatie over dit gebied.
  4. Selecteer alle jaren.
  5. Voeg een bijschrift toe voor helderheid, bijvoorbeeld Winst in NC : 2013-2016.
  6. Selecteer een jaar zoals 2014. Voeg een bijschrift toe, bijvoorbeeld Winst in NC : 2014 en klik vervolgens op de Duplicaat-tab. Herhaal dezelfde stap voor alle overige jaren.
  7. Klik op de presentatiemodus en laat het verhaal zich ontvouwen.

Op de Handen

Nu hebben we een idee over welke producten op de North Carolina-markt zijn geïntroduceerd, wanneer dat was en hoe zij hebben gepresteerd. Niet alleen hebben we een manier gevonden om negatieve winst aan te pakken, maar hebben we het ook succesvol onderbouwd met gegevens. Dat is de voordelen van Verhaal in Tableau.

7. Tableau’s integratie met R, Python & SQL

Naast de diverse visuele voordelen die Tableau biedt, heeft het ook verbazingwekkende aanmaakkundige verbindingscapabilities. Tableau kan gemakkelijk integreren met talen als Python en R en zelfs met DBMS’s als SQL. Dit biedt voorbereidende voordelen ten aanzien van functionaliteiten en is handig voor Data Scientists die gebruikelijk zijn om te werken in Python of R. Ze kunnen de R- en Python-scripts direct importeren in Tableau en profiteren van zijn visuele representaties, die vele malen superieur zijn aan die van deze talen. Ook zijn de visuele mogelijkheden van Tableau gemakkelijk en intuitief te gebruiken, waardoor veel tijd wordt bespaard voor Data Scientists.

In dit gedeelte zullen we zien hoe we Tableau kunnen verbinden met deze externe bronnen en de voordelen van deze verbindingen.

Tableau en R

R is een populair statistisch taal gebruikt om geavanceerde predictive analytics uit te voeren, zoals lineaire en niet-lineaire modellering, statistische testen, tijdreeksanalyse, classificatie, clustering, enzovoort.(Tableau 8.1 en R) Gebruikmakend van Tableau in combinatie met R heeft de volgende voordelen:

  • Levert de statistische kracht van Tableau uit door haar gebruikers toegang te geven tot geavanceerde R-bibliotheken om beter en dieper inzichten uit de gegevens te verkrijgen.
  • De uitgebreide gegevensonderzoekopties van Tableau en de mogelijkheid om met meerdere bronnen te verbinden zijn handig voor R-gebruikers.
  • Bovendien maakt het ook mogelijk voor Tableau-gebruikers de nuttigheid van de R-taal te benutten zonder daadwerkelijk het taalgebruik te moeten kennen.

Hoe integreert Tableau met R?

R-functies en -modellen kunnen worden gebruikt in Tableau door nieuwe berekende velden te maken die dynamisch de R engine aanroepen en waarden doorgeven aan R. Deze resultaten worden vervolgens teruggestuurd naar Tableau om te worden gebruikt voor visualisatiedoeleinden.

Tableau Desktop instellen met R

  • Download en installeer Rserve.

U moet het pakket Rserve voor Tableau downloaden en installeren om verbinding te maken en de R-scriptfuncties te gebruiken. Voer in de R-console de volgende opdrachten in:

install.packages(“Rserve”) library(Rserve) Rserve() / Rserve(args = ‘ — no-save’)

Connect Tableau to the R Server

Als Rserve met succes is geïnstalleerd, opent u Tableau Desktop en volgt u de onderstaande stappen.

  1. Ga naar de Help > Instellingen en voorkeuren en selecteer Externe serviceverbinding beheren.

  2. .

    Voer de servernaam in als “Localhost” (of “127.0.0.1”) en een poort van “6311”.

  3. Klik op de knop “Verbinding testen”. Je zou een succesvol bericht moeten zien. Klik op OK om af te sluiten.

Gebruik de R-scripts in Tableau

Nadat je de bovenstaande stappen met succes hebt voltooid, zul je nieuwe berekende velden in Tableau Desktop kunnen maken die de SCRIPT_*-functies gebruiken om R-functieoproepen te maken.

Laten we aan de slag gaan en kijken hoe we Tableau’s mogelijkheden met R kunnen gebruiken. We zullen de ingebouwde Sample Superstore-dataset gebruiken om winst zowel met behulp van een R-script als met Tableau’s sleep-en-neerzetfunctie te berekenen. Vervolgens zullen we beide resultaten vergelijken.

Stappen

  1. Open een Tableau-werkboek en maak verbinding met de sample superstore-gegevens.
  2. Maak verbinding met Rserve. Zodra Tableau Desktop verbonden is met Rserve, kan het de R-engine aanroepen via berekende velden.
  3. We gaan nu een berekend veld aanmaken genaamd Verwachte Winst.

    Vier functies zijn beschikbaar voor gebruik met R, en ze beginnen allemaal met het woord script. De functies zijn:

    • SCRIPT_REAL: geeft reële getallen als resultaten terug
    • SCRIPT_STR: geeft een tekenreeks terug
    • SCRIPT_INT: geeft gehele getallen terug
    • SCRIPT_BOOL: geeft booleans terug
    • Voor dit voorbeeld gaan we de SCRIPT_REAL-functie gebruiken. We gaan een eenvoudige lineaire regressie in Tableau maken.
  4. Open de berekende veld en voeg het volgende script toe.

    SCRIPT_REAL("fit <- lm(.arg1 ~ .arg2 + .arg3 + .arg4) fit$fitted ", SUM([Profit]), AVG([Sales]), AVG([Quantity]), AVG([Discount]))

    Het bovenstaande script betreft de lineaire回归modell in R. Dit model zal een afhankelijke variabele(arg1) en drie onafhankelijke variabelen(arg2, arg3, arg4) hebben. Deze argumenten zijn slechts placeholder en zodra het script terug naar R wordt gestuurd, worden de argumenten vervangen door de Tabellenkolommen die ze corresponderen. 5. Gegevensvelden invoeren die corresponderen met elke variabele. Het afhankelijke onderwerp hier is winst, dus we zullen SUM(Profit) eerst plaatsen omdat dat correspondeert met argument 1. Evenzo zullen we de gemiddelde unitairprijs, gemiddelde bestelhoeveelheid en de gemiddelde korting gebruiken voor de andere drie argumenten respectievelijk.

  5. Deze invoer zal nu allemaal worden getrokken naar het model voor het bepalen van verwachte winstniveaus. We zijn nu klaar om deze berekening binnen Tableau-visualisaties te gebruiken. Sleep de categorie over naar de rijen en dan Profit naar de kolommen. Sleep nu Verwachte Winst ook naar de kolommen.

  6. Wij kunnen nu het model analyseren om te zien hoe het Berekende verwachte winst in R zich verhoudt tot de werkelijke winsten. We kunnen deze analyse verder uitdiepen door klantsegmenten naar de kleuren te trekken en nu we een gestapeld staafdiagram hebben gemaakt, kunnen we ook geordende data gebruiken om de gegevens uit te brengen per jaar of per kwartaal.

Handen aan de werkplaats

Men zou zich afvragen of al deze berekeningen ook in Tableau zouden kunnen zijn gedaan zonder gebruik te maken van R. Dus, waarom moeten we het proces doorlopen van het downloaden en configureren van Rserve in Tableau en het schrijven van scripts? R is een krachtige taal vanwege zijn vermogen om te voorspellen, gebruik makend van breed gebruikte bibliotheken die gemakkelijk bekende algoritmen bevatten. Imagineer hoe leuk het zou zijn om voorspellingen voor ons bedrijf te maken in Tableau, door een eenvoudig R-script aan te roepen en het vervolgens te kunnen integreren in Tableau’s visualisaties.

Tableau en Python

Python is een breed gebruikte algemene programmeertaal. Python biedt een groot aantal bibliotheken om statistische analyses, voorspellende modellering of machinaal leren uit te voeren. Het verbinden van Tableau met Python is een van de beste methoden voor voorspellende analyse. Tabpy is een pakket dat is ontwikkeld voor dit doel. Om Tableau in staat te stellen de kracht van Python te benutten, kan het verbonden worden met de TabPy-server om Python-code op het moment uit te voeren en resultaten in de vorm van visualisaties weer te geven.

Hoe integreert Tableau met Python?

Wanneer we TabPy met Tableau gebruiken, kunnen we berekende velden in Python definiëren, waardoor we de kracht van een groot aantal machineleerbibliotheken direct vanuit onze visualisaties kunnen benutten.

Tableau Desktop instellen met Python

Download en installeer Tabpy.

Om een Python-code uit te voeren binnen een Tableau-werkboek is een Python-server nodig om deze uit te voeren. Het TabPy-framework doet dit werk. Download TabPy van Github via de volgende link. Als alternatief kunt u de onderstaande stappen volgen:

conda install -c anaconda tabpy-server

Ga daarna naar de map waar de gedownloade tabpy-server zich bevindt en voer deze uit.

python setp.py

Tableau verbinden met TabPy

De volgende stap is om Tableau met TabPy te verbinden. Dit kan gedaan worden door naar Help > Instellingen en prestatie > Beheer externe serviceverbinding:

Test de verbinding. Als alles goed gaat, zou je een melding moeten krijgen dat de verbinding succesvol is.

Begin met het gebruik van Python-scripts in Tableau.

De Python-integratie in Tableau is een zeer handige functie. Neem voorbeeld van het probleem van sentiment analyse. Het is een algemeen voorkomend probleem binnen de machine learninggemeenschap en kan worden gerealiseerd door verschillende machine learningalgoritmen. Echter, door de combinatie van Tableau en Python te gebruiken, kan dit op enkele regels Pythoncode worden gerealiseerd. De resultaten kunnen vervolgens worden gevisualiseerd in Tableau voor meer inzichten. Laten we dit zien met een voorbeeld(Bruik de kracht van Python in Tableau met TabPy)

Sentiment Analyse met Tabpy

We zullen het dataset van mobiele recensies gebruiken dat kan worden gedownload van hier.

Stappen:

  1. Importeer het dataset naar Tableau Desktop
  2. Maak verbinding met Tabpy. Zodra Tableau Desktop is verbonden met Tabpy, kan het de Python-engine aanroepen via berekende velden.
  3. We gaan nu een berekend veld aanmaken genaamd Sentiment als volgt: `

    SCRIPT_REAL("from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer vs = [] analyzer = SentimentIntensityAnalyzer() for i in range(0,len(_arg1)): a = analyzer.polarity_scores(_arg1[i])['compound'] vs.append(a) return vs",ATTR([Reviews]))`

    We gebruiken hier de VADER sentiment analyse gereedschap. Het is een woordenboek en regelgebaseerd sentiment analyse gereedschap dat specifiek gecalibreerd is op gevoelens geexpresseerd in sociale media. Om dit gereedschap te gebruiken, moet u het eerst installeren. Lees meer op hun github pagina.

  4. Nu, sleep Reviews naar rijen en Sentiment naar de tekst en kleur merken kaart en zie de magie gebeuren. We krijgen de sentiment analyse van de recensie klaar zonder enige moeite. Ook is het super gemakkelijk om de resultaten te visualiseren. De positieve recensies zijn in vergrotenorde van groen terwijl de negatieve er in rood zijn.

Het bovenstaande voorbeeld maakt duidelijk de kracht van de integratie van Tableau met Python. Door de Sentiment scores in ons bezit te hebben, kunnen we die gebruiken om dieper in de details te delven. Bijvoorbeeld, als ik een bedrijfseigenaar ben, kunnen ik negatieve recensies filteren en over de redenen daarvoor nadenken. Ik kan ook op positieve recensies filteren om ideeën te krijgen over de producten die de consumenten gelukkig maken.

Tableau en SQL Server

Er is een verborgen waard in onze Microsoft SQL Server gegevens die onder de standaard rapportages en complexe business intelligence tools verborgen ligt. Tableau levert inzicht overal door iedereen uit te equiperen om een geavanceerde visuele analyse uit te voeren op SQL Server gegevens. We kunnen Tableau live aan SQL Server verbinden voor gekwalificeerde, platformspecifieke queries of de gegevens direct naar Tableau’s analytics engine brengen om de belasting op de database terug te dringen.

Tableau biedt een geoptimaliseerde, live connector aan voor SQL Server zodat we grafieken, rapportages en dashboards kunnen maken terwijl we direct met onze gegevens werken. Als we onze analyse verdiepen, herkent Tableau automatisch het schema dat in SQL Server wordt gebruikt, zodat we onze gegevens niet hoeven aan te passen.

Laten we een voorbeeld doorlopen dat laat zien hoe een SQL Server database met Tableau Desktop wordt verbonden en hoe het wordt gebruikt om visualisaties te maken.

Stappen:

  1. Meld u aan bij de SQL Server
  2. Open Tableau Desktop en onder Servers, maak verbinding met MS SQL.
  3. Voer de servernaam in in het dialoogvenster dat opens en klik op OK. Dit maakt de verbinding tussen Tableau en de SQL Server. Selecteer de gewenste database. In dit voorbeeld kiezen we de salesDB. U kunt vervolgens kiezen uit een lijst met tabellen, b.v. Sales Log. Het bestand wordt geïmporteerd in de omgeving van Tableau. Nu kunt u kiezen om de gehele gegevens of een deel ervan te exporteren naar een nieuw werkblad. U kunt zelfs het aantal rijen specificeren dat moet worden geëxporteerd.
  4. In het nieuwe werkblad hebben we de gegevens geëxtraheerd van MS SQL, vanaf hier kunt u erover werken als met elk ander Tableau-werkblad.

Hands On:

Dit is hoe we gemakkelijk de SQL Server kunnen verbinden met Tableau en de gegevens direct erin kunnen extraheren. Tableau laat de gebruikers een verbinding met een klik aan- of uitschakelen om in-memory-query’s toe te passen op een groter gegevens集.

8. Bewaren van het werk

Tableau Desktop

Om een Tableau-werkboek lokaal op te slaan, kies Bestand > Opslaan. Geef de bestandsnaam van het werkboek op in het dialoogvenster Opslaan als. Tableau slaat de bestanden standaard op met de extensie .twb.

Tableau Public

Met Tableau Public worden alle weergaves en gegevens openbaar gemaakt, en iedereen op het internet heeft toegang tot ze. Kies Server > Tableau Public > Opslaan op Tableau Public en voer de inloggegevens in.

Tableau Server

Als de gegevens geheime zijn en de story moet worden gedeeld met de gehele team, is Tableau Server handig. Om een story te publiceren op Tableau Server, selecteer je Select Server > Publish Workbook of klik je op Share op de werkbalk. Maak echter eerst een account aan.

Conclusie

Dat is alles wat we nodig hebben om een goede visualisatie te maken in Tableau, hoewel iemand misschien meer aanpassingen in elke fase zal doen dan hierboven beschreven. Dus door middel van experimenten en oefeningen wordt Tableau voor ons steeds meer bekend en zal hij ontscheidende functies ontsluiten om ons te helpen data te analyseren en voor te stellen. Laat een commentaar achter bij eventuele vragen of vragen en geniet van het visualiseren.

Bekijk onze Tutorial over het maken van Tableau visualisaties met behulp van de AirBnB dataset.

Source:
https://www.datacamp.com/tutorial/data-visualisation-tableau