Ons doel als Data Analysts is om de inzichten uit onze data zo uit te leggen dat iedereen die ze ziet in staat is hun implicaties te begrijpen en duidelijk te kunnen handelen op basis daarvan.
Tableau is een gereedschap voor dataanalyse en visualisatie dat breed gebruikt wordt in de industrie vandaag de dag. Veel bedrijven beschouwen het zelfs als onvervangbaar voor werkzaamheden gerelateerd aan data wetenschap. Het gemak van Tableau komt uit het feit dat het een sleep-en-drop-interface heeft. Deze functie helpt taken als sorteren, vergelijken en analyseren gemakkelijk en snel uit te voeren. Tableau is ook compatible met vele bronnen, inclusief Excel, SQL Server en cloudgebaseerde dataopslaglocaties, wat het een uitstekende keuze maakt voor Data Scientists.
1. Inleiding tot Tableau
Overzicht
Tableau Software is een softwarebedrijf gevestigd in Seattle, Washington, dat interactieve datavisualisatieproducten ontwikkelt die gericht zijn op bedrijfsintelligentie. Tableau werd opgericht aan de Stanford Universiteit, afdeling Computerwetenschappen, tussen 1997 en 2002(Wikipedia)
De hoofdproducten die Tableau aanbiedt zijn:

Tableau Desktop, Tableau Public en Tableau Online, die allemaal mogelijkheden bieden voor datavisualisatiecreatie. De keuze hangt af van het soort werk.

In deze handleiding zullen we werken met Tableau Desktop. De link naar de bron van de referentie is hier.
Installatie
Afhankelijk van de gekozen productkeuze, downloadt u de software op de computer. Nadat u het licentieovereenkomst hebt geaccepteerd, kunt u de installatie controleren door op het Tableau-pictogram te klikken. Als het volgende scherm verschijnt, bent u klaar om te beginnen.

2. Aan de slag
In dit onderdeel leren we enkele basisbewerkingen in Tableau om zich aan de interface te wennen.
Tableau-werkruimte
De Tableau-werkruimte is een verzameling van werkbladen, menubalk, werkbalk, merktekenskaart, planken en veel andere elementen waarover we in latere onderdelen zullen leren. Bladen kunnen werkbladen, dashboards of verhalen zijn. Het onderstaande plaatje geeft de belangrijkste componenten van de werkruimte aan. Echter, meer bekendheid zal worden verkregen zodra we met actuele gegevens gaan werken.

Verbinden met een gegevensbron
Om te beginnen met werken met Tableau, moeten we Tableau verbinden met de gegevensbron. Tableau is compatibel met veel gegevensbronnen. De door Tableau ondersteunde gegevensbronnen verschijnen aan de linkerzijde van het startscherm. Sommige veelgebruikte gegevensbronnen zijn Excel, tekstbestand, relationele database of zelfs op een server. Men kan ook verbinden met een cloudgegevensbron zoals Google Analytics, Amazon Redshift, etc.
Het startscherm van Tableau Desktop toont de beschikbare gegevensbronnen waarmee je kunt verbinden. Het is ook afhankelijk van de versie van Tableau omdat de betaalde versie meer mogelijkheden biedt. Aan de linkerzijde van het scherm bevindt zich een Verbinden
paneel dat de beschikbare bronnen accentueert. Bestandstypen worden eerst genoemd, gevolgd door algemene servertypen, of de servers waarmee onlangs is verbonden. Onder het tabblad Openen
kun je eerder gemaakte werkboeken openen. Tableau Desktop biedt ook enkele voorbeeldwerkboeken onder Voorbeeldwerkboeken
.
Handson

Verbinden met de Sample-Superstore dataset
We zullen aan de slag gaan met een voorbeeldgedataset genaamd Superstore dataset, dat vanaf de voorgeladen dataset van Tableau uitgelezen wordt. Het bestand zal echter vanaf hier gedownload worden, zodat we kunnen vaststellen hoe we verbinding kunnen maken met een Excel gegevensbron. Het gegevensbestand betreft een supermarkt. Het bevat informatie over producten, verkopen, winsten, enzovoort. Ons doel als Data Analysts is het analyseren van de gegevens en het vinden van kritieke verbeteringsgebieden binnen deze fictieve onderneming.
Stappen
-
Importeer de gegevens in het Tableau werkruimte vanaf de computer.
-
Bij het klikken op de tabblad ‘Sheets’ zullen drie bladen zichtbaar worden: Orders, People en Returns. We zullen echter alleen maar gegevens uit het Ordersbestand behandelen. Dubbelklikken op de blad ‘Orders’ en het opent net alsof het een spreadsheet is.
-
We merken op dat de eerste drie rijen van de gegevens iets anders uitzien en niet in de gewenste indeling zijn. Hier maakten we gebruik van Data Interpreter, dat eveneens onder het tabblad ‘Sheets’ te vinden is. Door erop te klikken krijgen we een mooi geformatteerd blad.
Hands On

Creating a View
We zullen beginnen met het genereren van een eenvoudige grafiek. In dit gedeelte zullen we onze data leren kennen en zullen we beginnen met vragen te stellen over de data om inzichten te krijgen. Er zijn enkele belangrijke termen die we in dit gedeelte zullen tegenkomen.
Dimension
Measures
Aggregation
Dimensions zijn kwalitatief data, zoals een naam of datum. Standaard classificeert Tableau automatisch gegevens die qualitative of categorische informatie bevatten als een dimensie, bijvoorbeeld, elke veld met tekst of datumwaarden. Deze velden verschijnen meestal als kolomheaders voor rijen gegevens, zoals Klantnaam of Besteldatum, en definiëren ook de granulatietype die in de weergave getoond wordt.
Measures zijn quantitatieve numerieke gegevens. Standaard behandelt Tableau elk veld dat deze soort gegevens bevat als een maateenheid, bijvoorbeeld, verkooptransacties of winst. Gegevens die als maateenheid zijn geclassificeerd kunnen worden geaggregeerd op basis van een gegeven dimensie, bijvoorbeeld, totale verkopen (Maateenheid) per regio (Dimensie).
Aggregatie is de gegevens op rijniveau die worden samengevat tot een hogere categorie, zoals de som van de verkopen of het totale profit.
Tableau sorteert automatisch de velden in Maatstaven en Dimensionen. Echter, voor elke afwijking kan dat ook handmatig worden aangepast.
Stappen
-
Ga naar het werkblad. Klik op de tab
Blad 1
in de linkerbenedenhoek van het Tableau-werkgebied. -
Eenmaal op het werkblad, sleep vanuit
Dimensionen
onder het Data pane deBesteldatum
naar de kolombalk.Bij het sleepen van de
Besteldatum
naar de kolombalk, wordt in het gegevensset voor elk jaar van bestellingen een kolom aangemaakt. Een ‘Abc’-indicator is zichtbaar onder elke kolom, wat impliceert dat er tekst of numerieke of tekstgegevens hier naartoe kunnen worden gesleept. Andersom, als we deVerkopen
hiernaar zouden trekken, zou een kruisvergelijking worden aangemaakt die de totale Verkopen voor elk jaar zou weergeven. -
Evenzo, sleep vanuit het tabblad
Maten
het veldVerkopen
naar de rijenplank.
Tableau vult een grafiek met verkopen, geaggregeerd als een som. De totale geaggregeerde verkoop per jaar, volgens orderdatum, wordt weergegeven. Tableau vult altijd een lijndiagram in voor een weergave die een tijdveld bevat, wat in dit voorbeeld de orderdatum is..
Hands On

Wat laat het bovenstaande lijndiagram zien? Wel, het toont aan dat de verkopen er veelbelovend uitzien en lijken toe te nemen in de loop van de tijd. Dit is een waardevol inzicht, maar het zegt weinig over de producten die bijdragen aan de toename van de verkopen. Laten we verder onderzoeken om meer inzichten te verkrijgen.
De weergave verfijnen
Laten we dieper graven en proberen meer inzichten te verkrijgen over welke producten meer verkopen stimuleren. Laten we beginnen met het toevoegen van de productcategorieën om de verkooptotalen op een andere manier te bekijken.
Stappen
-
Categorie
staat onder het venster Dimensies. Sleep het naar de kolomshelf en plaats het naastJAAR(Orderdatum)
.Categorie
moet aan de rechterkant vanJaar
geplaatst worden. Door dit te doen, verandert de weergave onmiddellijk van een lijngrafiek naar een staafgrafiek. Het diagram toont de algemeneVerkopen
voor elkProduct
per jaar.Meer informatie
Om informatie over elk datapunt (dat wil zeggen, markering) in de weergave te bekijken, ga je met de muis over een van de balken om een tooltip te tonen. De tooltip toont de totale verkoop voor die categorie. Hier is de tooltip voor de categorie Kantoorartikelen uit 2016:
Om labels aan de weergave toe te voegen, klik je op
Markeringlabels weergeven
op de werkbalk.De staafgrafiek kan ook horizontaal in plaats van verticaal worden weergegeven. Klik op
Wissel
op de werkbalk voor dezelfde functie.
2. De bovenstaande weergave toont mooi de verkopen
per categorie
, d.w.z. meubels, kantoorbenodigdheden en technologie. We kunnen ook afleiden dat de verkoop van meubels sneller groeit dan de verkoop van kantoorbenodigdheden, behalve in 2016. Daarom is het verstandig om de verkoopinspanningen te richten op meubels in plaats van kantoorbenodigdheden. Maar meubels is een brede categorie en bestaat uit veel verschillende items. Hoe kunnen we identificeren welk meubelstuk bijdraagt aan de maximale verkoop?
Om ons te helpen die vraag te beantwoorden, besluiten we te kijken naar producten per Sub-categorie
om te zien welke items de grote verkopers zijn. Laten we zeggen voor de Meubels categorie; we willen alleen naar details kijken over boekenkasten, stoelen, meubels en tafels. We zullen dubbelklikken of de Sub-categorie
dimensie naar de kolomplank slepen.
De sub-categorie is een ander discreet veld. Het splitst verder de Categorie
en toont een balk voor elke sub-categorie
verdeeld per categorie en jaar. Het is echter een enorme hoeveelheid gegevens om visueel te begrijpen. In de volgende sectie leren we over filters, kleur en andere manieren om de weergave begrijpelijker te maken.
Aan de slag

3. Resultaten benadrukken
In dit gedeelte zullen we proberen te focussen op specifieke resultaten. Filters en kleuren zijn manieren om meer aandacht te schenken aan de details die ons interesseren.
Filters toevoegen aan de weergave
Filters kunnen worden gebruikt om waarden in of uit de weergave op te nemen. Hier proberen we twee eenvoudige filters aan het werkblad toe te voegen om het gemakkelijker te maken om de verkoop van producten per subcategorie voor een bepaald jaar te bekijken.
Stappen
Klik in het Data-paneel, onder Dimensies, met de rechtermuisknop op Besteldatum en selecteer Toon filter.Herhaal dit ook voor het veld Sub->categorie.

Filters zijn van het type kaarten en kunnen op het werkblad verplaatst worden door ze simpelweg te verslepen en neer te zetten
Kleuren toevoegen aan de weergave
Kleuren kunnen helpen bij de visuele herkenning van een patroon.
Stappen
Neem in het Data-paneel, onder Maten, Profit en sleep deze naar Kleur op de Merkenkaart.

Je kunt zien dat Boekenkasten, Tafels en zelfs Machines bijdragen aan negatieve winst, dat wil zeggen verlies. Een krachtige inzicht.
Aan de slag

Belangrijkste bevindingen
Laten we de filters nader bekijken om meer over de onrendabele producten te ontdekken.
Stappen
- In de weergave, in de
Sub-Category
filter kaart, deselecteer alle keuzes behalveBoekenkasten
,Tafels
enMachines
. Dit toont een interessant feit. Terwijl in sommige jaren, Boekenkasten en Machines effectief winstgevend waren. Echter, in 2016 werd de Machine niet meer winstgevend. - Selecteer
Alles
in deSub-Category
filter kaart om alle subcategorieën weer te geven. - Van de Dimensions, sleep
Regio
naar deRijen
plank en plaats hem links van de Sum(Sales) tab. We merken dat machines in het Zuiden een negatief winstverschil hebben vergeleken met uw andere regio’s. - Geef nu een naam aan het blad. Bij de linkeronderhoek van het werkblad, dubbelklik op
Blad 1
en typVerkoop per Product en Regio
. - Om de weergave te behouden, laat Tableau ons een werkblad klonen zodat we kunnen doorgaan op een ander blad waar we mee opgehouden hebben.
- In uw werkbook, klik rechts op het blad
Verkoop per Product en Regio
en selecteerKlonen
en hernoem het geklonneerde blad naarVerkoop-Zuid
. - In het nieuwe werkblad, van Dimensions, sleep
Regio
naar deFilters
plank om het als filter in de weergave toe te voegen. - In het Filter Regio dialoogvenster, selecteer alle keuzes behalve Zuid en klik dan op
OK
. Nu kunnen we ons focus leggen op de verkopen en winst in deZuid
. We zien dat de verkoop van machines een negatieve winst hadden in 2014 en opnieuw in 2016. We zullen dit onderzoeken in de volgende sectie. - Laat niet vergeet om de resultaten op te slaan door te selecteren
Bestand > Opslaan als
. Laten we onze werkmap de naam gevenRegionale Verkopen en Winsten
.
Aan de slag

4. Kaartweergave
Creëer een Kaartweergave
Kaartweergaven zijn nuttig wanneer we geografische gegevens bekijken (het Veld van de Regio). In het huidige voorbeeld herkent Tableau automatisch dat de Velden van Land, Staat, Stad en Postcode geografische informatie bevatten.
Stappen
- Maak een nieuwe werkblad.
- Voeg
Staat
enLand
onder het Gegevensvenster toe aanDetail
op de Merkenkaart. We krijgen een kaartweergave. - Sleep
Regio
naar deFilters
plank en filter vervolgens af op alleenZuid
. De kaartweergave zoomt nu in op alleen de Zuid-regio en een merk representeert elke staat. - Sleep de maat
Verkopen
naar het tabbladKleur
op de Merkenkaart. We krijgen een ingevulde kaart met kleuren die het verkoopbereik in elke staat tonen. - We kunnen het kleurenschema wijzigen door te klikken op
Kleur
op de Merkenkaart enKleuren bewerken
te selecteren. We kunnen experimenteren met de beschikbare paletten. - We zien dat Florida het beste presteert in termen van Verkopen. Als we over Florida heen zweven, wordt een totaal van 89.474 USD in verkopen getoond, vergeleken met bijvoorbeeld South Carolina, die slechts 8.482 USD in verkopen heeft. Laten we de prestaties nu meten door
Winst
, omdat Winst een beter indicator is dan alleen Verkopen. - >
Drag
Winst
naarKleur
op het Merkenkaart. We zien nu dat Tennessee, North Carolina en Florida een negatieve winst hebben, hoewel het lijkt alsof ze goed presteren in Verkopen. Hernoem het blad naar Winstkaart
Handen aan de werk

Naar de Details
Maps geven ons de mogelijkheid om de gegevens breed te visualiseren. In de laatste stap ontdekten we dat Tennessee, North Carolina en Florida een negatieve winst hebben. In dit gedeelte maken we een Bar diagram om de reden van de negatieve winst te onderzoeken.
Stappen
-
Maak een kopie van het Winstkaart werkblad en noem het Negatieve Winst Bar Diagram.
-
Klik op
Laat Me Zien
op het Negatieve Winst Bar Diagram werkblad.Laat Me Zien
presenteert de verschillende manieren waarop een grafiek kan worden geplooid tussen de items genoemd in het werkblad. Selecteer vanuitLaat Me Zien
de horizontale balkoptie en de weergave wordt direct van verticale naar horizontale balken. -
Je kunt meer dan één staaf tegelijk selecteren door gewoon te klikken en de muis te verslepen over ze. We willen ons alleen richten op de drie staten, namelijk Tennessee, North Carolina en Florida. Daarom zullen we alleen de staafjes selecteren die daarbij horen.
Meer informatie
Hiërarchieën aanmaken
Hiërarchieën zijn handig wanneer je soortgelijke velden wilt groeperen zodat je snel tussen niveaus kunt doorgraven in de vizualisatie.- In het Gegevensvenster, sleep een veld en laat het direct boven een ander veld vallen of klik met de rechtermuisknop op het veld en selecteer
- Sleep extra velden naar de hiërarchie. Velden kunnen ook in de hiërarchie worden herschikt door ze eenvoudig naar een nieuwe positie te slepen. In de huidige vizualisatie zullen we de volgende hiërarchieën aanmaken: Locatie, Bestelling en Product.
-
Klik op de icon met het plusteken op het veld
State
op de Rijenregel om naar het niveau van deCity
te drilleren.- Dat is veel data. We kunnen de
N-Filter
gebruiken om te filteren en de zwakste prestaties aan te tonen. Voor dat doel sleep je deCity
vanuit hetData
paneel naar de Regelschappij. Kies Voor veld en klik vervolgens op de keuzelijstTop
en selecteerBottom
om de zwakste prestaties aan te tonen. Typ 5 in het tekstvak om de laatste 5 prestaties in het gegevensset weer te geven.
- Dat is veel data. We kunnen de
Wij zien nu dat Jacksonville en Miami, Florida; Burlington, North Carolina; en Knoxville en Memphis, Tennessee de slechtste presterende steden op winst zijn. Er is nog een andere markering in het overzicht – Jacksonville, North Carolina – die hier niet thuishoort omdat het winstgevende verkoop heeft. Dit betekent dat er een probleem zit in de filter die we hebben toegepast. We zullen de hulp van Tableau Order of Operations inroepen.
-
Op het Filterscherm, klikt u met de rechtermuisknop op de Inclusions (Country, State) set en selecteert u
Toevoegen aan Context
. We zien nu dat Concord(North Carolina) in beeld verschijnt terwijl Miami(Florida) verdwenen is. Dit maakt nu meer sense. -
Maar Jacksonville (North Carolina) is nog steeds aanwezig wat onjuist is. Op de Rijenbalk, klikt u op het plusvormige icoon op het tabblad
City
om in detail te gaan tot het niveau van de postcode. Klikt u met de rechtermuisknop op de postcode voor Jacksonville, NC, 28540, en selecteert u vervolgensUitsluiten
om Jacksonville handmatig uit te sluiten. -
Sleep de Postcode van de Rij-plank. Dit is het uiteindelijke overzicht.
Hands On

Belangrijkste Bevindingen
Laten we ons nu alleen richten op de verliesgevende entiteiten, d.w.z. de Producten en laten we ook de locaties identificeren waar dergelijke producten worden verkocht.
Stappen
- Sleep
Sub-Category
naar de Rijen om verder in te zoomen. - Sleep op dezelfde manier de
Profit
naarColor
op de Marks-kaart. Dit stelt ons in staat om producten met negatieve winst snel te spotten. - Klik met de rechtermuisknop op de
Order Date
en selecteerShow Filter
. Het lijkt erop dat machines, tafels en ordners slecht presteren. Wat moeten we doen? Een oplossing zou zijn om de verkoop van deze producten in Jacksonville, Concord, Burlington, Knoxville en Memphis te stoppen? Laten we controleren of onze beslissing juist is. - Laten we teruggaan naar het eerder gemaakte
Profit Map
-blad. - Nu klik je op het veld
Sub-Category
om de optieShow Filter
te selecteren. - Sleep
Profit
van onderMeasures
naar deLabel
Marken kaart. - Opnieuw klik je op
Order Date
en selecteerShow Filter
. Vanuit het filter laat we de items die we denken bijdragen aan een negatieve winst verwijderen. Dus deactiveer de aanvinksters voor Binders, Machines en Tafels respectievelijk. Nu resteren alleen de winstgevende entiteiten. Dit toont dat de entiteiten als Binders, machines en tafels in feite verliezen veroorzaakten in sommige gebieden, en dat ons ontdekkingen correct waren.
Hands On
5. Dashboard
Een dashboard is een verzameling van verschillende weergaven, die het mogelijk maken om verschillende gegevens tegelijkertijd te vergelijken.
Een Dashboard maken
Stappen
- Klik op de knop
Nieuwe dashboard
. - Sleep
Verkoop in het Zuiden
naar het lege dashboard - Sleep
Profit Kaart
naar het dashboard en laat hem bovenop de weergave Verkoop in het Zuiden vallen. Beide weergaven kunnen tegelijk worden bekeken. Om gegevens op een manier aan te bieden die door anderen begrepen kan worden, kunnen we het dashboard naar ons eigen smaak aanpassen. - Op de werkblad
Verkoop Zuid
in de dashboardweergave, klik onderRegio
en deactiveerShow Header
. Herhaal hetzelfde proces voor alle andere headers. Dit helpt om alleen de nodige informatie uit te laten zien en de minder belangrijke informatie te verbergen. - Op de
Profit Kaart
verberg de titel evenals voor deVerkoop Zuid
kaart dezelfde stappen uitvoeren. - We kunnen zien dat de
Subcategorie
filter kaart en deBestel Datum Jaar
op de rechterkant zijn herhaald. Laten we de extra’s weghalen door ze simpelweg door te trekken. Kies uiteindelijk op deBestel Datum Jaar
. Een dropdown pijl verschijnt en selecteer de optie voorEén Waarde (Schuifregelaar)
. Laat nu de magie losbarsten. Probeer verschillende jaren op de schuifregelaar te kiezen en de Verkoop varieert ook daarmee. - Sleep de
SUM(Profit)
filter naar beneden aan het dashboard onder de Verkoop in Zuid voor een beter zicht.
Hands On

Interactiviteit Toevoegen
Om het dashboard meer interactief te maken, zoals het zien welke subcategorieën winstgevend zijn in welke staten, moeten er enkele wijzigingen worden aangebracht.
Stappen
- Beginnen we met de
Profit Kaart
. Bij klikken op de kaart verschijnt er een icoon voorGebruik als filter
in de rechterbovenhoek. Klik op het icoon. Als we elke kaart selecteren, worden de Verkopen die bij dat staten passen gemarkeerd op deVerkoop-Zuid
kaart. - Voor de
Bestel Datum Jaar
klik op de dropdown optie en ga naarToepassen op Werkbladen > Geselecteerde Werkbladen
. Een dialoogvenster opent. Selecteer deAlle
optie gevolgd doorOK
. Wat doet deze optie? Het toepast filters op alle werkbladen met dezelfde gegevensbron. - Verkennen en experimenteren. In de visualisatie hieronder kunnen we de kaart
Verkopen Zuid
filteren om alleen producten te zien die in North Carolina worden verkocht. Vervolgens kunnen we gemakkelijk de winsten jaarlijks verkennen. - Wijzig de naam van het Dashboard naar
Regionale Verkopen en Winst
.
Aan de slag

Derhalve brengen de verkoop van machines in North Carolina geen winst voor de onderneming.
6. Verhaal
Een dashboard is een leuk kenmerk, maar Tableau biedt ons ook de mogelijkheid om onze resultaten in presentatiemodus te presenteren in de vorm van verhalen, waarover we in dit gedeelte zullen spreken.
Een verhaal bouwen
Stappen
- Klik op de knop
Nieuw verhaal
. - Vanuit het verhaalpaneel links, sleep het werkblad
Verkopen in het Zuiden
( eerder gemaakt) naar de weergave. - Bewerk de tekst in de grijze doos boven het werkblad. Dat is de bijschrift. Noem het
Verkopen en winst per jaar
. - Verhalen zijn vrij specifiek. Hier zullen we een verhaal vertellen over de verkoop van machines in North Carolina. Klik in het verhaalpaneel op
Dupliceren
om het eerste bijschrift te dupliceren, of maak een nieuw een. - Filter in de
Subcategorie
alleenMachines
teselecteren
. Dit helpt om de verkoop en winst van machines per jaar te bepalen. - Wijzig de bijschrift naar
Machineverkopen en -winst per jaar
.
Aan de slag

Een conclusie trekken.
De machines in North Carolina leiden tot winstverlies. Dit kan echter niet aangetoond worden door naar Winst en Verkopen in het geheel te kijken. Daarvoor hebben we regionale Winst nodig.
Stappen
- Selecteer in het Verhaalvenster
Leeg
. Sleep het al aangemaakte dashboardRegionale Verkopen en Winst
naar het canvas. - Geef het de bijschrift
Laag presterende items in het Zuiden
. - Selecteer
Dupliceren
om nog een verhaalpunt met het Regionale Winstdashboard aan te maken. Selecteer North Carolina in de staafgrafiek omdat we geïnteresseerd zijn in meer informatie over dit gebied. - Selecteer alle jaren.
- Voeg een bijschrift toe voor helderheid, bijvoorbeeld
Winst in NC : 2013-2016
. - Selecteer een jaar zoals 2014. Voeg een bijschrift toe, bijvoorbeeld
Winst in NC : 2014
en klik vervolgens op de Duplicaat-tab. Herhaal dezelfde stap voor alle overige jaren. - Klik op de presentatiemodus en laat het
verhaal
zich ontvouwen.
Op de Handen

Nu hebben we een idee over welke producten op de North Carolina-markt zijn geïntroduceerd, wanneer dat was en hoe zij hebben gepresteerd. Niet alleen hebben we een manier gevonden om negatieve winst aan te pakken, maar hebben we het ook succesvol onderbouwd met gegevens. Dat is de voordelen van Verhaal in Tableau.
7. Tableau’s integratie met R, Python & SQL
Naast de diverse visuele voordelen die Tableau biedt, heeft het ook verbazingwekkende aanmaakkundige verbindingscapabilities. Tableau kan gemakkelijk integreren met talen als Python en R en zelfs met DBMS’s als SQL. Dit biedt voorbereidende voordelen ten aanzien van functionaliteiten en is handig voor Data Scientists die gebruikelijk zijn om te werken in Python of R. Ze kunnen de R- en Python-scripts direct importeren in Tableau en profiteren van zijn visuele representaties, die vele malen superieur zijn aan die van deze talen. Ook zijn de visuele mogelijkheden van Tableau gemakkelijk en intuitief te gebruiken, waardoor veel tijd wordt bespaard voor Data Scientists.
In dit gedeelte zullen we zien hoe we Tableau kunnen verbinden met deze externe bronnen en de voordelen van deze verbindingen.
Tableau en R
R is een populair statistisch taal gebruikt om geavanceerde predictive analytics uit te voeren, zoals lineaire en niet-lineaire modellering, statistische testen, tijdreeksanalyse, classificatie, clustering, enzovoort.(Tableau 8.1 en R) Gebruikmakend van Tableau in combinatie met R heeft de volgende voordelen:
- Levert de statistische kracht van Tableau uit door haar gebruikers toegang te geven tot geavanceerde R-bibliotheken om beter en dieper inzichten uit de gegevens te verkrijgen.
- De uitgebreide gegevensonderzoekopties van Tableau en de mogelijkheid om met meerdere bronnen te verbinden zijn handig voor R-gebruikers.
- Bovendien maakt het ook mogelijk voor Tableau-gebruikers de nuttigheid van de R-taal te benutten zonder daadwerkelijk het taalgebruik te moeten kennen.
Hoe integreert Tableau met R?
R-functies en -modellen kunnen worden gebruikt in Tableau door nieuwe berekende velden te maken die dynamisch de R engine aanroepen en waarden doorgeven aan R. Deze resultaten worden vervolgens teruggestuurd naar Tableau om te worden gebruikt voor visualisatiedoeleinden.
Tableau Desktop instellen met R
- Download en installeer
Rserve
.
U moet het pakket Rserve
voor Tableau downloaden en installeren om verbinding te maken en de R-scriptfuncties te gebruiken. Voer in de R-console de volgende opdrachten in:
install.packages(“Rserve”) library(Rserve) Rserve() / Rserve(args = ‘ — no-save’)
Connect Tableau to the R Server
Als Rserve
met succes is geïnstalleerd, opent u Tableau Desktop en volgt u de onderstaande stappen.
-
Ga naar de
Help > Instellingen en voorkeuren en selecteer Externe serviceverbinding beheren
. - .
Voer de servernaam in als “Localhost” (of “127.0.0.1”) en een poort van “6311”.
-
Klik op de knop “Verbinding testen”. Je zou een succesvol bericht moeten zien. Klik op OK om af te sluiten.

Gebruik de R-scripts in Tableau
Nadat je de bovenstaande stappen met succes hebt voltooid, zul je nieuwe berekende velden in Tableau Desktop kunnen maken die de SCRIPT_*-functies gebruiken om R-functieoproepen te maken.
Laten we aan de slag gaan en kijken hoe we Tableau’s mogelijkheden met R kunnen gebruiken. We zullen de ingebouwde Sample Superstore-dataset gebruiken om winst zowel met behulp van een R-script als met Tableau’s sleep-en-neerzetfunctie te berekenen. Vervolgens zullen we beide resultaten vergelijken.
Stappen
- Open een Tableau-werkboek en maak verbinding met de sample superstore-gegevens.
- Maak verbinding met Rserve. Zodra Tableau Desktop verbonden is met Rserve, kan het de R-engine aanroepen via berekende velden.
-
We gaan nu een berekend veld aanmaken genaamd Verwachte Winst.
Vier functies zijn beschikbaar voor gebruik met R, en ze beginnen allemaal met het woord script. De functies zijn:
- SCRIPT_REAL: geeft reële getallen als resultaten terug
- SCRIPT_STR: geeft een tekenreeks terug
- SCRIPT_INT: geeft gehele getallen terug
- SCRIPT_BOOL: geeft booleans terug
- Voor dit voorbeeld gaan we de SCRIPT_REAL-functie gebruiken. We gaan een eenvoudige
lineaire regressie
in Tableau maken.
-
Open de berekende veld en voeg het volgende script toe.
SCRIPT_REAL("fit <- lm(.arg1 ~ .arg2 + .arg3 + .arg4) fit$fitted ", SUM([Profit]), AVG([Sales]), AVG([Quantity]), AVG([Discount]))
Het bovenstaande script betreft de lineaire回归modell in R. Dit model zal een afhankelijke variabele(arg1) en drie onafhankelijke variabelen(arg2, arg3, arg4) hebben. Deze argumenten zijn slechts placeholder en zodra het script terug naar R wordt gestuurd, worden de argumenten vervangen door de Tabellenkolommen die ze corresponderen. 5. Gegevensvelden invoeren die corresponderen met elke variabele. Het afhankelijke onderwerp hier is winst, dus we zullen
SUM(Profit)
eerst plaatsen omdat dat correspondeert met argument 1. Evenzo zullen we degemiddelde unitairprijs, gemiddelde bestelhoeveelheid
en degemiddelde korting
gebruiken voor de andere drie argumenten respectievelijk. -
Deze invoer zal nu allemaal worden getrokken naar het model voor het bepalen van verwachte winstniveaus. We zijn nu klaar om deze berekening binnen Tableau-visualisaties te gebruiken. Sleep de categorie over naar de rijen en dan
Profit
naar de kolommen. Sleep nuVerwachte Winst
ook naar de kolommen. -
Wij kunnen nu het model analyseren om te zien hoe het Berekende verwachte winst in R zich verhoudt tot de werkelijke winsten. We kunnen deze analyse verder uitdiepen door klantsegmenten naar de kleuren te trekken en nu we een gestapeld staafdiagram hebben gemaakt, kunnen we ook geordende data gebruiken om de gegevens uit te brengen per jaar of per kwartaal.
Handen aan de werkplaats

Men zou zich afvragen of al deze berekeningen ook in Tableau zouden kunnen zijn gedaan zonder gebruik te maken van R. Dus, waarom moeten we het proces doorlopen van het downloaden en configureren van Rserve in Tableau en het schrijven van scripts? R is een krachtige taal vanwege zijn vermogen om te voorspellen, gebruik makend van breed gebruikte bibliotheken die gemakkelijk bekende algoritmen bevatten. Imagineer hoe leuk het zou zijn om voorspellingen voor ons bedrijf te maken in Tableau, door een eenvoudig R-script aan te roepen en het vervolgens te kunnen integreren in Tableau’s visualisaties.
Tableau en Python
Python is een breed gebruikte algemene programmeertaal. Python biedt een groot aantal bibliotheken om statistische analyses, voorspellende modellering of machinaal leren uit te voeren. Het verbinden van Tableau met Python is een van de beste methoden voor voorspellende analyse. Tabpy is een pakket dat is ontwikkeld voor dit doel. Om Tableau in staat te stellen de kracht van Python te benutten, kan het verbonden worden met de TabPy-server om Python-code op het moment uit te voeren en resultaten in de vorm van visualisaties weer te geven.
Hoe integreert Tableau met Python?
Wanneer we TabPy met Tableau gebruiken, kunnen we berekende velden in Python definiëren, waardoor we de kracht van een groot aantal machineleerbibliotheken direct vanuit onze visualisaties kunnen benutten.
Tableau Desktop instellen met Python
Download en installeer Tabpy
.
Om een Python-code uit te voeren binnen een Tableau-werkboek is een Python-server nodig om deze uit te voeren. Het TabPy-framework doet dit werk. Download TabPy van Github via de volgende link. Als alternatief kunt u de onderstaande stappen volgen:
conda install -c anaconda tabpy-server
Ga daarna naar de map waar de gedownloade tabpy-server zich bevindt en voer deze uit.
python setp.py
Tableau verbinden met TabPy
De volgende stap is om Tableau met TabPy te verbinden. Dit kan gedaan worden door naar Help > Instellingen en prestatie > Beheer externe serviceverbinding:

Test de verbinding. Als alles goed gaat, zou je een melding moeten krijgen dat de verbinding succesvol is.
Begin met het gebruik van Python-scripts in Tableau.
De Python-integratie in Tableau is een zeer handige functie. Neem voorbeeld van het probleem van sentiment analyse. Het is een algemeen voorkomend probleem binnen de machine learninggemeenschap en kan worden gerealiseerd door verschillende machine learningalgoritmen. Echter, door de combinatie van Tableau en Python te gebruiken, kan dit op enkele regels Pythoncode worden gerealiseerd. De resultaten kunnen vervolgens worden gevisualiseerd in Tableau voor meer inzichten. Laten we dit zien met een voorbeeld(Bruik de kracht van Python in Tableau met TabPy)
Sentiment Analyse met Tabpy
We zullen het dataset van mobiele recensies gebruiken dat kan worden gedownload van hier.
Stappen:
- Importeer het dataset naar Tableau Desktop
- Maak verbinding met Tabpy. Zodra Tableau Desktop is verbonden met
Tabpy
, kan het de Python-engine aanroepen via berekende velden. -
We gaan nu een berekend veld aanmaken genaamd
Sentiment
als volgt: `SCRIPT_REAL("from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer vs = [] analyzer = SentimentIntensityAnalyzer() for i in range(0,len(_arg1)): a = analyzer.polarity_scores(_arg1[i])['compound'] vs.append(a) return vs",ATTR([Reviews]))`
We gebruiken hier de
VADER sentiment analyse
gereedschap. Het is een woordenboek en regelgebaseerd sentiment analyse gereedschap dat specifiek gecalibreerd is op gevoelens geexpresseerd in sociale media. Om dit gereedschap te gebruiken, moet u het eerst installeren. Lees meer op hun github pagina. -
Nu, sleep
Reviews
naar rijen enSentiment
naar de tekst en kleur merken kaart en zie de magie gebeuren. We krijgen de sentiment analyse van de recensie klaar zonder enige moeite. Ook is het super gemakkelijk om de resultaten te visualiseren. De positieve recensies zijn in vergrotenorde van groen terwijl de negatieve er in rood zijn.
Het bovenstaande voorbeeld maakt duidelijk de kracht van de integratie van Tableau met Python. Door de Sentiment scores in ons bezit te hebben, kunnen we die gebruiken om dieper in de details te delven. Bijvoorbeeld, als ik een bedrijfseigenaar ben, kunnen ik negatieve recensies filteren en over de redenen daarvoor nadenken. Ik kan ook op positieve recensies filteren om ideeën te krijgen over de producten die de consumenten gelukkig maken.
Tableau en SQL Server
Er is een verborgen waard in onze Microsoft SQL Server gegevens die onder de standaard rapportages en complexe business intelligence tools verborgen ligt. Tableau levert inzicht overal door iedereen uit te equiperen om een geavanceerde visuele analyse uit te voeren op SQL Server gegevens. We kunnen Tableau live aan SQL Server verbinden voor gekwalificeerde, platformspecifieke queries of de gegevens direct naar Tableau’s analytics engine brengen om de belasting op de database terug te dringen.
Tableau biedt een geoptimaliseerde, live connector aan voor SQL Server zodat we grafieken, rapportages en dashboards kunnen maken terwijl we direct met onze gegevens werken. Als we onze analyse verdiepen, herkent Tableau automatisch het schema dat in SQL Server wordt gebruikt, zodat we onze gegevens niet hoeven aan te passen.
Laten we een voorbeeld doorlopen dat laat zien hoe een SQL Server database met Tableau Desktop wordt verbonden en hoe het wordt gebruikt om visualisaties te maken.
Stappen:
- Meld u aan bij de SQL Server
- Open Tableau Desktop en onder Servers, maak verbinding met MS SQL.
- Voer de servernaam in in het dialoogvenster dat opens en klik op OK. Dit maakt de verbinding tussen Tableau en de SQL Server. Selecteer de gewenste database. In dit voorbeeld kiezen we de salesDB. U kunt vervolgens kiezen uit een lijst met tabellen, b.v. Sales Log. Het bestand wordt geïmporteerd in de omgeving van Tableau. Nu kunt u kiezen om de gehele gegevens of een deel ervan te exporteren naar een nieuw werkblad. U kunt zelfs het aantal rijen specificeren dat moet worden geëxporteerd.
- In het nieuwe werkblad hebben we de gegevens geëxtraheerd van MS SQL, vanaf hier kunt u erover werken als met elk ander Tableau-werkblad.
Hands On:

Dit is hoe we gemakkelijk de SQL Server kunnen verbinden met Tableau en de gegevens direct erin kunnen extraheren. Tableau laat de gebruikers een verbinding met een klik aan- of uitschakelen om in-memory-query’s toe te passen op een groter gegevens集.
8. Bewaren van het werk
Tableau Desktop
Om een Tableau-werkboek lokaal op te slaan, kies Bestand > Opslaan. Geef de bestandsnaam van het werkboek op in het dialoogvenster Opslaan als
. Tableau slaat de bestanden standaard op met de extensie .twb.
Tableau Public
Met Tableau Public worden alle weergaves en gegevens openbaar gemaakt, en iedereen op het internet heeft toegang tot ze. Kies Server > Tableau Public > Opslaan op Tableau Public
en voer de inloggegevens in.
Tableau Server
Als de gegevens geheime zijn en de story moet worden gedeeld met de gehele team, is Tableau Server handig. Om een story te publiceren op Tableau Server, selecteer je Select Server > Publish Workbook
of klik je op Share
op de werkbalk. Maak echter eerst een account aan.
Conclusie
Dat is alles wat we nodig hebben om een goede visualisatie te maken in Tableau, hoewel iemand misschien meer aanpassingen in elke fase zal doen dan hierboven beschreven. Dus door middel van experimenten en oefeningen wordt Tableau voor ons steeds meer bekend en zal hij ontscheidende functies ontsluiten om ons te helpen data te analyseren en voor te stellen. Laat een commentaar achter bij eventuele vragen of vragen en geniet van het visualiseren.
Bekijk onze Tutorial over het maken van Tableau visualisaties met behulp van de AirBnB dataset.
Source:
https://www.datacamp.com/tutorial/data-visualisation-tableau