Notre objectif en tant que analystes de données est de présenter les insights de nos données de manière à ce que chacun qui les voit puisse comprendre leurs implications et comment agir en conséquence avec clarté.
Tableau est une plateforme d’analyse et de visualisation des données largement utilisée dans l’industrie aujourd’hui. De nombreuses entreprises considèrent même qu’elle est indispensable pour les travaux liés à la science des données. L’accessibilité de Tableau provient du fait qu’il dispose d’une interface de glisser-déposer. Cette fonctionnalité permet de réaliser des tâches telles que le tri, la comparaison et l’analyse avec facilité et rapidité. Tableau est également compatible avec de multiples sources, y compris Excel, SQL Server et des dépôts de données cloud, ce qui en fait une excellente solution pour les data scientists.
1. Introduction à Tableau
Aperçu
Tableau Software est une entreprise de logiciels basée à Seattle, dans l’État de Washington, qui produit des produits interactifs de visualisation des données axés sur la business intelligence. Tableau a été fondé au sein du département de sciences informatiques de l’Université de Stanford entre 1997 et 2002(Wikipedia)
Les principaux produits offerts par Tableau sont :

Tableau Desktop, Tableau Public et Tableau Online, qui offrent tous la création de visualisations de données. Le choix dépend du type de travail à effectuer.

Dans ce tutoriel, nous travaillerons avec Tableau Desktop. Le lien vers la source de référence est ici.
Installation
En fonction du produit de votre choix, téléchargez le logiciel sur votre ordinateur. Après avoir accepté l’accord de licence, vous pouvez vérifier l’installation en cliquant sur l’icône Tableau. Si l’écran suivant apparaît, vous êtes prêt à commencer.

2. Premiers pas
Dans cette section, nous apprendrons quelques opérations de base dans Tableau pour nous familiariser avec son interface.
Espace de travail Tableau
L’espace de travail de Tableau est une collection de feuilles de travail, de barres de menu, de barres d’outils, de cartes de marque, d’étagères et d’autres éléments que nous découvrirons dans les prochaines sections. Les feuilles peuvent être des feuilles de travail, des tableaux de bord ou des histoires. L’image ci-dessous met en évidence les composants principaux de l’espace de travail. Cependant, une plus grande familiarité sera acquise lorsque nous travaillerons avec des données réelles.

Connexion à une source de données
Pour commencer à travailler avec Tableau, nous devons connecter Tableau à la source de données. Tableau est compatible avec beaucoup de sources de données. Les sources de données prises en charge par Tableau apparaissent sur le côté gauche de l’écran d’ouverture.某些常用的数据源是excel、文本文件、关系数据库甚至是服务器。人们还可以连接到云数据库源,如Google Analytics、Amazon Redshift等。
Le écran de lancement de Tableau Desktop affiche les sources de données disponibles auxquelles vous pouvez vous connecter. Cela dépend également de la version de Tableau, car la version payante offre plus de possibilités. Sur le côté gauche de l’écran, il y a un volet Connecter
qui met en évidence les sources disponibles. Les types de fichiers sont listés en premier, suivis par les types de serveurs courants ou les serveurs auxquels vous vous êtes connecté récemment. Vous pouvez ouvrir des classeurs précédemment créés sous l’onglet Ouvrir
. Tableau Desktop offre également des exemples de classeurs sous Exemples de classeurs
.
Pratique

Se connecter au jeu de données Sample-Superstore
Nous travaillerons avec un jeu de données exemple nommé Jeu de données Superstore, qui est préchargé avec Tableau. Cependant, nous téléchargerons le fichier depuis ici afin de mieux comprendre comment se connecter à une source de données Excel. Les données représentent une succursale de grand magasin. Elles contiennent des informations sur les produits, les ventes, les bénéfices, etc. Notre objectif en tant que data analysts est d’analyser les données et de déterminer les secteurs clés d’amélioration dans cette entreprise fictive.
Étapes
-
Importer les Données dans l’espace de travail Tableau depuis l’ordinateur.
-
Dans l’onglet Feuilles, trois feuilles seront visibles, à savoir Commandes, Personnes et Retours. Cependant, nous ne focusserons que sur les données de Commandes. Double-cliquer sur la feuille Commandes, et elle s’ouvre comme une feuille de calcul.
-
Nous remarquons que les trois premières lignes de données ont un aspect légèrement différent et ne sont pas dans le format souhaité. Ici, nous utilisons l’Interpréteur de données, également disponible dans l’onglet Feuilles. En cliquant dessus, nous obtenons une feuille bien formatée.
Pratique

Création d’une Vue
Nous commencerons par générer un graphique simple. Dans cette section, nous allons connaitre nos données et commencer à poser des questions à propos des données pour en tirer des insights. Il y a certains termes importants que nous rencontrerons dans cette section.
Dimension
Mesures
Agrégation
Les Dimensions sont des données qualitatives, comme un nom ou une date. Par défaut, Tableau classe automatiquement les données contenant des informations qualitatives ou catégorielles comme une dimension, par exemple, n’importe quel champ avec des valeurs de texte ou de date. Ces champs apparaissent généralement comme en-têtes de colonne pour les lignes de données, comme le nom du client ou la date de commande, et définissent également le niveau de granularité affiché dans la vue.
Les Mesures sont des données numériques quantitatives. Par défaut, Tableau traite n’importe quel champ contenant ce genre de données comme une mesure, par exemple, les transactions de vente ou le profit. Les données classées comme mesure peuvent être agrégées en fonction d’une dimension donnée, par exemple, les ventes totales (Mesure) par région (Dimension).
Aggrégation est le rassemblement des données au niveau de la ligne vers une catégorie supérieure, comme la somme des ventes ou le profit total.
Tableau trie automatiquement les champs dans Mesures et Dimensions. Cependant, en cas de anomalie, on peut également le modifier manuellement.
Étapes
-
Allez dans le classeur. Cliquez sur l’onglet
Feuille 1
en bas à gauche de l’espace de travail de tableau. -
Une fois dans le classeur, à partir de
Dimensions
sous le volet Données, faites glisserDate de commande
vers l’étagère des Colonnes.En faisant glisser
Date de commande
vers l’étagère des colonnes, une colonne pour chaque année de commandes est créée dans le jeu de données. Un indicateur ‘Abc’ est visible sous chaque colonne ce qui signifie que des données textuelles, numériques ou textuelles peuvent être glissées ici. D’autre part, si nous avions glisséVentes
ici, une交叉表 serait créée qui afficherait le total des ventes pour chaque année. -
De même, à partir de l’onglet
Mesures
, faites glisser le champVentes
sur l’étagère des Lignes.
Tableau remplit un graphique avec les ventes agrégées en tant que somme. Les ventes agrégées totales pour chaque année par date de commande sont affichées. Tableau remplit toujours un graphique en ligne pour une vue qui inclut un champ temporel, qui dans cet exemple est la Date de Commande.
Activité pratique

Que signifie le graphique en ligne ci-dessus ? Eh bien, il montre que les ventes semblent plutôt prometteuses et apparaissent croissantes avec le temps. C’est une information valable, mais il ne dit pas grand chose sur les produits qui contribuent aux augmentations des ventes. Faisons un peu plus profond pour obtenir plus d’insights.
Amélioration de la Vue
Faisons un peu plus profond et essayons de découvrir plus d’insights sur quels produits contribuent davantage aux ventes. Commençons par ajouter les catégories de produits pour regarder les totaux de ventes d’une manière différente.
Étapes
-
La catégorie est présente sous la zone des dimensions. Faites glisser-déposer-elle sur l’étagère des colonnes et placez-la à côté de
ANNÉE(Date de Commande)
. La catégorie doit être placée à droite deAnnée
. En le faisant, la vue est immédiatement transformée en type de barre en lieu de ligne. Le graphique montre les ventes globales de chaqueProduit
par année.En savoir plus
Pour afficher des informations sur chaque point de données (c’est-à-dire des points) dans la vue, survolez l’une des barres pour révéler un tooltip. Le tooltip affiche les ventes totales pour cette catégorie. Voici l’tooltip pour la catégorie des fournitures de bureau pour 2016 :
Pour ajouter des étiquettes à la vue, cliquez sur
Afficher les étiquettes des points
sur la barre d’outils.Le graphique de barres peut également être affiché horizontalement au lieu de verticalement. Cliquez sur
Échanger
sur la barre d’outils pour cela.
2. La vue ci-dessus montre bien les ventes
par catégorie
, c’est-à-dire le mobilier, les fournitures de bureau et la technologie. Nous pouvons également en déduire que les ventes de mobilier augmentent plus rapidement que les ventes de fournitures de bureau sauf en 2016. Il serait donc sage de concentrer les efforts de vente sur le mobilier plutôt que sur les fournitures de bureau. Mais le mobilier est une catégorie vaste et composée de nombreux articles différents. Comment identifier l’article de mobilier qui contribue le plus aux ventes ?
Pour nous aider à répondre à cette question, nous décidons d’examiner les produits par Sous-catégorie
pour voir quels articles sont les meilleurs vendeurs. Disons pour la catégorie Mobilier ; nous voulons regarder les détails concernant uniquement les bibliothèques, les chaises, les aménagements et les tables. Nous ferons un double-clic ou glisserons la dimension Sous-catégorie
sur l’étagère des Colonnes.
La sous-catégorie est un autre champ discret. Elle décortique davantage la Catégorie
et affiche une barre pour chaque sous-catégorie
décomposée par catégorie et par année. Cependant, c’est une quantité énorme de données à interpréter visuellement. Dans la section suivante, nous apprendrons à utiliser les filtres, la couleur et d’autres méthodes pour rendre la vue plus compréhensible.
Pratique

3. Mettre l’accent sur les résultats
Dans cette section, nous allons tenter de nous concentrer sur des résultats spécifiques. Les filtres et les couleurs sont des moyens d’ajouter plus de concentration sur les détails qui nous intéressent.
Ajouter des filtres à la vue
Les filtres peuvent être utilisés pour inclure ou exclure des valeurs dans la vue. Nous allons essayer d’ajouter deux filtres simples à la feuille de calcul pour faciliter l’examen des ventes de produits par sous-catégorie pour une année spécifique.
Étapes
Dans le volet Données, sous Dimensions, faites un clic droit sur la date de commande et sélectionnez Afficher le filtre.Repérez la même opération pour le champ Sous->catégorie.

Les filtres sont de type cartes et peuvent être déplacées sur la feuille de calcul par un simple glisser-déposer
Ajouter des couleurs à la vue
Les couleurs peuvent être utiles pour l’identification visuelle d’un modèle.
Étapes
Dans le volet Données, sous Mesures, faites glisser le Profit vers la couleur sur la carte de Signes.

On peut voir que les bibliothèques, les tables et même les machines contribuent à un profit négatif, c’est-à-dire à une perte. Une insight puissante.
Pratique

Constatations clés
Faisons un examen plus approfondi des filtres pour en apprendre davantage sur les produits non rentables.
Étapes
- Dans la vue, dans la carte de filtre
Sous-catégorie
, décochez toutes les cases saufBibliothèques
,Tables
etMachines
. Cela révèle un fait intéressant. Alors que dans certaines années, les Bibliothèques et les Machines étaient effectivement rentables. Cependant, en 2016, les Machines sont devenues non rentables. - Sélectionnez
Tout
dans la carte de filtreSous-catégorie
pour afficher à nouveau toutes les sous-catégories. - À partir des Dimensions, faites glisser
Région
vers l’étagèreLignes
et placez-le à gauche de l’onglet Somme(Ventes). Nous remarquons que les machines dans le Sud affichent un profit négatif global plus élevé que dans vos autres régions. - Donnons maintenant un nom à la feuille. Dans le coin inférieur gauche de l’espace de travail, double-cliquez sur
Feuille 1
et tapezVentes par Produit et Région
. - Afin de préserver la vue, Tableau nous permet de dupliquer notre feuille de calcul afin que nous puissions continuer dans une autre feuille là où nous en étions.
- Dans votre classeur, cliquez avec le bouton droit sur la feuille
Ventes par Produit et Région
et sélectionnezDupliquer
et renommez la feuille dupliquée enVentes-Sud
. - Dans la nouvelle feuille de calcul, à partir des Dimensions, faites glisser
Région
vers l’étagèreFiltres
pour l’ajouter en tant que filtre dans la vue. - Dans la boîte de dialogue Filtre Région, effacez toutes les cases à cocher sauf Sud, puis cliquez sur
OK
. Nous pouvons maintenant nous concentrer sur les ventes et le profit dans leSud
. Nous constatons que les ventes de machines avaient un profit négatif en 2014 et à nouveau en 2016. Nous en examinerons la raison dans la prochaine section. - Enfin, n’oubliez pas de sauvegarder vos résultats en sélectionnant
Fichier > Enregistrer sous
. Nommons notre classeurVentes et Bénéfices régionaux
.
Hands On

4. Aperçu cartographique
Créer un aperçu cartographique
Les aperçus cartographiques sont utiles lorsque nous examinons des données géographiques (champ région). Dans l’exemple actuel, Tableau reconnaît automatiquement que les champs pays, État, ville et code postal contiennent des informations géographiques.
Étapes
- Créer une nouvelle feuille.
- Ajouter
État
etPays
sous la zone des données àDétail
sur la carte des marques. Nous obtenons l’aperçu cartographique. - Glisser
Région
sur le tablier desFiltres
, puis filtrer jusqu’àSud
uniquement. L’aperçu cartographique est maintenant réduit à la région du Sud seulement, et une marque représente chaque État. - Glisser la mesure
Ventes
sur l’ongletCouleur
sur la carte des marques. Nous obtenons une carte remplie dont les couleurs indiquent le volume de ventes dans chaque État. - Nous pouvons modifier le schéma de couleurs en cliquant sur
Couleur
sur la carte des marques et en sélectionnantEditer les couleurs
. Nous pouvons expérimenter avec les palettes disponibles. - Nous observons que la Floride est la meilleure en termes de ventes. Si nous survolons la Floride, il est indiqué que les ventes s’élèvent à un total de 89 474 USD, par exemple, en comparaison avec la Caroline du Sud, qui n’a que 8 482 USD de ventes. Maintenant, essayons d’évaluer le rendement par le
Bénéfice
, car le Bénéfice est un meilleur indicateur que les ventes seules. - Faites glisser
Profit
versCouleur
sur la carte des marques. Nous voyons maintenant que le Tennessee, la Caroline du Nord et la Floride ont un profit négatif, même si il semblait qu’ils se débrouillaient bien en ventes. Renommez la feuille en Carte de Profit
Pratique

Se plonger dans les Détails
Les cartes nous permettent de visualiser les données de manière large. Dans l’étape précédente, nous avons découvert que le Tennessee, la Caroline du Nord et la Floride avaient un profit négatif. Dans cette section, nous allons tracer un Diagramme à barres pour explorer la raison du profit négatif.
Étapes
-
Dupliquez la feuille de calcul Carte de Profit et nommez-la Diagramme à Barres de Profit Négatif.
-
Cliquez sur
Montrez-Moi
sur la feuille de calcul Diagramme à Barres de Profit Négatif.Montrez-Moi
présente le nombre de façons dans lesquelles un graphique peut être tracé entre les éléments mentionnés dans la feuille de calcul. DansMontrez-Moi
, sélectionnez l’option de barre horizontale et la vue met à jour instantanément les barres verticales en horizontales. -
On peut sélectionner plusieurs barres à la fois en cliquant simplement et en faisant glisser le curseur dessus. Nous voulons nous concentrer uniquement sur les trois États, à savoir le Tennessee, la Caroline du Nord et la Floride. Par conséquent, nous sélectionnerons uniquement les barres qui leur correspondent.
En savoir plus
Création de hiérarchies
Les hiérarchies sont pratiques lorsque l’on souhaite regrouper des champs similaires afin de pouvoir rapidement effectuer un zoom entre les niveaux dans la visualisation.- Dans le volet Données, faites glisser un champ et déposez-le directement sur un autre champ ou faites un clic droit sur le champ et sélectionnez
- Faites glisser les champs supplémentaires dans la hiérarchie. Les champs peuvent également être réorganisés dans la hiérarchie en les faisant simplement glisser vers une nouvelle position. Dans la visualisation actuelle, nous créons les hiérarchies suivantes : Lieu, Commande et Produit.
-
Cliquez sur l’icône en forme de plus sur le champ
État
dans le Palier des lignes pour descendre au niveauVille
.- Il y a beaucoup de données. Nous pouvons utiliser
Filtre N
pour filtrer et révéler les moins bons performeurs. Pour cela, faites glisserVille
du voletDonnées
vers l’étage des filtres. Cliquez sur Par champ, puis cliquez sur la liste déroulanteTop
et sélectionnezBas
pour révéler les moins bons performeurs. Tapez 5 dans la zone de texte pour afficher les 5 derniers performeurs du jeu de données.
- Il y a beaucoup de données. Nous pouvons utiliser
Nous observons maintenant que Jacksonville et Miami, en Floride ; Burlington, en Caroline du Nord ; et Knoxville et Memphis, au Tennessee sont les villes les moins performantes en termes de profit. Il y a une autre marque dans la vue – Jacksonville, en Caroline du Nord – qui ne devrait pas être ici car elle présente des ventes rentables. Cela signifie qu’il y a un problème avec le filtre que nous avons appliqué. Nous ferons appel à l’ordre des opérations de Tableau.
-
Sur l’étagère des Filtres, faites un clic droit sur le jeu Inclusions (Pays, État) et sélectionnez
Ajouter au Contexte
. Nous constatons que maintenant Concord(Caroline du Nord) apparaît dans la vue tandis que Miami(Floride) a disparu. Cela a plus de sens maintenant. -
Mais Jacksonville (Caroline du Nord) est toujours présent ce qui est incorrect. Sur l’étagère des Lignes, cliquez sur l’icône en forme de plus sur l’onglet
Ville
pour descendre au niveau du Code Postal. Faites un clic droit sur le code postal pour Jacksonville, NC, 28540, puis sélectionnezExclure
pour exclure manuellement Jacksonville. -
Faites glisser le Code Postal de l’étagère des Lignes. C’est la vue finale.
À vous de jouer

Aperçus clés
Faisons maintenant ressortir uniquement les entités à perte, c’est-à-dire les Produits et identifions également les emplacements où ces produits sont vendus.
Étapes
- Faites glisser
Sous-catégorie
vers les Lignes pour descendre davantage. - De même, faites glisser
Profit
versCouleur
sur la carte des Marques. Cela permet de repérer rapidement les produits avec un profit négatif. - Faites un clic droit sur
Date de commande
et sélectionnezAfficher le filtre
. Il semble que les Machines, les tables et les agrafieurs se débrouillent mal. Alors que devrions-nous faire ? Une solution serait de cesser la vente de ces produits à Jacksonville, Concord, Burlington, Knoxville et Memphis ? Vérifions si notre décision est la bonne. - Retournons à l’onglet précédemment créé
Carte des profits
. - Cliquez sur le champ
Sous-catégorie
pour sélectionner l’optionAfficher le filtre
- .Faites glisser
Profit
situé sousMesures
vers la carte des marquesÉtiquette
- .Cliquez de nouveau sur
Date de commande
et sélectionnezAfficher le filtre
. Dans le filtre, nous allons enlever les éléments qui, selon nous, contribuent à un profit négatif. Désactivez donc les cases devant les rubriques Outils de liement, Machines et Tables respectivement. Il ne reste alors que les entités générant du profit. Cela montre que les entités comme les outils de liement, les machines et les tables étaient effectivement des sources de pertes dans certaines régions, et que nous avions raison dans nos constatations.
À vous de jouer
5. Tableau de bord
Un tableau de bord est une collection de plusieurs vues, permettant de comparer diverses données simultanément.
Création d’un tableau de bord
Étapes
- Cliquez sur le bouton
Nouveau tableau de bord
- .Faites glisser
Ventes dans le Sud
vers le tableau de bord vide - .Faites glisser
Carte des profits
vers le tableau de bord et déposez-la par-dessus la vue Ventes dans le Sud. Les deux vues sont visibles en même temps. Pour présenter les données de manière à ce que les autres puissent les comprendre, nous pouvons organiser le tableau de bord à notre goût. - Sur la feuille de travail
Ventes Sud
dans la vue tableau de bord, cliquez sousRégion
et retirezAfficher l'en-tête
. Répétez le même processus pour tous les autres en-têtes. Cela permet de mettre en évidence uniquement ce qui est nécessaire et de masquer les informations moins importantes. - Sur la
Carte des Bénéfices
, cachez également le titre et répétez les mêmes étapes pour la carteVentes Sud
. - Nous pouvons voir que la carte du
Sous-Catégorie
et de l’Année de la Date de Commande
sont répétées sur le côté droit. Faisons disparaître l’excès en les croisant simplement. Ensuite, cliquez surAnnée de la Date de Commande
. Une flèche descendant apparaît et sélectionnez l’optionValeur unique (Curseur)
. Laissez la magie se dérouler. Expérimentez en choisissant différentes années sur le curseur et les ventes varient également. - Faites glisser le filtre
SUM(Profit)
vers le bas du tableau de bord en-dessous des ventes dans le Sud pour une meilleure vue.
Maintenance

Ajout d’interactivité
Pour rendre le tableau de bord plus interactif, comme voir quelles sous-catégories sont bénéfiques dans lesquels États, il faut faire quelques modifications.
Étapes
- Commencez par la
Carte des Bénéfices
. Lorsque vous cliquez sur la carte, une icôneUtiliser comme filtre
apparaît en haut à droite. Cliquez sur elle. Si vous sélectionnez n’importe quelle carte, les ventes correspondantes à cet État seront mises en évidence sur la carteVentes Sud
. - Pour l’
Année de la Date de Commande
, cliquez sur l’option de menu déroulant et allez àAppliquer aux Feuilles de Calcul > Feuilles de Calcul Sélectionnées
. Une boîte de dialogue s’ouvre. Sélectionnez l’optionTout
suivi deOK
. Quelle est l’option ? Elle applique les filtres à toutes les feuilles de calcul utilisant la même source de données. - Explorez et expérimentez. Dans la visualisation ci-dessous, nous pouvons filtrer la carte
Ventes Sud
pour afficher uniquement les produits vendus en Caroline du Nord. Nous pouvons ensuite explorer facilement les profits annuels. - Renommez le Tableau de bord en
Ventes Régionales et Profits
.
Pratique

En conséquence, la vente de machines en Caroline du Nord n’a apporté aucun profit à l’entreprise.
6. Histoire
Un tableau de bord est une fonctionnalité intéressante, mais Tableau offre également la possibilité de présenter nos résultats en mode présentation sous forme d’histoires sur lesquelles nous discuterons dans cette section.
Construire une Histoire
Étapes
- Cliquez sur le bouton
Nouvelle histoire
. - Dans le volet Histoire situé sur la gauche, faites glisser le classeur
Ventes dans le Sud
(créé plus tôt) sur la vue. - Modifiez le texte dans la boîte grise située au-dessus du classeur. C’est la légende. Nommez-la
Ventes et profits par année
. - Les histoires sont assez spécifiques. Ici, nous raconterons l’histoire de la vente de machines en Caroline du Nord. Dans le volet Histoire, cliquez sur
Dupliquer
pour dupliquer la première légende, ou vous pouvez même en créer une nouvelle. - Dans la
Sous-catégorie
, filtrezselect
uniquementMachines
. Cela aide à évaluer les ventes et les profits des machines par année. - Renommez la légende en
Ventes et profits des machines par année
.
Pratique

Faire une Conclusion
Il est clair que les machines en Caroline du Nord entraînent une perte de bénéfices. Cependant, cela ne peut être démontré en examinant le bénéfice et les ventes globales. Pour cela, nous avons besoin de bénéfices régionaux.
Étapes
- Dans la zone d’histoire, sélectionnez
Vide
. Glissez le tableau de bord déjà crééVentes et bénéfices régionaux
sur le canevas. - Décrivez-le comme
Produits performants faiblement en Caroline du Sud
. - Sélectionnez
Dupliquer
pour créer un autre point d’histoire avec le tableau de bord des bénéfices régionaux. Sélectionnez la Caroline du Nord sur le graphique en barre car nous nous intéressons à en montrer davantage. - Sélectionnez toutes les années.
- Ajoutez une légende pour clarifier, comme
Bénéfice en Caroline du Nord : 2013-2016
. - Sélectionnez une année comme 2014. Ajoutez une légende, par exemple,
Bénéfice en Caroline du Nord : 2014
et cliquez ensuite sur l’onglet Dupliquer. Répétez l’étape pour toutes les années restantes. - Cliquez sur le mode présentation et laissez l’
histoire
se dérouler.
Hands On

Maintenant, nous avons une idée de ce que les produits ont été introduits sur le marché de la Caroline du Nord quand et comment ils ont performé. Non seulement avons-nous identifié une manière de traiter le bénéfice négatif, mais nous avons également réussi à le soutenir avec des données. C’est l’avantage des histoires dans Tableau.
7. L’intégration de Tableau avec R, Python & SQL
Mis à part les divers avantages de visualisation qu’offre Tableau, il possède également des capacités de connexion incroyables prêtes à l’emploi. Tableau peut facilement s’intégrer avec des langages comme Python et R et même avec des SGBD comme SQL. Cela offre des avantages accrus en termes de fonctionnalités et est pratique pour les Data Scientists habitués à travailler en Python ou R. Ils peuvent directement importer les scripts R et Python dans Tableau et tirer parti de ses visualisations qui sont bien supérieures à celles de ces langages. De plus, les capacités de visualisation de Tableau sont faciles à utiliser et très intuitives, ce qui permet de gagner beaucoup de temps pour les Data Scientists.
Dans cette section, nous verrons comment nous pouvons connecter Tableau à ces sources externes et les avantages de ces connexions.
Tableau et R
R est un langage statistique populaire utilisé pour effectuer des analyses prédictives sophistiquées, telles que la modélisation linéaire et non linéaire, les tests statistiques, l’analyse de séries temporelles, la classification, le clustering, etc.(Tableau 8.1 et R) Utiliser Tableau en conjonction avec R présente les avantages suivants:
- Exploite la puissance statistique de Tableau en donnant à ses utilisateurs accès à des bibliothèques R sophistiquées pour obtenir des insights meilleurs et plus approfondis à partir des données.
- Les options améliorées d’exploration de données de Tableau et sa capacité à se connecter à de multiples sources sont pratiques pour les utilisateurs de R.
- De plus, cela permet également aux utilisateurs de Tableau de bénéficier de l’utilité du langage R sans avoir à le connaître réellement.
Comment Tableau s’intègre avec R?
Les fonctions et modèles R peuvent être utilisés dans Tableau en créant de nouveaux champs calculés qui invoquent dynamiquement le moteur R et passent des valeurs à R. Ces résultats sont ensuite renvoyés à Tableau pour être utilisés à des fins de visualisation.
Configuration de Tableau Desktop avec R
- Téléchargez et installez
Rserve
.
Vous devrez télécharger et installer le paquet Rserve
pour que Tableau puisse se connecter et utiliser les fonctions du script R. Dans la console R, entrez les commandes suivantes :
install.packages(“Rserve”) library(Rserve) Rserve() / Rserve(args = ‘ — no-save’)
Connectez Tableau au serveur R
Une fois que Rserve
est installé avec succès, ouvrez Tableau Desktop et suivez les étapes mentionnées ci-dessous.
-
Allez dans
Aide > Paramètres et préférences et sélectionnez Gérer les connexions de services externes
. -
Entrez le nom du serveur « Localhost » (ou « 127.0.0.1 ») et le port « 6311 ».
-
Cliquez sur le bouton « Tester la connexion ». Vous devriez voir un message de succès. Cliquez sur OK pour fermer.

Commencez à utiliser les scripts R dans Tableau
Lorsque vous aurez réussi les étapes ci-dessus, vous pourrez créer de nouvelles champs calculés dans Tableau Desktop qui utilisent les fonctions SCRIPT_* pour appeler des fonctions R.
Allons-y et voyons comment nous pouvons utiliser les capacités de Tableau avec R.Nous utiliserons le jeu de données intégré Sample Superstore pour calculer le Profit en utilisant un script R et la fonctionnalité de glisser-déposer de Tableau. Nous comparerons ensuite les résultats des deux méthodes.
Étapes
- Ouvrez le fichier Tableau et connectez-vous aux données Sample Superstore.
- Connectez-vous à Rserve. Une fois que Tableau Desktop est connecté à Rserve, il peut invoquer le moteur R par l’intermédiaire des champs calculés.
-
Nous allons maintenant créer un champ calculé appelé Expected Profit.
Quatre fonctions sont disponibles pour l’utilisation avec R, et elles commencent toutes par la même suite de caractères script. Les fonctions sont :
- SCRIPT_REAL: retourne des nombres réels comme résultats
- SCRIPT_STR: retourne une chaîne de caractères
- SCRIPT_INT : retourne des entiers
- SCRIPT_BOOL: retourne des booléens
- Pour cet exemple, nous allons utiliser la fonction SCRIPT_REAL. Nous allons créer une simple régression linéaire dans Tableau.
-
Ouvrez le champ calculé et insérez le script suivant.
SCRIPT_REAL("fit <- lm(.arg1 ~ .arg2 + .arg3 + .arg4) fit$fitted ", SUM([Profit]), AVG([Ventes]), AVG([Quantité]), AVG([Remise]))
Le script ci-dessus concerne le modèle de régression linéaire dans R. Ce modèle aura une variable dépendante(arg1) et trois variables indépendantes(arg2, arg3, arg4). Ces arguments sont des placeholders, et lorsque le script est transmis à R, les arguments seront remplacés par les colonnes de tableau auxquelles ils correspondent. 5. Saisissez les champs Tableau qui correspondent à chacune des variables. La variable dépendante ici est le profit, donc nous mettrons
SUM(Profit)
en premier puisque cela correspond à l’argument 1. De même, nous utiliserons respectivementprix unitaire moyen, quantité moyenne des commandes
etremise moyenne
pour les trois autres arguments. -
Ces entrées seront maintenant toutes tirées dans le modèle pour déterminer les niveaux de bénéfice prévus. Nous sommes maintenant prêts à utiliser cette calcul dans les visualisations Tableau. Glissez la catégorie sur les rangées, puis
Profit
sur les colonnes. Maintenant, glissezExpected Profit
sur les colonnes. -
Nous pouvons maintenant analyser le modèle pour voir comment le rendement prévu calculé en R compare aux bénéfices réels. Nous pouvons aller plus loin en tirant des segments de clients sur les couleurs, et maintenant nous avons créé un graphique en barres empilées qui peut également utiliser des dates ordonnées pour découper les données par années ou par trimestres.
Hands On

On pourrait se demander si toutes les calculs précédents pourraient avoir été effectués dans Tableau sans utiliser R. Alors, pourquoi devrions-nous passer par le processus de téléchargement et de configuration de Rserve dans Tableau et écrire des scripts? R est une langue puissante parce qu’elle permet de faire des prévisions en utilisant des bibliothèques largement utilisées contenant des algorithmes bien connus. Imaginez combien cela serait agréable de faire des prévisions pour notre entreprise dans Tableau, en appelant un simple script R et puis de pouvoir l’intégrer dans les visualisations de Tableau.
Tableau et Python
Python est un langage de programmation polyvalent largement utilisé. Python offre un grand nombre de bibliothèques pour effectuer des analyses statistiques, des modèles prédictifs ou l’apprentissage automatique. Connecter Tableau à Python est l’une des meilleures approches pour l’analyse prédictive. Tabpy est un package développé pour cela. Pour permettre à Tableau de tirer parti de Python, il peut être connecté au serveur TabPy pour exécuter du code Python à la volée et afficher les résultats sous forme de visualisations.
Comment Tableau s’intègre-t-il à Python ?
Lorsque nous utilisons TabPy avec Tableau, nous pouvons définir des champs calculés en Python, ce qui permet de tirer parti du grand nombre de bibliothèques d’apprentissage automatique directement depuis nos visualisations.
Configuration de Tableau Desktop avec Python
Téléchargez et installez Tabpy
.
Exécuter un code Python à l’intérieur d’un classeur Tableau nécessite un serveur Python pour l’exécuter. Le framework TabPy est celui qui fait le travail. Téléchargez TabPy à partir de Github à l’adresse suivante. Sinon, vous pouvez suivre les étapes ci-dessous :
conda install -c anaconda tabpy-server
Ensuite, cd vers le répertoire contenant le serveur tabpy téléchargé et exécutez-le.
python setp.py
Connexion de Tableau à TabPy
L’étape suivante consiste à connecter Tableau à TabPy. Cela peut être fait en allant dans Aide > Paramètres et performances > Gérer la connexion aux services externes :

Testez la connexion. Si tout se passe bien, vous devriez voir apparaître un message de succès de connexion.
Commencez à utiliser les scripts Python dans Tableau.
L’intégration de Python dans Tableau est une fonctionnalité très utile. Envisagez par exemple le problème d’analyse des sentiments. Il s’agit d’un problème courant dans la communauté de la machine à apprentissage et peut être réalisé par plusieurs algorithmes d’apprentissage automatique. Cependant, en utilisant une combinaison de Tableau et de Python, le même résultat peut être obtenu en quelques lignes de code Python. Les résultats peuvent ensuite être visualisés dans Tableau pour obtenir de plus amples informations. Voyons cela par un exemple(Utilisez les puissances de Python dans Tableau avec TabPy)
Analyse des sentiments avec Tabpy
Nous utiliserons le jeu de données des avis sur les téléphones portables, qui peut être téléchargé de ici.
Étapes :
- Importer le jeu de données dans Tableau Desktop
- Se connecter à Tabpy. Une fois que Tableau Desktop est connecté à
Tabpy
, il peut invoquer le moteur Python à travers des champs calculés. -
Nous allons maintenant créer un champ calculé appelé
Sentiment
comme suit : `SCRIPT_REAL("from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer vs = [] analyzer = SentimentIntensityAnalyzer() for i in range(0,len(_arg1)): a = analyzer.polarity_scores(_arg1[i])['compound'] vs.append(a) return vs",ATTR([Reviews]))`
Nous utilisons ici l’outil
analyse de sentiment VADER
. C’est un outil d’analyse de sentiment basé sur un lexique et des règles qui est spécifiquement adapté aux sentiments exprimés sur les réseaux sociaux. Pour utiliser cet outil, vous devez d’abord l’installer. Veuillez en lire plus sur leur page github. -
Maintenant, glissez
Reviews
sur les colonnes etSentiment
sur la carte Text and Color Marks card et voyez la magie se produire. Nous effectuons l’analyse de sentiment de l’avis sans aucun problème. De plus, il devient super facile de visualiser les résultats également. Les avis positifs sont dans un ordre croissant de vert tandis que les négatifs sont en rouge.
Cet exemple montre clairement la puissance offerte par l’intégration de Tableau avec Python. En disposant des scores de Sentiment à notre disposition, nous pouvons travailler avec celui-ci pour explorer plus profondément les détails. Par exemple, en tant que propriétaire d’entreprise, je peux filtrer les avis négatifs et m’attarder à la cause en question. Je peux également filtrer les avis positifs pour avoir une idée des produits qui font du bien aux consommateurs.
Tableau et SQL Server
Il y a une valeur cachée dans nos données Microsoft SQL Server qui se trouve enfouie sous les rapports standards et les outils de BI complexes. Tableau permet de dégager des insights partout en dotant n’importe qui d’outils de visualisation sophistiqués pour analyser les données de SQL Server. Nous pouvons connecter Tableau à SQL Server en direct pour des requêtes spécifiques au plateforme, ou directement importer les données dans l’engin d’analyse de Tableau pour décharger la base de données.
Tableau fournit un connecteur optimisé et en direct vers SQL Server, ce qui nous permet de créer des graphiques, des rapports et des tableaux de bord tout en travaillant directement avec nos données. En approfondissant notre analyse, Tableau reconnaît le schéma utilisé dans SQL Server, nous n’ayons donc pas à manipuler notre donnée.
Allons-y sur un exemple montrant comment connecter une base de données SQL Server à Tableau Desktop et l’utiliser pour créer des visualisations.
Étapes :
- Se connecter au serveur SQL
- Ouvrir Tableau Desktop et sous Servers, connecter à MS SQL.
- Collez le nom du serveur dans la boîte de dialogue qui s’ouvre et cliquez sur Ok. Cela connecte Tableau à SQL Server. Sélectionnez la base de données de votre choix. Dans cet exemple, nous sélectionnons salesDB. Vous pouvez ensuite sélectionner n’importe quelle TABLE de la liste, par exemple, Sales Log. La table est importée dans l’environnement Tableau. Maintenant, vous pouvez choisir d’extraire toutes les données ou une partie de celles-ci vers une nouvelle feuille. Vous pouvez même spécifier le nombre de lignes à extraire.
- Dans la nouvelle feuille, vous avez les données extraites de MS SQL. Depuis là, vous pouvez travailler avec elles comme avec n’importe quelle feuille de Tableau.
Hands On :

C’est ainsi que nous pouvons facilement connecter SQL Server à Tableau et extraire les données directement dedans. Tableau permet aux utilisateurs de basculer les connexions en un clic pour appliquer des requêtes en mémoire à un jeu de données plus grand.
8. Enregistrer le travail
Tableau Desktop
Pour enregistrer un rapport Tableau localement, sélectionnez Fichier > Enregistrer. Spécifiez le nom du fichier de rapport dans la boîte de dialogue Enregistrer sous
. Tableau enregistre par défaut le fichier avec l’extension .twb.
Tableau Public
Avec Tableau Public, toutes les vues et les données sont publiées et n’importe qui sur internet peut y accéder. Sélectionnez Serveur > Tableau Public > Enregistrer sur Tableau Public
et entrez les informations d’identification.
Tableau Server
In cas où les données sont confidentielles et que l’histoire doit être partagée avec toute l’équipe, le Tableau Server est très utile. Pour publier une histoire sur Tableau Server, sélectionnez Sélectionnez Serveur > Publier un classeur
ou cliquez sur Partager
dans la barre d’outils. Mais assurez-vous d’abord de créer un compte.
Conclusion
C’est tout ce que nous avons besoin pour créer une bonne visualisation dans Tableau, bien que certains puissent trouver qu’il faut faire beaucoup plus de révisions à chaque étape que ce que nous avons fait ici. Donc, avec l’expérimentation et la pratique, Tableau devient beaucoup plus familier et dévoilera des fonctionnalités étonnantes pour nous aider à analyser et présenter des données. Veuillez laisser un commentaire en bas si vous avez des demandes ou des questions, et bonne visualisation.
Consultez notre Tutoriel de création de visualisations Tableau à l’aide du jeu de données AirBnB.
Source:
https://www.datacamp.com/tutorial/data-visualisation-tableau