Visualisation des données avec Tableau

Notre objectif en tant que analystes de données est de présenter les insights de nos données de manière à ce que chacun qui les voit puisse comprendre leurs implications et comment agir en conséquence avec clarté.

Tableau est une plateforme d’analyse et de visualisation des données largement utilisée dans l’industrie aujourd’hui. De nombreuses entreprises considèrent même qu’elle est indispensable pour les travaux liés à la science des données. L’accessibilité de Tableau provient du fait qu’il dispose d’une interface de glisser-déposer. Cette fonctionnalité permet de réaliser des tâches telles que le tri, la comparaison et l’analyse avec facilité et rapidité. Tableau est également compatible avec de multiples sources, y compris Excel, SQL Server et des dépôts de données cloud, ce qui en fait une excellente solution pour les data scientists.

1. Introduction à Tableau

Aperçu

Tableau Software est une entreprise de logiciels basée à Seattle, dans l’État de Washington, qui produit des produits interactifs de visualisation des données axés sur la business intelligence. Tableau a été fondé au sein du département de sciences informatiques de l’Université de Stanford entre 1997 et 2002(Wikipedia)

Les principaux produits offerts par Tableau sont :

Tableau Desktop, Tableau Public et Tableau Online, qui offrent tous la création de visualisations de données. Le choix dépend du type de travail à effectuer.

Installation

En fonction du produit de votre choix, téléchargez le logiciel sur votre ordinateur. Après avoir accepté l’accord de licence, vous pouvez vérifier l’installation en cliquant sur l’icône Tableau. Si l’écran suivant apparaît, vous êtes prêt à commencer.

2. Premiers pas

Dans cette section, nous apprendrons quelques opérations de base dans Tableau pour nous familiariser avec son interface.

Espace de travail Tableau

L’espace de travail de Tableau est une collection de feuilles de travail, de barres de menu, de barres d’outils, de cartes de marque, d’étagères et d’autres éléments que nous découvrirons dans les prochaines sections. Les feuilles peuvent être des feuilles de travail, des tableaux de bord ou des histoires. L’image ci-dessous met en évidence les composants principaux de l’espace de travail. Cependant, une plus grande familiarité sera acquise lorsque nous travaillerons avec des données réelles.

source:Tableau.com

Connexion à une source de données

Pour commencer à travailler avec Tableau, nous devons connecter Tableau à la source de données. Tableau est compatible avec beaucoup de sources de données. Les sources de données prises en charge par Tableau apparaissent sur le côté gauche de l’écran d’ouverture.某些常用的数据源是excel、文本文件、关系数据库甚至是服务器。人们还可以连接到云数据库源,如Google Analytics、Amazon Redshift等。

Le écran de lancement de Tableau Desktop affiche les sources de données disponibles auxquelles vous pouvez vous connecter. Cela dépend également de la version de Tableau, car la version payante offre plus de possibilités. Sur le côté gauche de l’écran, il y a un volet Connecter qui met en évidence les sources disponibles. Les types de fichiers sont listés en premier, suivis par les types de serveurs courants ou les serveurs auxquels vous vous êtes connecté récemment. Vous pouvez ouvrir des classeurs précédemment créés sous l’onglet Ouvrir. Tableau Desktop offre également des exemples de classeurs sous Exemples de classeurs.

Pratique

Se connecter au jeu de données Sample-Superstore

Nous travaillerons avec un jeu de données exemple nommé Jeu de données Superstore, qui est préchargé avec Tableau. Cependant, nous téléchargerons le fichier depuis ici afin de mieux comprendre comment se connecter à une source de données Excel. Les données représentent une succursale de grand magasin. Elles contiennent des informations sur les produits, les ventes, les bénéfices, etc. Notre objectif en tant que data analysts est d’analyser les données et de déterminer les secteurs clés d’amélioration dans cette entreprise fictive.

Étapes

  1. Importer les Données dans l’espace de travail Tableau depuis l’ordinateur.

  2. Dans l’onglet Feuilles, trois feuilles seront visibles, à savoir Commandes, Personnes et Retours. Cependant, nous ne focusserons que sur les données de Commandes. Double-cliquer sur la feuille Commandes, et elle s’ouvre comme une feuille de calcul.

  3. Nous remarquons que les trois premières lignes de données ont un aspect légèrement différent et ne sont pas dans le format souhaité. Ici, nous utilisons l’Interpréteur de données, également disponible dans l’onglet Feuilles. En cliquant dessus, nous obtenons une feuille bien formatée.

Pratique

Création d’une Vue

Nous commencerons par générer un graphique simple. Dans cette section, nous allons connaitre nos données et commencer à poser des questions à propos des données pour en tirer des insights. Il y a certains termes importants que nous rencontrerons dans cette section.

Dimension

Mesures

Agrégation

Les Dimensions sont des données qualitatives, comme un nom ou une date. Par défaut, Tableau classe automatiquement les données contenant des informations qualitatives ou catégorielles comme une dimension, par exemple, n’importe quel champ avec des valeurs de texte ou de date. Ces champs apparaissent généralement comme en-têtes de colonne pour les lignes de données, comme le nom du client ou la date de commande, et définissent également le niveau de granularité affiché dans la vue.

Les Mesures sont des données numériques quantitatives. Par défaut, Tableau traite n’importe quel champ contenant ce genre de données comme une mesure, par exemple, les transactions de vente ou le profit. Les données classées comme mesure peuvent être agrégées en fonction d’une dimension donnée, par exemple, les ventes totales (Mesure) par région (Dimension).

Aggrégation est le rassemblement des données au niveau de la ligne vers une catégorie supérieure, comme la somme des ventes ou le profit total.

Tableau trie automatiquement les champs dans Mesures et Dimensions. Cependant, en cas de anomalie, on peut également le modifier manuellement.

Étapes

  1. Allez dans le classeur. Cliquez sur l’onglet Feuille 1 en bas à gauche de l’espace de travail de tableau.

  2. Une fois dans le classeur, à partir de Dimensions sous le volet Données, faites glisser Date de commande vers l’étagère des Colonnes.

    En faisant glisser Date de commande vers l’étagère des colonnes, une colonne pour chaque année de commandes est créée dans le jeu de données. Un indicateur ‘Abc’ est visible sous chaque colonne ce qui signifie que des données textuelles, numériques ou textuelles peuvent être glissées ici. D’autre part, si nous avions glissé Ventes ici, une交叉表 serait créée qui afficherait le total des ventes pour chaque année.

  3. De même, à partir de l’onglet Mesures , faites glisser le champ Ventes sur l’étagère des Lignes.

Tableau remplit un graphique avec les ventes agrégées en tant que somme. Les ventes agrégées totales pour chaque année par date de commande sont affichées. Tableau remplit toujours un graphique en ligne pour une vue qui inclut un champ temporel, qui dans cet exemple est la Date de Commande.

Activité pratique

Que signifie le graphique en ligne ci-dessus ? Eh bien, il montre que les ventes semblent plutôt prometteuses et apparaissent croissantes avec le temps. C’est une information valable, mais il ne dit pas grand chose sur les produits qui contribuent aux augmentations des ventes. Faisons un peu plus profond pour obtenir plus d’insights.

Amélioration de la Vue

Faisons un peu plus profond et essayons de découvrir plus d’insights sur quels produits contribuent davantage aux ventes. Commençons par ajouter les catégories de produits pour regarder les totaux de ventes d’une manière différente.

Étapes

  1. La catégorie est présente sous la zone des dimensions. Faites glisser-déposer-elle sur l’étagère des colonnes et placez-la à côté de ANNÉE(Date de Commande). La catégorie doit être placée à droite de Année. En le faisant, la vue est immédiatement transformée en type de barre en lieu de ligne. Le graphique montre les ventes globales de chaque Produit par année.

    En savoir plus

    Pour afficher des informations sur chaque point de données (c’est-à-dire des points) dans la vue, survolez l’une des barres pour révéler un tooltip. Le tooltip affiche les ventes totales pour cette catégorie. Voici l’tooltip pour la catégorie des fournitures de bureau pour 2016 :

    Pour ajouter des étiquettes à la vue, cliquez sur Afficher les étiquettes des points sur la barre d’outils.

    Le graphique de barres peut également être affiché horizontalement au lieu de verticalement. Cliquez sur Échanger sur la barre d’outils pour cela.

 2. La vue ci-dessus montre bien les ventes par catégorie, c’est-à-dire le mobilier, les fournitures de bureau et la technologie. Nous pouvons également en déduire que les ventes de mobilier augmentent plus rapidement que les ventes de fournitures de bureau sauf en 2016. Il serait donc sage de concentrer les efforts de vente sur le mobilier plutôt que sur les fournitures de bureau. Mais le mobilier est une catégorie vaste et composée de nombreux articles différents. Comment identifier l’article de mobilier qui contribue le plus aux ventes ?

Pour nous aider à répondre à cette question, nous décidons d’examiner les produits par Sous-catégorie pour voir quels articles sont les meilleurs vendeurs. Disons pour la catégorie Mobilier ; nous voulons regarder les détails concernant uniquement les bibliothèques, les chaises, les aménagements et les tables. Nous ferons un double-clic ou glisserons la dimension Sous-catégorie sur l’étagère des Colonnes.

La sous-catégorie est un autre champ discret. Elle décortique davantage la Catégorie et affiche une barre pour chaque sous-catégorie décomposée par catégorie et par année. Cependant, c’est une quantité énorme de données à interpréter visuellement. Dans la section suivante, nous apprendrons à utiliser les filtres, la couleur et d’autres méthodes pour rendre la vue plus compréhensible.

Pratique

3. Mettre l’accent sur les résultats

Dans cette section, nous allons tenter de nous concentrer sur des résultats spécifiques. Les filtres et les couleurs sont des moyens d’ajouter plus de concentration sur les détails qui nous intéressent.

Ajouter des filtres à la vue

Les filtres peuvent être utilisés pour inclure ou exclure des valeurs dans la vue. Nous allons essayer d’ajouter deux filtres simples à la feuille de calcul pour faciliter l’examen des ventes de produits par sous-catégorie pour une année spécifique.

Étapes

Dans le volet Données, sous Dimensions, faites un clic droit sur la date de commande et sélectionnez Afficher le filtre.Repérez la même opération pour le champ Sous->catégorie.

Les filtres sont de type cartes et peuvent être déplacées sur la feuille de calcul par un simple glisser-déposer

Ajouter des couleurs à la vue

Les couleurs peuvent être utiles pour l’identification visuelle d’un modèle.

Étapes

Dans le volet Données, sous Mesures, faites glisser le Profit vers la couleur sur la carte de Signes.

On peut voir que les bibliothèques, les tables et même les machines contribuent à un profit négatif, c’est-à-dire à une perte. Une insight puissante.

Pratique

Constatations clés

Faisons un examen plus approfondi des filtres pour en apprendre davantage sur les produits non rentables.

Étapes

  1. Dans la vue, dans la carte de filtre Sous-catégorie, décochez toutes les cases sauf Bibliothèques, Tables et Machines. Cela révèle un fait intéressant. Alors que dans certaines années, les Bibliothèques et les Machines étaient effectivement rentables. Cependant, en 2016, les Machines sont devenues non rentables.
  2. Sélectionnez Tout dans la carte de filtre Sous-catégorie pour afficher à nouveau toutes les sous-catégories.
  3. À partir des Dimensions, faites glisser Région vers l’étagère Lignes et placez-le à gauche de l’onglet Somme(Ventes). Nous remarquons que les machines dans le Sud affichent un profit négatif global plus élevé que dans vos autres régions.
  4. Donnons maintenant un nom à la feuille. Dans le coin inférieur gauche de l’espace de travail, double-cliquez sur Feuille 1 et tapez Ventes par Produit et Région.
  5. Afin de préserver la vue, Tableau nous permet de dupliquer notre feuille de calcul afin que nous puissions continuer dans une autre feuille là où nous en étions.
  6. Dans votre classeur, cliquez avec le bouton droit sur la feuille Ventes par Produit et Région et sélectionnez Dupliquer et renommez la feuille dupliquée en Ventes-Sud.
  7. Dans la nouvelle feuille de calcul, à partir des Dimensions, faites glisser Région vers l’étagère Filtres pour l’ajouter en tant que filtre dans la vue.
  8. Dans la boîte de dialogue Filtre Région, effacez toutes les cases à cocher sauf Sud, puis cliquez sur OK. Nous pouvons maintenant nous concentrer sur les ventes et le profit dans le Sud. Nous constatons que les ventes de machines avaient un profit négatif en 2014 et à nouveau en 2016. Nous en examinerons la raison dans la prochaine section.
  9. Enfin, n’oubliez pas de sauvegarder vos résultats en sélectionnant Fichier > Enregistrer sous. Nommons notre classeur Ventes et Bénéfices régionaux.

Hands On

4. Aperçu cartographique

Créer un aperçu cartographique

Les aperçus cartographiques sont utiles lorsque nous examinons des données géographiques (champ région). Dans l’exemple actuel, Tableau reconnaît automatiquement que les champs pays, État, ville et code postal contiennent des informations géographiques.

Étapes

  1. Créer une nouvelle feuille.
  2. Ajouter État et Pays sous la zone des données à Détail sur la carte des marques. Nous obtenons l’aperçu cartographique.
  3. Glisser Région sur le tablier des Filtres, puis filtrer jusqu’à Sud uniquement. L’aperçu cartographique est maintenant réduit à la région du Sud seulement, et une marque représente chaque État.
  4. Glisser la mesure Ventes sur l’onglet Couleur sur la carte des marques. Nous obtenons une carte remplie dont les couleurs indiquent le volume de ventes dans chaque État.
  5. Nous pouvons modifier le schéma de couleurs en cliquant sur Couleur sur la carte des marques et en sélectionnant Editer les couleurs. Nous pouvons expérimenter avec les palettes disponibles.
  6. Nous observons que la Floride est la meilleure en termes de ventes. Si nous survolons la Floride, il est indiqué que les ventes s’élèvent à un total de 89 474 USD, par exemple, en comparaison avec la Caroline du Sud, qui n’a que 8 482 USD de ventes. Maintenant, essayons d’évaluer le rendement par le Bénéfice, car le Bénéfice est un meilleur indicateur que les ventes seules.
  7. Faites glisser Profit vers Couleur sur la carte des marques. Nous voyons maintenant que le Tennessee, la Caroline du Nord et la Floride ont un profit négatif, même si il semblait qu’ils se débrouillaient bien en ventes. Renommez la feuille en Carte de Profit

Pratique

Se plonger dans les Détails

Les cartes nous permettent de visualiser les données de manière large. Dans l’étape précédente, nous avons découvert que le Tennessee, la Caroline du Nord et la Floride avaient un profit négatif. Dans cette section, nous allons tracer un Diagramme à barres pour explorer la raison du profit négatif.

Étapes

  1. Dupliquez la feuille de calcul Carte de Profit et nommez-la Diagramme à Barres de Profit Négatif.

  2. Cliquez sur Montrez-Moi sur la feuille de calcul Diagramme à Barres de Profit Négatif. Montrez-Moi présente le nombre de façons dans lesquelles un graphique peut être tracé entre les éléments mentionnés dans la feuille de calcul. Dans Montrez-Moi, sélectionnez l’option de barre horizontale et la vue met à jour instantanément les barres verticales en horizontales.

  3. On peut sélectionner plusieurs barres à la fois en cliquant simplement et en faisant glisser le curseur dessus. Nous voulons nous concentrer uniquement sur les trois États, à savoir le Tennessee, la Caroline du Nord et la Floride. Par conséquent, nous sélectionnerons uniquement les barres qui leur correspondent.

    En savoir plus

    Création de hiérarchies
    Les hiérarchies sont pratiques lorsque l’on souhaite regrouper des champs similaires afin de pouvoir rapidement effectuer un zoom entre les niveaux dans la visualisation.

    1. Dans le volet Données, faites glisser un champ et déposez-le directement sur un autre champ ou faites un clic droit sur le champ et sélectionnez
    2. Faites glisser les champs supplémentaires dans la hiérarchie. Les champs peuvent également être réorganisés dans la hiérarchie en les faisant simplement glisser vers une nouvelle position. Dans la visualisation actuelle, nous créons les hiérarchies suivantes : Lieu, Commande et Produit.
  4. Cliquez sur l’icône en forme de plus sur le champ État dans le Palier des lignes pour descendre au niveau Ville.

    1. Il y a beaucoup de données. Nous pouvons utiliser Filtre N pour filtrer et révéler les moins bons performeurs. Pour cela, faites glisser Ville du volet Données vers l’étage des filtres. Cliquez sur Par champ, puis cliquez sur la liste déroulante Top et sélectionnez Bas pour révéler les moins bons performeurs. Tapez 5 dans la zone de texte pour afficher les 5 derniers performeurs du jeu de données.

Nous observons maintenant que Jacksonville et Miami, en Floride ; Burlington, en Caroline du Nord ; et Knoxville et Memphis, au Tennessee sont les villes les moins performantes en termes de profit. Il y a une autre marque dans la vue – Jacksonville, en Caroline du Nord – qui ne devrait pas être ici car elle présente des ventes rentables. Cela signifie qu’il y a un problème avec le filtre que nous avons appliqué. Nous ferons appel à l’ordre des opérations de Tableau.

  1. Sur l’étagère des Filtres, faites un clic droit sur le jeu Inclusions (Pays, État) et sélectionnez Ajouter au Contexte. Nous constatons que maintenant Concord(Caroline du Nord) apparaît dans la vue tandis que Miami(Floride) a disparu. Cela a plus de sens maintenant.

  2. Mais Jacksonville (Caroline du Nord) est toujours présent ce qui est incorrect. Sur l’étagère des Lignes, cliquez sur l’icône en forme de plus sur l’onglet Ville pour descendre au niveau du Code Postal. Faites un clic droit sur le code postal pour Jacksonville, NC, 28540, puis sélectionnez Exclure pour exclure manuellement Jacksonville.

  3. Faites glisser le Code Postal de l’étagère des Lignes. C’est la vue finale.

À vous de jouer

Aperçus clés

Faisons maintenant ressortir uniquement les entités à perte, c’est-à-dire les Produits et identifions également les emplacements où ces produits sont vendus.

Étapes

  1. Faites glisser Sous-catégorie vers les Lignes pour descendre davantage.
  2. De même, faites glisser Profit vers Couleur sur la carte des Marques. Cela permet de repérer rapidement les produits avec un profit négatif.
  3. Faites un clic droit sur Date de commande et sélectionnez Afficher le filtre. Il semble que les Machines, les tables et les agrafieurs se débrouillent mal. Alors que devrions-nous faire ? Une solution serait de cesser la vente de ces produits à Jacksonville, Concord, Burlington, Knoxville et Memphis ? Vérifions si notre décision est la bonne.
  4. Retournons à l’onglet précédemment créé Carte des profits.
  5. Cliquez sur le champ Sous-catégorie pour sélectionner l’option Afficher le filtre
  6. .Faites glisser Profit situé sous Mesures vers la carte des marques Étiquette
  7. .Cliquez de nouveau sur Date de commande et sélectionnez Afficher le filtre. Dans le filtre, nous allons enlever les éléments qui, selon nous, contribuent à un profit négatif. Désactivez donc les cases devant les rubriques Outils de liement, Machines et Tables respectivement. Il ne reste alors que les entités générant du profit. Cela montre que les entités comme les outils de liement, les machines et les tables étaient effectivement des sources de pertes dans certaines régions, et que nous avions raison dans nos constatations.

À vous de jouer

5. Tableau de bord

Un tableau de bord est une collection de plusieurs vues, permettant de comparer diverses données simultanément.

Création d’un tableau de bord

Étapes

  1. Cliquez sur le bouton Nouveau tableau de bord
  2. .Faites glisser Ventes dans le Sud vers le tableau de bord vide
  3. .Faites glisser Carte des profits vers le tableau de bord et déposez-la par-dessus la vue Ventes dans le Sud. Les deux vues sont visibles en même temps. Pour présenter les données de manière à ce que les autres puissent les comprendre, nous pouvons organiser le tableau de bord à notre goût.
  4. Sur la feuille de travail Ventes Sud dans la vue tableau de bord, cliquez sous Région et retirez Afficher l'en-tête. Répétez le même processus pour tous les autres en-têtes. Cela permet de mettre en évidence uniquement ce qui est nécessaire et de masquer les informations moins importantes.
  5. Sur la Carte des Bénéfices, cachez également le titre et répétez les mêmes étapes pour la carte Ventes Sud.
  6. Nous pouvons voir que la carte du Sous-Catégorie et de l’Année de la Date de Commande sont répétées sur le côté droit. Faisons disparaître l’excès en les croisant simplement. Ensuite, cliquez sur Année de la Date de Commande. Une flèche descendant apparaît et sélectionnez l’option Valeur unique (Curseur). Laissez la magie se dérouler. Expérimentez en choisissant différentes années sur le curseur et les ventes varient également.
  7. Faites glisser le filtre SUM(Profit) vers le bas du tableau de bord en-dessous des ventes dans le Sud pour une meilleure vue.

Maintenance

Ajout d’interactivité

Pour rendre le tableau de bord plus interactif, comme voir quelles sous-catégories sont bénéfiques dans lesquels États, il faut faire quelques modifications.

Étapes

  1. Commencez par la Carte des Bénéfices. Lorsque vous cliquez sur la carte, une icône Utiliser comme filtre apparaît en haut à droite. Cliquez sur elle. Si vous sélectionnez n’importe quelle carte, les ventes correspondantes à cet État seront mises en évidence sur la carte Ventes Sud.
  2. Pour l’Année de la Date de Commande, cliquez sur l’option de menu déroulant et allez à Appliquer aux Feuilles de Calcul > Feuilles de Calcul Sélectionnées. Une boîte de dialogue s’ouvre. Sélectionnez l’option Tout suivi de OK. Quelle est l’option ? Elle applique les filtres à toutes les feuilles de calcul utilisant la même source de données.
  3. Explorez et expérimentez. Dans la visualisation ci-dessous, nous pouvons filtrer la carte Ventes Sud pour afficher uniquement les produits vendus en Caroline du Nord. Nous pouvons ensuite explorer facilement les profits annuels.
  4. Renommez le Tableau de bord en Ventes Régionales et Profits.

Pratique

En conséquence, la vente de machines en Caroline du Nord n’a apporté aucun profit à l’entreprise.

6. Histoire

Un tableau de bord est une fonctionnalité intéressante, mais Tableau offre également la possibilité de présenter nos résultats en mode présentation sous forme d’histoires sur lesquelles nous discuterons dans cette section.

Construire une Histoire

Étapes

  1. Cliquez sur le bouton Nouvelle histoire.
  2. Dans le volet Histoire situé sur la gauche, faites glisser le classeur Ventes dans le Sud (créé plus tôt) sur la vue.
  3. Modifiez le texte dans la boîte grise située au-dessus du classeur. C’est la légende. Nommez-la Ventes et profits par année.
  4. Les histoires sont assez spécifiques. Ici, nous raconterons l’histoire de la vente de machines en Caroline du Nord. Dans le volet Histoire, cliquez sur Dupliquer pour dupliquer la première légende, ou vous pouvez même en créer une nouvelle.
  5. Dans la Sous-catégorie, filtrez select uniquement Machines. Cela aide à évaluer les ventes et les profits des machines par année.
  6. Renommez la légende en Ventes et profits des machines par année.

Pratique

Faire une Conclusion

Il est clair que les machines en Caroline du Nord entraînent une perte de bénéfices. Cependant, cela ne peut être démontré en examinant le bénéfice et les ventes globales. Pour cela, nous avons besoin de bénéfices régionaux.

Étapes

  1. Dans la zone d’histoire, sélectionnez Vide. Glissez le tableau de bord déjà créé Ventes et bénéfices régionaux sur le canevas.
  2. Décrivez-le comme Produits performants faiblement en Caroline du Sud.
  3. Sélectionnez Dupliquer pour créer un autre point d’histoire avec le tableau de bord des bénéfices régionaux. Sélectionnez la Caroline du Nord sur le graphique en barre car nous nous intéressons à en montrer davantage.
  4. Sélectionnez toutes les années.
  5. Ajoutez une légende pour clarifier, comme Bénéfice en Caroline du Nord : 2013-2016.
  6. Sélectionnez une année comme 2014. Ajoutez une légende, par exemple, Bénéfice en Caroline du Nord : 2014 et cliquez ensuite sur l’onglet Dupliquer. Répétez l’étape pour toutes les années restantes.
  7. Cliquez sur le mode présentation et laissez l’histoire se dérouler.

Hands On

Maintenant, nous avons une idée de ce que les produits ont été introduits sur le marché de la Caroline du Nord quand et comment ils ont performé. Non seulement avons-nous identifié une manière de traiter le bénéfice négatif, mais nous avons également réussi à le soutenir avec des données. C’est l’avantage des histoires dans Tableau.

7. L’intégration de Tableau avec R, Python & SQL

Mis à part les divers avantages de visualisation qu’offre Tableau, il possède également des capacités de connexion incroyables prêtes à l’emploi. Tableau peut facilement s’intégrer avec des langages comme Python et R et même avec des SGBD comme SQL. Cela offre des avantages accrus en termes de fonctionnalités et est pratique pour les Data Scientists habitués à travailler en Python ou R. Ils peuvent directement importer les scripts R et Python dans Tableau et tirer parti de ses visualisations qui sont bien supérieures à celles de ces langages. De plus, les capacités de visualisation de Tableau sont faciles à utiliser et très intuitives, ce qui permet de gagner beaucoup de temps pour les Data Scientists.

Dans cette section, nous verrons comment nous pouvons connecter Tableau à ces sources externes et les avantages de ces connexions.

Tableau et R

R est un langage statistique populaire utilisé pour effectuer des analyses prédictives sophistiquées, telles que la modélisation linéaire et non linéaire, les tests statistiques, l’analyse de séries temporelles, la classification, le clustering, etc.(Tableau 8.1 et R) Utiliser Tableau en conjonction avec R présente les avantages suivants:

  • Exploite la puissance statistique de Tableau en donnant à ses utilisateurs accès à des bibliothèques R sophistiquées pour obtenir des insights meilleurs et plus approfondis à partir des données.
  • Les options améliorées d’exploration de données de Tableau et sa capacité à se connecter à de multiples sources sont pratiques pour les utilisateurs de R.
  • De plus, cela permet également aux utilisateurs de Tableau de bénéficier de l’utilité du langage R sans avoir à le connaître réellement.

Comment Tableau s’intègre avec R?

Les fonctions et modèles R peuvent être utilisés dans Tableau en créant de nouveaux champs calculés qui invoquent dynamiquement le moteur R et passent des valeurs à R. Ces résultats sont ensuite renvoyés à Tableau pour être utilisés à des fins de visualisation.

Configuration de Tableau Desktop avec R

  • Téléchargez et installez Rserve.

Vous devrez télécharger et installer le paquet Rserve pour que Tableau puisse se connecter et utiliser les fonctions du script R. Dans la console R, entrez les commandes suivantes :

install.packages(“Rserve”) library(Rserve) Rserve() / Rserve(args = ‘ — no-save’)

Connectez Tableau au serveur R

Une fois que Rserve est installé avec succès, ouvrez Tableau Desktop et suivez les étapes mentionnées ci-dessous.

  1. Allez dans Aide > Paramètres et préférences et sélectionnez Gérer les connexions de services externes.

  2. Entrez le nom du serveur « Localhost » (ou « 127.0.0.1 ») et le port « 6311 ».

  3. Cliquez sur le bouton « Tester la connexion ». Vous devriez voir un message de succès. Cliquez sur OK pour fermer.

Commencez à utiliser les scripts R dans Tableau

Lorsque vous aurez réussi les étapes ci-dessus, vous pourrez créer de nouvelles champs calculés dans Tableau Desktop qui utilisent les fonctions SCRIPT_* pour appeler des fonctions R.

Allons-y et voyons comment nous pouvons utiliser les capacités de Tableau avec R.Nous utiliserons le jeu de données intégré Sample Superstore pour calculer le Profit en utilisant un script R et la fonctionnalité de glisser-déposer de Tableau. Nous comparerons ensuite les résultats des deux méthodes.

Étapes

  1. Ouvrez le fichier Tableau et connectez-vous aux données Sample Superstore.
  2. Connectez-vous à Rserve. Une fois que Tableau Desktop est connecté à Rserve, il peut invoquer le moteur R par l’intermédiaire des champs calculés.
  3. Nous allons maintenant créer un champ calculé appelé Expected Profit.

    Quatre fonctions sont disponibles pour l’utilisation avec R, et elles commencent toutes par la même suite de caractères script. Les fonctions sont :

    • SCRIPT_REAL: retourne des nombres réels comme résultats
    • SCRIPT_STR: retourne une chaîne de caractères
    • SCRIPT_INT : retourne des entiers
    • SCRIPT_BOOL: retourne des booléens
    • Pour cet exemple, nous allons utiliser la fonction SCRIPT_REAL. Nous allons créer une simple régression linéaire dans Tableau.
  4. Ouvrez le champ calculé et insérez le script suivant.

    SCRIPT_REAL("fit <- lm(.arg1 ~ .arg2 + .arg3 + .arg4) fit$fitted ", SUM([Profit]), AVG([Ventes]), AVG([Quantité]), AVG([Remise]))

    Le script ci-dessus concerne le modèle de régression linéaire dans R. Ce modèle aura une variable dépendante(arg1) et trois variables indépendantes(arg2, arg3, arg4). Ces arguments sont des placeholders, et lorsque le script est transmis à R, les arguments seront remplacés par les colonnes de tableau auxquelles ils correspondent. 5. Saisissez les champs Tableau qui correspondent à chacune des variables. La variable dépendante ici est le profit, donc nous mettrons SUM(Profit) en premier puisque cela correspond à l’argument 1. De même, nous utiliserons respectivement prix unitaire moyen, quantité moyenne des commandes et remise moyenne pour les trois autres arguments.

  5. Ces entrées seront maintenant toutes tirées dans le modèle pour déterminer les niveaux de bénéfice prévus. Nous sommes maintenant prêts à utiliser cette calcul dans les visualisations Tableau. Glissez la catégorie sur les rangées, puis Profit sur les colonnes. Maintenant, glissez Expected Profit sur les colonnes.

  6. Nous pouvons maintenant analyser le modèle pour voir comment le rendement prévu calculé en R compare aux bénéfices réels. Nous pouvons aller plus loin en tirant des segments de clients sur les couleurs, et maintenant nous avons créé un graphique en barres empilées qui peut également utiliser des dates ordonnées pour découper les données par années ou par trimestres.

Hands On

On pourrait se demander si toutes les calculs précédents pourraient avoir été effectués dans Tableau sans utiliser R. Alors, pourquoi devrions-nous passer par le processus de téléchargement et de configuration de Rserve dans Tableau et écrire des scripts? R est une langue puissante parce qu’elle permet de faire des prévisions en utilisant des bibliothèques largement utilisées contenant des algorithmes bien connus. Imaginez combien cela serait agréable de faire des prévisions pour notre entreprise dans Tableau, en appelant un simple script R et puis de pouvoir l’intégrer dans les visualisations de Tableau.

Tableau et Python

Python est un langage de programmation polyvalent largement utilisé. Python offre un grand nombre de bibliothèques pour effectuer des analyses statistiques, des modèles prédictifs ou l’apprentissage automatique. Connecter Tableau à Python est l’une des meilleures approches pour l’analyse prédictive. Tabpy est un package développé pour cela. Pour permettre à Tableau de tirer parti de Python, il peut être connecté au serveur TabPy pour exécuter du code Python à la volée et afficher les résultats sous forme de visualisations.

Comment Tableau s’intègre-t-il à Python ?

Lorsque nous utilisons TabPy avec Tableau, nous pouvons définir des champs calculés en Python, ce qui permet de tirer parti du grand nombre de bibliothèques d’apprentissage automatique directement depuis nos visualisations.

Configuration de Tableau Desktop avec Python

Téléchargez et installez Tabpy.

Exécuter un code Python à l’intérieur d’un classeur Tableau nécessite un serveur Python pour l’exécuter. Le framework TabPy est celui qui fait le travail. Téléchargez TabPy à partir de Github à l’adresse suivante. Sinon, vous pouvez suivre les étapes ci-dessous :

conda install -c anaconda tabpy-server

Ensuite, cd vers le répertoire contenant le serveur tabpy téléchargé et exécutez-le.

python setp.py

Connexion de Tableau à TabPy

L’étape suivante consiste à connecter Tableau à TabPy. Cela peut être fait en allant dans Aide > Paramètres et performances > Gérer la connexion aux services externes :

Testez la connexion. Si tout se passe bien, vous devriez voir apparaître un message de succès de connexion.

Commencez à utiliser les scripts Python dans Tableau.

L’intégration de Python dans Tableau est une fonctionnalité très utile. Envisagez par exemple le problème d’analyse des sentiments. Il s’agit d’un problème courant dans la communauté de la machine à apprentissage et peut être réalisé par plusieurs algorithmes d’apprentissage automatique. Cependant, en utilisant une combinaison de Tableau et de Python, le même résultat peut être obtenu en quelques lignes de code Python. Les résultats peuvent ensuite être visualisés dans Tableau pour obtenir de plus amples informations. Voyons cela par un exemple(Utilisez les puissances de Python dans Tableau avec TabPy)

Analyse des sentiments avec Tabpy

Nous utiliserons le jeu de données des avis sur les téléphones portables, qui peut être téléchargé de ici.

Étapes :

  1. Importer le jeu de données dans Tableau Desktop
  2. Se connecter à Tabpy. Une fois que Tableau Desktop est connecté à Tabpy, il peut invoquer le moteur Python à travers des champs calculés.
  3. Nous allons maintenant créer un champ calculé appelé Sentiment comme suit : `

    SCRIPT_REAL("from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer vs = [] analyzer = SentimentIntensityAnalyzer() for i in range(0,len(_arg1)): a = analyzer.polarity_scores(_arg1[i])['compound'] vs.append(a) return vs",ATTR([Reviews]))`

    Nous utilisons ici l’outil analyse de sentiment VADER. C’est un outil d’analyse de sentiment basé sur un lexique et des règles qui est spécifiquement adapté aux sentiments exprimés sur les réseaux sociaux. Pour utiliser cet outil, vous devez d’abord l’installer. Veuillez en lire plus sur leur page github.

  4. Maintenant, glissez Reviews sur les colonnes et Sentiment sur la carte Text and Color Marks card et voyez la magie se produire. Nous effectuons l’analyse de sentiment de l’avis sans aucun problème. De plus, il devient super facile de visualiser les résultats également. Les avis positifs sont dans un ordre croissant de vert tandis que les négatifs sont en rouge.

Cet exemple montre clairement la puissance offerte par l’intégration de Tableau avec Python. En disposant des scores de Sentiment à notre disposition, nous pouvons travailler avec celui-ci pour explorer plus profondément les détails. Par exemple, en tant que propriétaire d’entreprise, je peux filtrer les avis négatifs et m’attarder à la cause en question. Je peux également filtrer les avis positifs pour avoir une idée des produits qui font du bien aux consommateurs.

Tableau et SQL Server

Il y a une valeur cachée dans nos données Microsoft SQL Server qui se trouve enfouie sous les rapports standards et les outils de BI complexes. Tableau permet de dégager des insights partout en dotant n’importe qui d’outils de visualisation sophistiqués pour analyser les données de SQL Server. Nous pouvons connecter Tableau à SQL Server en direct pour des requêtes spécifiques au plateforme, ou directement importer les données dans l’engin d’analyse de Tableau pour décharger la base de données.

Tableau fournit un connecteur optimisé et en direct vers SQL Server, ce qui nous permet de créer des graphiques, des rapports et des tableaux de bord tout en travaillant directement avec nos données. En approfondissant notre analyse, Tableau reconnaît le schéma utilisé dans SQL Server, nous n’ayons donc pas à manipuler notre donnée.

Allons-y sur un exemple montrant comment connecter une base de données SQL Server à Tableau Desktop et l’utiliser pour créer des visualisations.

Étapes :

  1. Se connecter au serveur SQL
  2. Ouvrir Tableau Desktop et sous Servers, connecter à MS SQL.
  3. Collez le nom du serveur dans la boîte de dialogue qui s’ouvre et cliquez sur Ok. Cela connecte Tableau à SQL Server. Sélectionnez la base de données de votre choix. Dans cet exemple, nous sélectionnons salesDB. Vous pouvez ensuite sélectionner n’importe quelle TABLE de la liste, par exemple, Sales Log. La table est importée dans l’environnement Tableau. Maintenant, vous pouvez choisir d’extraire toutes les données ou une partie de celles-ci vers une nouvelle feuille. Vous pouvez même spécifier le nombre de lignes à extraire.
  4. Dans la nouvelle feuille, vous avez les données extraites de MS SQL. Depuis là, vous pouvez travailler avec elles comme avec n’importe quelle feuille de Tableau.

Hands On :

C’est ainsi que nous pouvons facilement connecter SQL Server à Tableau et extraire les données directement dedans. Tableau permet aux utilisateurs de basculer les connexions en un clic pour appliquer des requêtes en mémoire à un jeu de données plus grand.

8. Enregistrer le travail

Tableau Desktop

Pour enregistrer un rapport Tableau localement, sélectionnez Fichier > Enregistrer. Spécifiez le nom du fichier de rapport dans la boîte de dialogue Enregistrer sous. Tableau enregistre par défaut le fichier avec l’extension .twb.

Tableau Public

Avec Tableau Public, toutes les vues et les données sont publiées et n’importe qui sur internet peut y accéder. Sélectionnez Serveur > Tableau Public > Enregistrer sur Tableau Public et entrez les informations d’identification.

Tableau Server

In cas où les données sont confidentielles et que l’histoire doit être partagée avec toute l’équipe, le Tableau Server est très utile. Pour publier une histoire sur Tableau Server, sélectionnez Sélectionnez Serveur > Publier un classeur ou cliquez sur Partager dans la barre d’outils. Mais assurez-vous d’abord de créer un compte.

Conclusion

C’est tout ce que nous avons besoin pour créer une bonne visualisation dans Tableau, bien que certains puissent trouver qu’il faut faire beaucoup plus de révisions à chaque étape que ce que nous avons fait ici. Donc, avec l’expérimentation et la pratique, Tableau devient beaucoup plus familier et dévoilera des fonctionnalités étonnantes pour nous aider à analyser et présenter des données. Veuillez laisser un commentaire en bas si vous avez des demandes ou des questions, et bonne visualisation.

Consultez notre Tutoriel de création de visualisations Tableau à l’aide du jeu de données AirBnB.

Source:
https://www.datacamp.com/tutorial/data-visualisation-tableau