Tableauによるデータ可視化

私たちデータアナリストの目指すゴールは、データの洞察を誰もが理解し、その意味や行動方法を明確に把握できるように整理することです。

Tableauは、現在業界で広く使用されているデータアナリティクスと視覚化ツールです。多くの企業は、データサイエンス関連の作業には欠かせないと考えています。Tableauの使い易さは、ドラッグアンドドロップインターフェースを持っていることに由来します。この機能は、並べ替え、比較、分析などの作業を非常に簡単かつ迅速に行うことを可能にします。また、TableauはExcel、SQL Server、クラウドベースのデータリポジトリなど複数のソースと互換性を持っているため、データサイエンティストにとっては優れた選択肢です。

1. Tableau入門

概要

Tableau Softwareは、ワシントン州シアトルに拠点を持つソフトウェア会社で、ビジネスインテリジェンスに重点を置いたインタラクティブなデータ視覚化製品を生み出しています。Tableauは1997年から2002年の間にスタンフォード大学のコンピュータサイエンス学科で設立されました(ウィキペディア)

Tableauが提供する主要な製品は以下の通りです。

Tableau Desktop、Tableau Public、Tableau Online。これらすべてはデータ視覚化の作成ができ、選択は作業の種類によって異なります。

インストール

製品の選択に基づいて、ソフトウェアをコンピュータにダウンロードします。ライセンス契約に同意した後、Tableauのアイコンをクリックしてインストールを確認することができます。以下の画面が表示されたら、すべては問題ありません。

2. はじめに

このセクションでは、Tableauのインターフェースに慣れるために、Tableauでのいくつかの基本操作を学びます。

Tableauのワークスペース

Tableauのワークスペースは、ワークシート、メニューバー、ツールバー、マークカード、シェルフなどの要素を含むコレクションです。これらについては、後のセクションで学びます。シートはワークシート、ダッシュボード、ストーリーになります。下の画像はワークスペースの主要なコンポーネントを強調表示しています。しかし、実際のデータを扱うことで、より熟悉することができます。

source:Tableau.com

データソースへの接続

Tableauでの作業を開始するには、Tableauをデータソースに接続する必要があります。Tableauは多くのデータソースと互換性があります。Tableauがサポートするデータソースは、開始画面の左側に表示されます。よく使われるデータソースには、Excel、テキストファイル、関連データベース、サーバーなどがあります。クラウドデータベースソースにも接続できます。例えば、Google AnalyticsやAmazon Redshiftなどです。

Tableau Desktopの起動画面には、接続可能なデータソースが表示されています。これはTableauのバージョンにもよります。有料版ではより多くの可能性が提供されます。画面の左側には、接続パネルがあり、利用可能なソースがハイライト表示されています。最初にファイルタイプが表示され、その後、一般的なサーバータイプや最近接続したサーバーが表示されます。開くタブの下には、以前に作成したワークブックを開くことができます。また、Tableau Desktopはサンプルワークブックの下でいくつかのサンプルワークブックを提供しています。

実践

サンプル-Superstoreデータセットに接続する

私たちは、スーパーストアデータセットという名前のサンプルデータセットと共に作成します。これはTableauに予め载入されているものです。しかし、ここからファイルをダウンロードして、Excelデータ源に接続する方法を理解することができます。このデータは、スーパーストアの情報で、商品、売上、利益などが含まれています。私たちの目的は、データアナリストとして、この架空の会社の中で改善すべき重要な領域を分析します。

手順

  1. データをコンピュータからTableauワークスペースにインポートします。

  2. 「シート」タブの下に、Orders、People、Returnsの3つのシートが表示されます。しかし、私たちはOrdersデータに焦点を当てます。Ordersシートをダブルクリックして、スプレッドシートのように開かれます。

  3. データの最初の3行が少し異なっており、期待されるフォーマットではありません。ここで、データインタプリタを使用します。これは「シート」タブの下にあります。クリックすると、良く整形されたシートが表示されます。

Hands On

Creating a View

簡単なチャートを生成するから始めます。この節で、私たちはデータについて理解し、データについて質問して洞察を得ることにします。この節でおそらく遇える重要な用語がいくつかあります。

Dimension

Measures

Aggregation

Dimensionsは、名前や日付のような定性データです。デフォルトで、Tableauは定性または分类的な情報を含むデータをDimensionとして自動的に分类します。たとえば、テキストや日付の値を持つフィールドはそのように分类されます。これらのフィールドは通常、列ヘッダーとしてデータの行に表示され、Customer NameやOrder Dateのように列のヘッダーとして、表示される granularity を定義します。

Measuresは、定量の数値データです。デフォルトで、Tableauはこのようなデータを含むフィールドをMeasureとして扱います。たとえば、販売取引や利益のようなデータです。Measureとして分類されたデータは、与えられたDimensionに基づいて集積可能です。たとえば、地域ごとの総販売(Measure)です。

聚合は、売上の合計や総利益など、より高いカテゴリーに集計された行レベルのデータを指します。

Tableauは、自動的にメーカーと维度のフィールドを並べ替えます。しかし、異常な場合は、手動で変更することもできます。

手順

  1. ワークシートに移動します。表アクションワークスペースの左下にあるシート1のタブをクリックします。

  2. ワークシートに移動した後、データパネルの维度から注文日を列棚にドラッグします。

    注文日を列棚にドラッグすると、注文の各年の列がデータセットに作成されます。各列の下に「Abc」の指標が表示されていますが、これはテキストや数値、またはテキストデータをここにドラッグできることを示しています。しかし、売上をここに引きずると、 Crosstabが作成され、各年の売上の合計を示すことができます。

  3. 同様に、測定タブから売上フィールドを行棚にドラッグします。

Tableau は、売上を合計として集計したチャートを表示します。各年の注文日別の総集計売上が表示されます。Tableau は、この例では注文日となる時間フィールドを含むビューに常に折れ線グラフを表示します

実践

上記の折れ線グラフはどんな情報を伝えていますか? それは、売上が見込められ、時間とともに成長する傾向があることを示しています。これは価値ある洞察ですが、売上の成長に寄与している製品についてはあまり語りません。さらに洞察を深めましょう。

ビューの改善

さらに深い洞察を得るために、どの製品がより多くの売上を促進するかを探ることにしましょう。まずは、製品カテゴリーを追加して、別の方法で売上総額を見ます。

手順

  1. Categoryはディメンションペインにあります。それを列棚にドラッグして、YEAR(Order Date)の隣に配置します。CategoryYearの右側に配置する必要があります。そうすることで、ビューはすぐにラインから棒グラフタイプに変わります。このチャートは、年ごとの各Productの総Salesを示します。

    Learn More

    ビュー内の各データポイント(マーク)に関する情報を表示するには、バーの1つにカーソルを合わせてツールチップを表示します。ツールチップはそのカテゴリの総売上を表示します。こちらは2016年のオフィス用品カテゴリのツールチップです:

    ビューにラベルを追加するには、ツールバーのShow Mark Labelsをクリックします。

    棒グラフは縦ではなく横に表示することもできます。ツールバーのSwapをクリックします。

 2. 上の表示は、家具、オフィス用品、技術などのカテゴリーによる売上を素晴らしく示しています。2016年以外で、家具の売上がオフィス用品の売上より速く成長していることも明らかにしています。したがって、家具に対する売上努力を取り組むのが賢明であると推測できます。しかし、家具は大きなカテゴリーで、多くの異なるアイテムを含んでいます。どの家具アイテムが最も多い売上を作成しているのかを特定するためには何をすればよいでしょうか?

この質問に答えるために、私たちはサブカテゴリーによって商品を見ます。どのアイテムが売上が良いかを知りたいのです。例えば、家俱カテゴリーの本棚、椅子、装飾品、テーブルの詳細を見たいとします。サブカテゴリー要素を列の棚にダブルクリックまたはドラッグします。

サブカテゴリーは別の離散フィールドです。これはカテゴリーをより詳細に分割し、カテゴリーと年によってサブカテゴリーに対する棒グラフを表示します。しかし、これは視覚的に理解するのには多大な量のデータです。次のセクションで、フィルター、色、その他の方法について学び、表示をより理解可能にするために進めます。

実践編

3. 結果の強調

このセクションでは、特定の結果に焦点を当てることを試みます。フィルターや色は、私たちが興味を持っている詳細により多くの焦点を加える方法です。

ビューにフィルターを追加

フィルターは、ビューに値を含めたり除外したりするために使用できます。ここでは、ワークシートに2つの単純なフィルターを追加して、特定の年のサブカテゴリー別商品販売をより簡単に見ることができます。

手順

データパネルの「次元」で、注文日を右クリックし、「フィルターを表示」を選択します。サブ->カテゴリーフィールドについても同様に実行します。

フィルターはカードの種類であり、ワークシート上で簡単にドラッグアンドドロップして移動できます

ビューに色を追加

色は、パターンの視覚的な認識に役立ちます。

手順

データパネルの「測定」で、利益をマークカードの「色」にドラッグします。

本棚、テーブル、そして機械が利益のマイナス、つまり損失に寄与していることがわかります。強力な洞察です。

実践編

主要な発見

フィルターをより詳しく見て、損益の悪い製品についてより多くを理解しましょう。

手順

  1. ビューにおいて、サブカテゴリーのフィルターカードで、本棚テーブル機械を除くすべてのチェックボックスを外す。これにより興味深い事実が明らかになる。一部の年には、本棚と機械は実際に利益を生んでいた。しかし、2016年には機械が利益を生まなくなった。
  2. サブカテゴリーのフィルターカードですべてを選択して、再びすべてのサブカテゴリーを表示する。
  3. ディメンションから、地域の棚にドラッグし、Sum(売上)のタブの左側に配置する。これにより、南地域の機械は他の地域より全体でより大きな負の利益を報告していることに気付く。
  4. スプレッドシートに名前を付けましょう。ワークスペースの左下隅でシート1をダブルクリックし、商品と地域別売上と入力します。
  5. ビューを保持するために、Tableauではワークシートを複製でき、別のシートで処理を続けることができます。
  6. ワークブックで、商品と地域別売上シートを右クリックし、複製を選択し、複製されたシートの名前を売上-南に変更します。
  7. 新しいワークシートで、ディメンションから地域フィルターの棚にドラッグして、ビューにフィルターとして追加します。
  8. 「フィルター 地域」ダイアログボックスで、南以外のすべてのチェックボックスをクリアし、OKをクリックします。これで、地域の売上と利益に集中できます。機械の売上は2014年と2016年にどちらも負の利益を示していることが分かります。次のセクションでこれを調査します。
  9. 最後に、ファイル > 名前を付けて保存を選択して結果を保存することを忘れずに。ワークブックを地域販売と利益という名前にしてください。

実践

4. 地図ビュー

地図ビューの作成

地図ビューは、地理データ(地域フィールド)を見る時に便利です。現在の例では、Tableauが自動的に国、州、市、郵便番号のフィールドに地理情報が含まれていることを認識します。

手順

  1. 新しいワークシートを作成します。
  2. データパネルの下のをマークカードの詳細に追加します。これで地図ビューが得られます。
  3. 地域フィルターの棚にドラッグし、だけに絞り込みます。地図ビューは南地域だけをズームインし、各州を表すマークが表示されます。
  4. 販売の測定をマークカードのタブにドラッグします。これで各州の販売範囲を示す色付きの地図が得られます。
  5. マークカードのをクリックし、色の編集を選択することで色スキームを変更できます。利用可能なパレットを試すことができます。
  6. フロリダは販売に関して最も良くて、例えばサウスカロライナに比べて、89,474米ドルの販売総額が表示されます。利益も見ることで、単なる売上と比べてより良い指標となるでしょう。
  7. 利益マークカード上でドラッグします。今度は、テネシー、ノースカロライナ、およびフロリダが利益的ではなく、売上が良かったと感じられていたにも関わらず、利益が負の値であることがわかります。

手顺

詳細を掘り下げる

地図は、私たちがデータを広く可视化するためのツールです。最後のステップで、テネシー、ノースカロライナ、およびフロリダが利益を持っていないことを発見しました。このセクションでは、利益がない理由を探るための棒グラフを描くことにします。

手順

  1. 「利益地図」のワークシートを Duplicate し、「负の利益バーグラフ」と名付けます。

  2. 「负の利益バーグラフ」のワークシート上で表示をクリックします。表示は、ワークシートにある項目の間でグラフを描画する方法の数を提供します。表示から水平棒の選択肢を選択し、すぐに垂直棒から水平棒に変更されます。

  3. 一度クリックして drag することで、一度に複数のバーを選択することができます。私たちは3つの州だけ、すなわちテネシー、ノースカロライナ、およびフロリダに焦点を当てたいので、それらに対応するバーだけを選択します。

    詳しくはこちら

    階層の作成
    階層を使うと、似たようなフィールドをグルーピングし、視覚化内で階層間を迅速に Drill down することができます。

    1. データ画面で、フィールドをドラッグして、他のフィールドの上に Drop したり、右クリックして
    2. 「Drag additional fields into the hierarchy」を選択します。階層に追加するフィールドをドラッグして、新しい位置に移動させることで、階層内でフィールドの並び替えも可能です。現在の視覚化では、以下の階層を作成します:Location、Order、Product。
  4. 行棚にあるフィールドのプラスアイコンをクリックして、レベルにドリルダウンします。

    1. データは多いです。N-Filterを使用してフィルターをかけ、最も弱いパフォーマンスを揭示することができます。これには、データパネルからフィルター棚にドラッグします。Byフィールドをクリックし、次にTopドロップダウンをクリックし、Bottomを選択して最も弱いパフォーマンスを揭示します。テキストボックスに5を入力して、データセットの最も弱い5つのパフォーマンスを表示します。

ジャクソンビルとミアミ、フロリダ州;バーモントン、ノースカロライナ州;そしてテネシー州のクnoxビルとメンフィスは、利益に基づいて最もパフォーマンスの悪い都市です。ビューには他にもマークがありますが、ジャクソンビル、ノースカロライナ州は利益のある販売を持っているため、ここには属していません。これは適用したフィルターに問題があることを意味します。Tableauの操作の順序を参照するために助けを求めます。

  1. フィルターシェルフで、Inclusions (Country, State) セットを右クリックし、コンテキストに追加を選択します。今やコンコード(ノースカロライナ州)がビューに表示されている一方、ミアミ(フロリダ州)は消えてしまいました。これは今では意味があります。

  2. しかし、ジャクソンビル (ノースカロライナ州)はまだ表示されており、これは間違っています。行シェルフで、都市タブのプラス形のアイコンをクリックして、郵便番号レベルまで展開します。ジャクソンビル、NCの郵便番号28540を右クリックし、手動でジャクソンビルを除外するために除外を選択します。

  3. 行(Rows)の棚から郵便番号をドラッグします。これが最終的な表示です。

実践

主要な見出し

損失をしているエンティティ、つまり商品にのみ注目し、そういった商品が売られている場所を特定しましょう。

手順

  1. サブカテゴリを行(Rows)にドラッグしてさらに階層化します。
  2. 同様に、利益をマークス・カードのにドラッグします。これにより、利益がマイナスの商品を迅速に発見することができます。
  3. 注文日を右クリックし、フィルターを表示を選択します。機械、テーブル、そしてバインダーの性能が悪いようです。では、これらの商品のジャクソンビル、コンコード、バーレンチ、ノックスビル、メンフィスでの販売を中止すべきか? 決定が正しいかを検証しましょう。
  4. 先に作成した利益地図のシートタブに戻ります。
  5. コード>サブカテゴリフィールドをクリックしてフィルター表示オプションを選択します。
  6. 利益計測の下からラベルマークカードにドラッグします。
  7. 再度、注文日をクリックしてフィルター表示を選択します。フィルターから、負の利益に寄与していると思われるアイテムを消去します。まず、ビンダー、マシン、テーブルの前のチェックボックスをそれぞれ外します。これで利益を出すエンティティだけが残ります。これは、ビンダー、マシン、テーブルのようなエンティティが実際には一部地域で損失をしていることを示し、私たちの調査が正しいことを示しています。

実践

5. ダッシュボード

ダッシュボードは、いくつかのビューが集まったもので、さまざまなデータを同時に比較することができます。

ダッシュボードの作成

手順

  1. 新しいダッシュボードボタンをクリックします。
  2. 南の売上を空のダッシュボードにドラッグします。
  3. 利益地図をダッシュボードにドラッグし、南の売上ビューの上にドロップします。両方のビューを一度に見ることができます。他人がデータを理解するように表示するために、ダッシュボードを好みに合わせて編集することができます。
  4. ダッシュボードビューの南の売上ワークシートで、地域の下をクリックしてヘッダー表示を消去します。他のすべてのヘッダーについて同じプロセスを繰り返します。これにより、必要なものだけを強調し、重要でない情報を隠すことができます。
  5. 利益地図でタイトルも非表示にし、南の売上地図に同じ手順を行います。
  6. 右側にサブカテゴリーのフィルターカードと注文日の年が繰り返されていることがわかります。余分なものを単純に線で消去して除外しましょう。最後に、注文日の年をクリックします。ドロップダウン矢印が表示され、単一値(スライダー)のオプションを選択します。今、魔法が解けます。スライダーで異なる年を選び、売上もそれに応じて変わります。
  7. 利益合計のフィルターを、南の売上の下のダッシュボードの下部にドラッグして、より良いビューを得ます。

実際に手を動かして

インタラクティビュティを追加する

どの州でどのサブカテゴリーが利益を出しているかを見るように、ダッシュボードをよりインタラクティブにするために、いくつかの変更を行う必要があります。

手順

  1. 利益地図から始めましょう。地図をクリックすると、右上にフィルターとして使用のアイコンが表示されます。それをクリックします。地図を選択すると、南の売上地図に対応する州の売上がハイライト表示されます。
  2. 注文日の年のために、ドロップダウンオプションをクリックし、ワークシートに適用 > 選択されたワークシートに行きます。ダイアログボックスが開きます。すべてのオプションを選んでOKを押します。このオプションは何を行いますか?それは同じデータソースを持つすべてのワークシートにフィルターを適用します。
  3. 探求と実験をしてください。以下の視覚化において、Sales Southマップをフィルターにかけて、ノースカロライナーのみに売られている商品を表示することができます。そうすることで、年次の利益を簡単に探索することができます。
  4. デッシュボードをRegional Sales and Profitに変更してください。

Hands On

した結果、ノースカロライナーでの機械の売上は会社に利益をもたらしなかったことがわかります。

6. ストーリー

デッシュボードはすごい機能ですが、テーブルアウェアは私たちが結果をプレゼンテーションモードでストーリー形式で展示する機能も提供しています。それについてこの節で話します。

ストーリーの作成

手順

  1. 新しいストーリーボタンをクリックしてください。
  2. 左側のストーリーパインから、以前に作成したSales in the Southワークシートを表示領域にドラッグしてください。
  3. ワークシートの上の灰色のボックスのテキストを編集してください。これはキャプションです。Sales and profit by yearと名前を付けてください。
  4. ストーリーはとても特定のものです。ここではノースカロライナーでの機械の売上についてのストーリーを語ります。ストーリーパインをクリックしてDuplicateを押して最初のキャプションを複製します。また、新しいの作成することもできます。
  5. Sub-Categoryselectしてみて、Machinesだけを選択してください。これにより、年次に基づいて機械の売上と利益を測定することができます。
  6. キャプションをMachine sales and profit by yearに変更してください。

Hands On

結論を下すことができます。

北カリフォルニアの機械は利益の損失につながっています。しかし、全体の売上と利益を見るだけではこれを証明することはできません。これには地域の利益が必要です。

手順

  1. ストーリーペインで空白を選択します。既に作成したダッシュボード地域の売上と利益をキャンバスにドラッグします。
  2. 南の性能の低い商品というキャプションをつけます。
  3. 地域利益ダッシュボードを使って別のストーリーポイントを作成するために複製を選択します。北カリフォルニアに興味があるので、棒グラフで北カリフォルニアを選択します。
  4. 全ての年を選択します。
  5. 例えばNCの利益:2013-2016というように、明確なキャプションを追加します。
  6. 2014のようにどの年も選択し、NCの利益:2014というようなキャプションを追加してから、複製タブをクリックします。残りのすべての年について同じ手順を繰り返します。
  7. プレゼンテーションモードをクリックして、ストーリーを展開します。

実践

北カリフォルニア市場に何をどのように時系列で商品が導入され、どのように性能を発揮したかについてのアイデアがあります。负の利益に取り組む方法を特定するだけでなく、データに基づいてサポートすることも成功적に行いました。これがTableauのストーリー機能の利点です。

7. TableauとR、Python & SQLの統合

タベルには様々な視覚化の利点がありますが、それ以外にも素晴らしい既製の接続機能があります。タベルはPythonやRなどの言語、SQLのようなDBMSと簡単に統合できます。これは機能性に関する利点を提供し、PythonやRで作業を慣れているデータサイエンティストにとって便利です。彼らはタベルにRとPythonのスクリプトを直接インポートして、これらの言語よりもはるかに優れたタベルの視覚化を利用することができます。また、タベルの視覚化機能は使いやすく、直感的ですので、データサイエンティストには多くの時間を節約します。

このセクションでは、タベルをこれらの外部ソースと接続する方法とその接続の利点について見ていきます。

タベルとR

Rは、線形・非線形モデリング、統計テスト、時系列分析、分類、クラスタリングなどの高度な予測分析を行うために使われる人気のある統計的言語です。(タベル8.1とR) タベルとRを組み合わせて使用することは以下の利点があります:

  • タベルユーザーは、より深い洞察を得るために高度なRライブラリにアクセスすることで、タベルの統計的パワーを活用できます。
  • タベルの強化されたデータ探索オプションと複数のソースへの接続能力は、Rユーザーにとって便利です。
  • さらに、それは、R言語の有用性を享受することができるようにタベルユーザーをサポートし、言語を実際に知る必要はありません。

How does Tableau integrate with R?

Tableau は以下の方法で Rと統合されます。Rの関数とモデルは、Rエンジンを動的に呼び出し、値をRに渡す新しい計算済みフィールドを作成してTableau内で使用できます。これらの結果はTableauに戻され、視覚化のために使用されます。

Tableau Desktop に Rを設定する

  • Rserveをダウンロードしてインストールします。

TableauがRスクリプト機能を接続し利用するためには、Rserveパッケージをダウンロードしてインストールする必要があります。Rコンソールで以下のコマンドを入力します。

install.packages(“Rserve”) library(Rserve) Rserve() / Rserve(args = ‘ — no-save’)

Tableau に Rサーバーを接続する

Rserveが正常にインストールされた後、Tableau Desktopを開き、以下の手順に従います。

  1. ヘルプ > 設定とプリファレンスに行き、外部サービス接続の管理を選択します。

  2. サーバー名に“Localhost”(または“127.0.0.1”)を入力し、ポートを“6311”にします。

  3. “接続テスト”ボタンをクリックします。成功メッセージが表示されるはずです。閉じるにはOKをクリックします。

TableauでRスクリプトを使用する

上記の手順を完了すると、SCRIPT_*関数を使用してRの機能を呼び出す新しい計算フィールドをTableau Desktopに作成することができます。

テーブルを操作し、Rを使用した計算フィールドと、Tableauのドラッグアンドドロップ機能を使用した計算フィールドの利益を計算する方法を学びましょう。そして、結果を比較します。

手順

  1. Tableauワークブックを開き、サンプルスーパーストोーレットデータに接続します。
  2. Rserveに接続します。Tableau DesktopがRserveに接続されると、計算フィールドを通じてRエンジンを呼び出すことができます。
  3. 今回は、予測利益と呼ばれる計算フィールドを作成します。

    Rと使用できる4つの関数が利用できます。これらの関数はすべてscriptという文字列で始まります。これらの関数は以下の通りです。

    • SCRIPT_REAL: 実数を結果として返します。
    • SCRIPT_STR: 文字列を返します。
    • SCRIPT_INT : 整数を返します。
    • SCRIPT_BOOL: 論理値を返します。
    • この例では、SCRIPT_REAL関数を使用します。Tableauで簡単な線形回帰を作成します。
  4. 計算されたフィールドを開き、以下のスクリプトを插入します。

    SCRIPT_REAL("fit <- lm(.arg1 ~ .arg2 + .arg3 + .arg4) fit$fitted ", SUM([利益]), AVG([売上]), AVG([数量]), AVG([ディスカウント]))

    上記のスクリプトはRでの線形回帰モデルに関係する。このモデルは1つの依存変数(arg1)と3つの独立変数(arg2、arg3、arg4)を持つ。これらの引数は単なる場所を持つだけで、スクリプトがRに返信されると、それぞれに対応する表の列に置き換えられます。5. 各変数に対応する表のフィールドを入力してください。ここでの依存変数は利益で、それにはSUM(利益)を最初に入力します。同様に、他の3つの引数にはそれぞれ平均単価、平均注文数量および平均割引を使用します。

  5. これらの入力は今や予期される利益レベルを決定するモデルに引き込まれます。Tableauビジュアル化でこの計算を使用する準備ができました。カテゴリを行に、そしてProfitを列にドラッグします。次にExpected Profitを列にドラッグします。

  6. 私たちは、モデルを分析することで、Rで計算された予測利益と実際の利益との比較を見ることができます。また、顧客分层を色に持ってくることで、積み重ね棒グラフを作成し、年ごとまたは四半期ごとにデータを分割することができます。

Hands On

Rを使用しないでTableauでこれらの計算を行うことはできます。なぜ、RserveをTableauに下载し、設定し、スクリプトを書く手続きを通る必要があるのでしょうか。Rは、予測に強力な機能を持っており、よく使用されているライブラリに含まれている有名なアルゴリズムを簡単に利用することができます。テーブルアウトでビジネスの予測を行うために、簡単なRスクリプトを呼び出し、それをテーブルアウトの可视化に組み入れることができます。

TableauとPython

Pythonは幅広く使用される汎用のプログラミング言語です。Pythonは統計分析、予測モデリング、機械学習を行うための多くのライブラリを提供します。TableauとPythonを接続することは、予測分析に最適なアプローチの一つです。Tabpyは同様の目的で開発されたパッケージです。TableauがPythonの力を利用するために、TabPyサーバーに接続してPythonコードを即時実行し、視覚化として結果を表示させることができます。

TableauはどのようにPythonと統合されるのか?

TabPyをTableauで使用すると、Pythonで計算フィールドを定義することができ、視覚化から機械学習ライブラリの強大な力を活用することができます。

Tableau DesktopとPythonのセットアップ

Tabpyをダウンロードしてインストール。

Tableauワークブック内でPythonコードを実行するには、Pythonサーバーが必要です。TabPyフレームワークがこれを行います。TabPyを以下のリンクからGithubからダウンロードします。または、以下の手順に従います:

conda install -c anaconda tabpy-server

次に、ダウンロードしたtabpyサーバーを含むディレクトリにcdし、実行します。

python setp.py

TableauとTabPyの接続

次のステップは、TableauとTabPyを接続することです。これは、ヘルプ > 設定とパフォーマンス > 外部サービス接続の管理:に行って設定します。

接続をテストします。問題なく行けば、“接続成功”のメッセージが表示されます。

TableauでPythonスクリプトを使用し始める。

PythonとTableauの統合は非常に便利な機能です。たとえば、感情分析の問題に取り組むのは、機械学習コミュニティで一般的な問題で、様々な機械学習アルゴリズムを用いることで解決できます。しかし、TableauとPythonの組み合わせを使用することで、同じ結果が数行のPythonコードで得られるようになります。その後、Tableauで可視化することでより深い洞察が得られます。例を見てみましょう(PythonのパワーをTableauに活用するTabPyを使用して)

Tabpyを使用した感情分析

ここからダウンロードできるモバイルレビューのデータセットを使用します

手順:

  1. データセットをTableau Desktopにインポートする
  2. Tabpyに接続する。Tableau DesktopがTabpyに接続されると、計算フィールドを通じてPythonエンジンを呼び出すことができます。
  3. 以下に、名前がSentimentの計算フィールドを作成するための手順が記載されています:

    SCRIPT_REAL("from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer vs = [] analyzer = SentimentIntensityAnalyzer() for i in range(0,len(_arg1)): a = analyzer.polarity_scores(_arg1[i])['compound'] vs.append(a) return vs",ATTR([Reviews]))`

    ここでは、VADER 感情分析ツールを使用しています。これは、ソーシャルメディアで表される感情に特化した際引き合わせる際に最適化された言葉彙と規則に基づく感情分析ツールです。このツールを使用するには、まずインストールする必要があります。詳細については、彼らのGitHub ページを参照してください。

  4. 今度は、Reviewsを行の位置にドラッグし、Sentimentテキストと色のマークカードにドラッグしてみてください。魔術的なことが起こります。レビューの感情分析を簡単に行い、結果の可視化も非常に簡単になります。肯定的なレビューは緑色で昇順に、否定的なレビューは赤色で表示されます。

上の例は、TableauとPythonの統合によって提供される力量を明確に示しています。Sentimentスコアを手に入れることで、詳細に掘り下げることができます。たとえば、事業主としては、否定的なレビューをフィルターにかけ、その理由を考えることができます。また、肯定的なレビューに基づいて、消费者が幸せに感じる商品についての考えができます。

TableauとSQL Server

Microsoft SQL Serverのデータには、標準的なレポートや複雑なビジネスインテリジェントツールの背後に隠れた未知の価値があります。Tableauは、SQL Serverのデータに対する高度な可视化分析を行うことができるよう、任何人に機能を提供して、洞察をあらゆる場所に届けます。Tableauは、SQL Serverに対するライブの接続を提供し、データを直接的にTableauの分析エンジンに持ち込んで、データベースの負荷を軽減することができます。

Tableauは、SQL Serverに対する最適化されたライブコネクタを提供し、データを直接操作せずにチャート、レポート、ダッシュボードを作成することができます。分析を進めるにつれて、TableauはSQL Serverで使用されているスキーマを認識しますので、私たちはデータを操作する必要はありません。

SQL ServerデータベースをTableau Desktopに接続し、その後それを可视化に使用する方法を示す例を見てみましょう。

手順:

  1. SQL Serverにログインします。
  2. Tableau Desktopを開き、サーversにあるMS SQLに接続します。
  3. 開いたダイアログボックスにサーバー名を貼り付け、OKをクリックしてください。これにより、TableauをSQL Serverに接続します。選択したいデータベースを選択してください。この例では、salesDBを選択します。次に、TABLESの一覧から選択することもできます。たとえば、Sales Logを選択します。テーブルがTableau環境にインポートされます。その後、新しいワークシートにデータ全体またはその一部を抽出することができます。抽出する行数を指定することもできます。
  4. 新しいワークシートには、MS SQLから抽出したデータが含まれています。ここから、他のTableauワークシートと同様に操作することができます。

Hands On:

これは、SQL ServerをTableauに簡単に接続し、データを直接そこに抽出する方法です。Tableauは、使用者により、メモリ内のクエリを较大のデータセットに適用するために、接続を一つのクリックで切り替える機能を提供します。

8. 作業の保存

Tableau Desktop

Tableau ワークブックをローカルに保存するには、「ファイル」を選択し、「保存」をクリックします。保存場所ダイアログボックスで、ワークブックのファイル名を指定してください。Tableauはデフォルトで.twbエクステンションのファイルに保存します。

Tableau Public

Tableau Publicを使用すると、すべてのビューとデータが公開され、インターネット上のどのような人もアクセスできます。サーバーを選択し、Tableau Publicを選択し、Tableau Publicに保存するを選択し、認証情報を入力します。

Tableau Server

データが機密であり、ストーリーが整个のチームに共有される必要がある場合、Tableau Serverは便利です。Tableau Serverにストーリーを公開するには、選択してサーバー> ワークブックを公開 を選択したり、ツールバーの 共有 をクリックします。しかし、まずアカウントを作成することを忘れないでください。

結論

これでTableauで良い可视化を作成するためのすべてのことが完了しました。しかし、各段階で私たちが行ったように多くの修正を行うことがあるかもしれません。因みによって实验と練習を重ねることで、Tableauに慣れるようになり、分析やデータの表示をサポートする素晴らしい機能を発揮することができます。質問や疑問がある場合は下にコメントをお願いします。おしゃれな可视化をお楽しみください。

私たちの AirBnB データセットを使用してTableau可视化を作成するチュートリアル をご覧ください。

Source:
https://www.datacamp.com/tutorial/data-visualisation-tableau