私たちデータアナリストの目指すゴールは、データの洞察を誰もが理解し、その意味や行動方法を明確に把握できるように整理することです。
Tableauは、現在業界で広く使用されているデータアナリティクスと視覚化ツールです。多くの企業は、データサイエンス関連の作業には欠かせないと考えています。Tableauの使い易さは、ドラッグアンドドロップインターフェースを持っていることに由来します。この機能は、並べ替え、比較、分析などの作業を非常に簡単かつ迅速に行うことを可能にします。また、TableauはExcel、SQL Server、クラウドベースのデータリポジトリなど複数のソースと互換性を持っているため、データサイエンティストにとっては優れた選択肢です。
1. Tableau入門
概要
Tableau Softwareは、ワシントン州シアトルに拠点を持つソフトウェア会社で、ビジネスインテリジェンスに重点を置いたインタラクティブなデータ視覚化製品を生み出しています。Tableauは1997年から2002年の間にスタンフォード大学のコンピュータサイエンス学科で設立されました(ウィキペディア)
Tableauが提供する主要な製品は以下の通りです。

Tableau Desktop、Tableau Public、Tableau Online。これらすべてはデータ視覚化の作成ができ、選択は作業の種類によって異なります。

このチュートリアルでは、Tableau Desktopを使用します。参照元のリンクはここ。
インストール
製品の選択に基づいて、ソフトウェアをコンピュータにダウンロードします。ライセンス契約に同意した後、Tableauのアイコンをクリックしてインストールを確認することができます。以下の画面が表示されたら、すべては問題ありません。

2. はじめに
このセクションでは、Tableauのインターフェースに慣れるために、Tableauでのいくつかの基本操作を学びます。
Tableauのワークスペース
Tableauのワークスペースは、ワークシート、メニューバー、ツールバー、マークカード、シェルフなどの要素を含むコレクションです。これらについては、後のセクションで学びます。シートはワークシート、ダッシュボード、ストーリーになります。下の画像はワークスペースの主要なコンポーネントを強調表示しています。しかし、実際のデータを扱うことで、より熟悉することができます。

データソースへの接続
Tableauでの作業を開始するには、Tableauをデータソースに接続する必要があります。Tableauは多くのデータソースと互換性があります。Tableauがサポートするデータソースは、開始画面の左側に表示されます。よく使われるデータソースには、Excel、テキストファイル、関連データベース、サーバーなどがあります。クラウドデータベースソースにも接続できます。例えば、Google AnalyticsやAmazon Redshiftなどです。
Tableau Desktopの起動画面には、接続可能なデータソースが表示されています。これはTableauのバージョンにもよります。有料版ではより多くの可能性が提供されます。画面の左側には、接続
パネルがあり、利用可能なソースがハイライト表示されています。最初にファイルタイプが表示され、その後、一般的なサーバータイプや最近接続したサーバーが表示されます。開く
タブの下には、以前に作成したワークブックを開くことができます。また、Tableau Desktopはサンプルワークブック
の下でいくつかのサンプルワークブックを提供しています。
実践

サンプル-Superstoreデータセットに接続する
私たちは、スーパーストアデータセットという名前のサンプルデータセットと共に作成します。これはTableauに予め载入されているものです。しかし、ここからファイルをダウンロードして、Excelデータ源に接続する方法を理解することができます。このデータは、スーパーストアの情報で、商品、売上、利益などが含まれています。私たちの目的は、データアナリストとして、この架空の会社の中で改善すべき重要な領域を分析します。
手順
-
データをコンピュータからTableauワークスペースにインポートします。
-
「シート」タブの下に、Orders、People、Returnsの3つのシートが表示されます。しかし、私たちはOrdersデータに焦点を当てます。Ordersシートをダブルクリックして、スプレッドシートのように開かれます。
-
データの最初の3行が少し異なっており、期待されるフォーマットではありません。ここで、データインタプリタを使用します。これは「シート」タブの下にあります。クリックすると、良く整形されたシートが表示されます。
Hands On

Creating a View
簡単なチャートを生成するから始めます。この節で、私たちはデータについて理解し、データについて質問して洞察を得ることにします。この節でおそらく遇える重要な用語がいくつかあります。
Dimension
Measures
Aggregation
Dimensionsは、名前や日付のような定性データです。デフォルトで、Tableauは定性または分类的な情報を含むデータをDimensionとして自動的に分类します。たとえば、テキストや日付の値を持つフィールドはそのように分类されます。これらのフィールドは通常、列ヘッダーとしてデータの行に表示され、Customer NameやOrder Dateのように列のヘッダーとして、表示される granularity を定義します。
Measuresは、定量の数値データです。デフォルトで、Tableauはこのようなデータを含むフィールドをMeasureとして扱います。たとえば、販売取引や利益のようなデータです。Measureとして分類されたデータは、与えられたDimensionに基づいて集積可能です。たとえば、地域ごとの総販売(Measure)です。
聚合は、売上の合計や総利益など、より高いカテゴリーに集計された行レベルのデータを指します。
Tableauは、自動的にメーカーと维度のフィールドを並べ替えます。しかし、異常な場合は、手動で変更することもできます。
手順
-
ワークシートに移動します。表アクションワークスペースの左下にある
シート1
のタブをクリックします。 -
ワークシートに移動した後、データパネルの
维度
から注文日
を列棚にドラッグします。注文日
を列棚にドラッグすると、注文の各年の列がデータセットに作成されます。各列の下に「Abc」の指標が表示されていますが、これはテキストや数値、またはテキストデータをここにドラッグできることを示しています。しかし、売上
をここに引きずると、 Crosstabが作成され、各年の売上の合計を示すことができます。 -
同様に、
測定
タブから売上
フィールドを行棚にドラッグします。
Tableau は、売上を合計として集計したチャートを表示します。各年の注文日別の総集計売上が表示されます。Tableau は、この例では注文日となる時間フィールドを含むビューに常に折れ線グラフを表示します。
実践

上記の折れ線グラフはどんな情報を伝えていますか? それは、売上が見込められ、時間とともに成長する傾向があることを示しています。これは価値ある洞察ですが、売上の成長に寄与している製品についてはあまり語りません。さらに洞察を深めましょう。
ビューの改善
さらに深い洞察を得るために、どの製品がより多くの売上を促進するかを探ることにしましょう。まずは、製品カテゴリーを追加して、別の方法で売上総額を見ます。
手順
-
Category
はディメンションペインにあります。それを列棚にドラッグして、YEAR(Order Date)
の隣に配置します。Category
はYear
の右側に配置する必要があります。そうすることで、ビューはすぐにラインから棒グラフタイプに変わります。このチャートは、年ごとの各Product
の総Sales
を示します。Learn More
ビュー内の各データポイント(マーク)に関する情報を表示するには、バーの1つにカーソルを合わせてツールチップを表示します。ツールチップはそのカテゴリの総売上を表示します。こちらは2016年のオフィス用品カテゴリのツールチップです:
ビューにラベルを追加するには、ツールバーの
Show Mark Labels
をクリックします。棒グラフは縦ではなく横に表示することもできます。ツールバーの
Swap
をクリックします。
2. 上の表示は、家具、オフィス用品、技術などのカテゴリーによる売上
を素晴らしく示しています。2016年以外で、家具の売上がオフィス用品の売上より速く成長していることも明らかにしています。したがって、家具に対する売上努力を取り組むのが賢明であると推測できます。しかし、家具は大きなカテゴリーで、多くの異なるアイテムを含んでいます。どの家具アイテムが最も多い売上を作成しているのかを特定するためには何をすればよいでしょうか?
この質問に答えるために、私たちはサブカテゴリー
によって商品を見ます。どのアイテムが売上が良いかを知りたいのです。例えば、家俱カテゴリーの本棚、椅子、装飾品、テーブルの詳細を見たいとします。サブカテゴリー
要素を列の棚にダブルクリックまたはドラッグします。
サブカテゴリーは別の離散フィールドです。これはカテゴリー
をより詳細に分割し、カテゴリーと年によってサブカテゴリーに対する棒グラフを表示します。しかし、これは視覚的に理解するのには多大な量のデータです。次のセクションで、フィルター、色、その他の方法について学び、表示をより理解可能にするために進めます。
実践編

3. 結果の強調
このセクションでは、特定の結果に焦点を当てることを試みます。フィルターや色は、私たちが興味を持っている詳細により多くの焦点を加える方法です。
ビューにフィルターを追加
フィルターは、ビューに値を含めたり除外したりするために使用できます。ここでは、ワークシートに2つの単純なフィルターを追加して、特定の年のサブカテゴリー別商品販売をより簡単に見ることができます。
手順
データパネルの「次元」で、注文日を右クリックし、「フィルターを表示」を選択します。サブ->カテゴリーフィールドについても同様に実行します。

フィルターはカードの種類であり、ワークシート上で簡単にドラッグアンドドロップして移動できます
ビューに色を追加
色は、パターンの視覚的な認識に役立ちます。
手順
データパネルの「測定」で、利益をマークカードの「色」にドラッグします。

本棚、テーブル、そして機械が利益のマイナス、つまり損失に寄与していることがわかります。強力な洞察です。
実践編

主要な発見
フィルターをより詳しく見て、損益の悪い製品についてより多くを理解しましょう。
手順
- ビューにおいて、
サブカテゴリー
のフィルターカードで、本棚
、テーブル
、機械
を除くすべてのチェックボックスを外す。これにより興味深い事実が明らかになる。一部の年には、本棚と機械は実際に利益を生んでいた。しかし、2016年には機械が利益を生まなくなった。 サブカテゴリー
のフィルターカードですべて
を選択して、再びすべてのサブカテゴリーを表示する。- ディメンションから、
地域
を行
の棚にドラッグし、Sum(売上)のタブの左側に配置する。これにより、南地域の機械は他の地域より全体でより大きな負の利益を報告していることに気付く。 - スプレッドシートに名前を付けましょう。ワークスペースの左下隅で
シート1
をダブルクリックし、商品と地域別売上
と入力します。 - ビューを保持するために、Tableauではワークシートを複製でき、別のシートで処理を続けることができます。
- ワークブックで、
商品と地域別売上
シートを右クリックし、複製
を選択し、複製されたシートの名前を売上-南
に変更します。 - 新しいワークシートで、ディメンションから
地域
をフィルター
の棚にドラッグして、ビューにフィルターとして追加します。 - 「フィルター 地域」ダイアログボックスで、南以外のすべてのチェックボックスをクリアし、
OK
をクリックします。これで、南
地域の売上と利益に集中できます。機械の売上は2014年と2016年にどちらも負の利益を示していることが分かります。次のセクションでこれを調査します。 - 最後に、
ファイル > 名前を付けて保存
を選択して結果を保存することを忘れずに。ワークブックを地域販売と利益
という名前にしてください。
実践

4. 地図ビュー
地図ビューの作成
地図ビューは、地理データ(地域フィールド)を見る時に便利です。現在の例では、Tableauが自動的に国、州、市、郵便番号のフィールドに地理情報が含まれていることを認識します。
手順
- 新しいワークシートを作成します。
- データパネルの下の
州
と国
をマークカードの詳細
に追加します。これで地図ビューが得られます。 地域
をフィルター
の棚にドラッグし、南
だけに絞り込みます。地図ビューは南地域だけをズームインし、各州を表すマークが表示されます。販売
の測定をマークカードの色
タブにドラッグします。これで各州の販売範囲を示す色付きの地図が得られます。- マークカードの
色
をクリックし、色の編集
を選択することで色スキームを変更できます。利用可能なパレットを試すことができます。 - フロリダは販売に関して最も良くて、例えばサウスカロライナに比べて、89,474米ドルの販売総額が表示されます。利益も見ることで、単なる売上と比べてより良い指標となるでしょう。
利益
を色
にマーク
カード上でドラッグします。今度は、テネシー、ノースカロライナ、およびフロリダが利益的ではなく、売上が良かったと感じられていたにも関わらず、利益が負の値であることがわかります。
手顺

詳細を掘り下げる
地図は、私たちがデータを広く可视化するためのツールです。最後のステップで、テネシー、ノースカロライナ、およびフロリダが利益を持っていないことを発見しました。このセクションでは、利益がない理由を探るための棒グラフを描くことにします。
手順
-
「利益地図」のワークシートを Duplicate し、「负の利益バーグラフ」と名付けます。
-
「负の利益バーグラフ」のワークシート上で
表示
をクリックします。表示
は、ワークシートにある項目の間でグラフを描画する方法の数を提供します。表示
から水平棒の選択肢を選択し、すぐに垂直棒から水平棒に変更されます。 -
一度クリックして drag することで、一度に複数のバーを選択することができます。私たちは3つの州だけ、すなわちテネシー、ノースカロライナ、およびフロリダに焦点を当てたいので、それらに対応するバーだけを選択します。
詳しくはこちら
階層の作成
階層を使うと、似たようなフィールドをグルーピングし、視覚化内で階層間を迅速に Drill down することができます。- データ画面で、フィールドをドラッグして、他のフィールドの上に Drop したり、右クリックして
- 「Drag additional fields into the hierarchy」を選択します。階層に追加するフィールドをドラッグして、新しい位置に移動させることで、階層内でフィールドの並び替えも可能です。現在の視覚化では、以下の階層を作成します:Location、Order、Product。
-
行棚にある
州
フィールドのプラスアイコンをクリックして、市
レベルにドリルダウンします。- データは多いです。
N-Filter
を使用してフィルターをかけ、最も弱いパフォーマンスを揭示することができます。これには、市
をデータ
パネルからフィルター棚にドラッグします。Byフィールドをクリックし、次にTop
ドロップダウンをクリックし、Bottom
を選択して最も弱いパフォーマンスを揭示します。テキストボックスに5を入力して、データセットの最も弱い5つのパフォーマンスを表示します。
- データは多いです。
ジャクソンビルとミアミ、フロリダ州;バーモントン、ノースカロライナ州;そしてテネシー州のクnoxビルとメンフィスは、利益に基づいて最もパフォーマンスの悪い都市です。ビューには他にもマークがありますが、ジャクソンビル、ノースカロライナ州は利益のある販売を持っているため、ここには属していません。これは適用したフィルターに問題があることを意味します。Tableauの操作の順序を参照するために助けを求めます。
-
フィルターシェルフで、Inclusions (Country, State) セットを右クリックし、
コンテキストに追加
を選択します。今やコンコード(ノースカロライナ州)がビューに表示されている一方、ミアミ(フロリダ州)は消えてしまいました。これは今では意味があります。 -
しかし、ジャクソンビル (ノースカロライナ州)はまだ表示されており、これは間違っています。行シェルフで、
都市
タブのプラス形のアイコンをクリックして、郵便番号レベルまで展開します。ジャクソンビル、NCの郵便番号28540を右クリックし、手動でジャクソンビルを除外するために除外
を選択します。 -
行(Rows)の棚から郵便番号をドラッグします。これが最終的な表示です。
実践

主要な見出し
損失をしているエンティティ、つまり商品にのみ注目し、そういった商品が売られている場所を特定しましょう。
手順
サブカテゴリ
を行(Rows)にドラッグしてさらに階層化します。- 同様に、
利益
をマークス・カードの色
にドラッグします。これにより、利益がマイナスの商品を迅速に発見することができます。 注文日
を右クリックし、フィルターを表示
を選択します。機械、テーブル、そしてバインダーの性能が悪いようです。では、これらの商品のジャクソンビル、コンコード、バーレンチ、ノックスビル、メンフィスでの販売を中止すべきか? 決定が正しいかを検証しましょう。- 先に作成した
利益地図
のシートタブに戻ります。 - コード>サブカテゴリフィールドをクリックして
フィルター表示
オプションを選択します。 利益
を計測
の下からラベル
マークカードにドラッグします。- 再度、
注文日
をクリックしてフィルター表示
を選択します。フィルターから、負の利益に寄与していると思われるアイテムを消去します。まず、ビンダー、マシン、テーブルの前のチェックボックスをそれぞれ外します。これで利益を出すエンティティだけが残ります。これは、ビンダー、マシン、テーブルのようなエンティティが実際には一部地域で損失をしていることを示し、私たちの調査が正しいことを示しています。
実践
5. ダッシュボード
ダッシュボードは、いくつかのビューが集まったもので、さまざまなデータを同時に比較することができます。
ダッシュボードの作成
手順
新しいダッシュボード
ボタンをクリックします。南の売上
を空のダッシュボードにドラッグします。利益地図
をダッシュボードにドラッグし、南の売上ビューの上にドロップします。両方のビューを一度に見ることができます。他人がデータを理解するように表示するために、ダッシュボードを好みに合わせて編集することができます。- ダッシュボードビューの
南の売上
ワークシートで、地域
の下をクリックしてヘッダー表示
を消去します。他のすべてのヘッダーについて同じプロセスを繰り返します。これにより、必要なものだけを強調し、重要でない情報を隠すことができます。 利益地図
でタイトルも非表示にし、南の売上
地図に同じ手順を行います。- 右側に
サブカテゴリー
のフィルターカードと注文日の年
が繰り返されていることがわかります。余分なものを単純に線で消去して除外しましょう。最後に、注文日の年
をクリックします。ドロップダウン矢印が表示され、単一値(スライダー)
のオプションを選択します。今、魔法が解けます。スライダーで異なる年を選び、売上もそれに応じて変わります。 利益合計
のフィルターを、南の売上の下のダッシュボードの下部にドラッグして、より良いビューを得ます。
実際に手を動かして

インタラクティビュティを追加する
どの州でどのサブカテゴリーが利益を出しているかを見るように、ダッシュボードをよりインタラクティブにするために、いくつかの変更を行う必要があります。
手順
利益地図
から始めましょう。地図をクリックすると、右上にフィルターとして使用
のアイコンが表示されます。それをクリックします。地図を選択すると、南の売上
地図に対応する州の売上がハイライト表示されます。注文日の年
のために、ドロップダウンオプションをクリックし、ワークシートに適用 > 選択されたワークシート
に行きます。ダイアログボックスが開きます。すべて
のオプションを選んでOK
を押します。このオプションは何を行いますか?それは同じデータソースを持つすべてのワークシートにフィルターを適用します。- 探求と実験をしてください。以下の視覚化において、
Sales South
マップをフィルターにかけて、ノースカロライナーのみに売られている商品を表示することができます。そうすることで、年次の利益を簡単に探索することができます。 - デッシュボードを
Regional Sales and Profit
に変更してください。
Hands On

した結果、ノースカロライナーでの機械の売上は会社に利益をもたらしなかったことがわかります。
6. ストーリー
デッシュボードはすごい機能ですが、テーブルアウェアは私たちが結果をプレゼンテーションモードでストーリー形式で展示する機能も提供しています。それについてこの節で話します。
ストーリーの作成
手順
新しいストーリー
ボタンをクリックしてください。- 左側のストーリーパインから、以前に作成した
Sales in the South
ワークシートを表示領域にドラッグしてください。 - ワークシートの上の灰色のボックスのテキストを編集してください。これはキャプションです。
Sales and profit by year
と名前を付けてください。 - ストーリーはとても特定のものです。ここではノースカロライナーでの機械の売上についてのストーリーを語ります。ストーリーパインをクリックして
Duplicate
を押して最初のキャプションを複製します。また、新しいの作成することもできます。 Sub-Category
でselect
してみて、Machines
だけを選択してください。これにより、年次に基づいて機械の売上と利益を測定することができます。- キャプションを
Machine sales and profit by year
に変更してください。
Hands On

結論を下すことができます。
北カリフォルニアの機械は利益の損失につながっています。しかし、全体の売上と利益を見るだけではこれを証明することはできません。これには地域の利益が必要です。
手順
- ストーリーペインで
空白
を選択します。既に作成したダッシュボード地域の売上と利益
をキャンバスにドラッグします。 南の性能の低い商品
というキャプションをつけます。- 地域利益ダッシュボードを使って別のストーリーポイントを作成するために
複製
を選択します。北カリフォルニアに興味があるので、棒グラフで北カリフォルニアを選択します。 - 全ての年を選択します。
- 例えば
NCの利益:2013-2016
というように、明確なキャプションを追加します。 - 2014のようにどの年も選択し、
NCの利益:2014
というようなキャプションを追加してから、複製タブをクリックします。残りのすべての年について同じ手順を繰り返します。 - プレゼンテーションモードをクリックして、
ストーリー
を展開します。
実践

北カリフォルニア市場に何をどのように時系列で商品が導入され、どのように性能を発揮したかについてのアイデアがあります。负の利益に取り組む方法を特定するだけでなく、データに基づいてサポートすることも成功적に行いました。これがTableauのストーリー機能の利点です。
7. TableauとR、Python & SQLの統合
タベルには様々な視覚化の利点がありますが、それ以外にも素晴らしい既製の接続機能があります。タベルはPythonやRなどの言語、SQLのようなDBMSと簡単に統合できます。これは機能性に関する利点を提供し、PythonやRで作業を慣れているデータサイエンティストにとって便利です。彼らはタベルにRとPythonのスクリプトを直接インポートして、これらの言語よりもはるかに優れたタベルの視覚化を利用することができます。また、タベルの視覚化機能は使いやすく、直感的ですので、データサイエンティストには多くの時間を節約します。
このセクションでは、タベルをこれらの外部ソースと接続する方法とその接続の利点について見ていきます。
タベルとR
Rは、線形・非線形モデリング、統計テスト、時系列分析、分類、クラスタリングなどの高度な予測分析を行うために使われる人気のある統計的言語です。(タベル8.1とR) タベルとRを組み合わせて使用することは以下の利点があります:
- タベルユーザーは、より深い洞察を得るために高度なRライブラリにアクセスすることで、タベルの統計的パワーを活用できます。
- タベルの強化されたデータ探索オプションと複数のソースへの接続能力は、Rユーザーにとって便利です。
- さらに、それは、R言語の有用性を享受することができるようにタベルユーザーをサポートし、言語を実際に知る必要はありません。
How does Tableau integrate with R?
Tableau は以下の方法で Rと統合されます。Rの関数とモデルは、Rエンジンを動的に呼び出し、値をRに渡す新しい計算済みフィールドを作成してTableau内で使用できます。これらの結果はTableauに戻され、視覚化のために使用されます。
Tableau Desktop に Rを設定する
Rserve
をダウンロードしてインストールします。
TableauがRスクリプト機能を接続し利用するためには、Rserve
パッケージをダウンロードしてインストールする必要があります。Rコンソールで以下のコマンドを入力します。
install.packages(“Rserve”) library(Rserve) Rserve() / Rserve(args = ‘ — no-save’)
Tableau に Rサーバーを接続する
Rserve
が正常にインストールされた後、Tableau Desktopを開き、以下の手順に従います。
-
ヘルプ > 設定とプリファレンス
に行き、外部サービス接続の管理
を選択します。 -
サーバー名に“Localhost”(または“127.0.0.1”)を入力し、ポートを“6311”にします。
-
“接続テスト”ボタンをクリックします。成功メッセージが表示されるはずです。閉じるにはOKをクリックします。

TableauでRスクリプトを使用する
上記の手順を完了すると、SCRIPT_*関数を使用してRの機能を呼び出す新しい計算フィールドをTableau Desktopに作成することができます。
テーブルを操作し、Rを使用した計算フィールドと、Tableauのドラッグアンドドロップ機能を使用した計算フィールドの利益を計算する方法を学びましょう。そして、結果を比較します。
手順
- Tableauワークブックを開き、サンプルスーパーストोーレットデータに接続します。
- Rserveに接続します。Tableau DesktopがRserveに接続されると、計算フィールドを通じてRエンジンを呼び出すことができます。
-
今回は、予測利益と呼ばれる計算フィールドを作成します。
Rと使用できる4つの関数が利用できます。これらの関数はすべてscriptという文字列で始まります。これらの関数は以下の通りです。
- SCRIPT_REAL: 実数を結果として返します。
- SCRIPT_STR: 文字列を返します。
- SCRIPT_INT : 整数を返します。
- SCRIPT_BOOL: 論理値を返します。
- この例では、SCRIPT_REAL関数を使用します。Tableauで簡単な
線形回帰
を作成します。
-
計算されたフィールドを開き、以下のスクリプトを插入します。
SCRIPT_REAL("fit <- lm(.arg1 ~ .arg2 + .arg3 + .arg4) fit$fitted ", SUM([利益]), AVG([売上]), AVG([数量]), AVG([ディスカウント]))
上記のスクリプトはRでの線形回帰モデルに関係する。このモデルは1つの依存変数(arg1)と3つの独立変数(arg2、arg3、arg4)を持つ。これらの引数は単なる場所を持つだけで、スクリプトがRに返信されると、それぞれに対応する表の列に置き換えられます。5. 各変数に対応する表のフィールドを入力してください。ここでの依存変数は利益で、それには
SUM(利益)
を最初に入力します。同様に、他の3つの引数にはそれぞれ平均単価、平均注文数量
および平均割引
を使用します。 -
これらの入力は今や予期される利益レベルを決定するモデルに引き込まれます。Tableauビジュアル化でこの計算を使用する準備ができました。カテゴリを行に、そして
Profit
を列にドラッグします。次にExpected Profit
を列にドラッグします。 -
私たちは、モデルを分析することで、Rで計算された予測利益と実際の利益との比較を見ることができます。また、顧客分层を色に持ってくることで、積み重ね棒グラフを作成し、年ごとまたは四半期ごとにデータを分割することができます。
Hands On

Rを使用しないでTableauでこれらの計算を行うことはできます。なぜ、RserveをTableauに下载し、設定し、スクリプトを書く手続きを通る必要があるのでしょうか。Rは、予測に強力な機能を持っており、よく使用されているライブラリに含まれている有名なアルゴリズムを簡単に利用することができます。テーブルアウトでビジネスの予測を行うために、簡単なRスクリプトを呼び出し、それをテーブルアウトの可视化に組み入れることができます。
TableauとPython
Pythonは幅広く使用される汎用のプログラミング言語です。Pythonは統計分析、予測モデリング、機械学習を行うための多くのライブラリを提供します。TableauとPythonを接続することは、予測分析に最適なアプローチの一つです。Tabpyは同様の目的で開発されたパッケージです。TableauがPythonの力を利用するために、TabPyサーバーに接続してPythonコードを即時実行し、視覚化として結果を表示させることができます。
TableauはどのようにPythonと統合されるのか?
TabPyをTableauで使用すると、Pythonで計算フィールドを定義することができ、視覚化から機械学習ライブラリの強大な力を活用することができます。
Tableau DesktopとPythonのセットアップ
Tabpy
をダウンロードしてインストール。
Tableauワークブック内でPythonコードを実行するには、Pythonサーバーが必要です。TabPyフレームワークがこれを行います。TabPyを以下のリンクからGithubからダウンロードします。または、以下の手順に従います:
conda install -c anaconda tabpy-server
次に、ダウンロードしたtabpyサーバーを含むディレクトリにcdし、実行します。
python setp.py
TableauとTabPyの接続
次のステップは、TableauとTabPyを接続することです。これは、ヘルプ > 設定とパフォーマンス > 外部サービス接続の管理:
に行って設定します。

接続をテストします。問題なく行けば、“接続成功”のメッセージが表示されます。
TableauでPythonスクリプトを使用し始める。
PythonとTableauの統合は非常に便利な機能です。たとえば、感情分析の問題に取り組むのは、機械学習コミュニティで一般的な問題で、様々な機械学習アルゴリズムを用いることで解決できます。しかし、TableauとPythonの組み合わせを使用することで、同じ結果が数行のPythonコードで得られるようになります。その後、Tableauで可視化することでより深い洞察が得られます。例を見てみましょう(PythonのパワーをTableauに活用するTabPyを使用して)
Tabpyを使用した感情分析
ここからダウンロードできるモバイルレビューのデータセットを使用します。
手順:
- データセットをTableau Desktopにインポートする
- Tabpyに接続する。Tableau Desktopが
Tabpy
に接続されると、計算フィールドを通じてPythonエンジンを呼び出すことができます。 -
以下に、名前が
Sentiment
の計算フィールドを作成するための手順が記載されています:SCRIPT_REAL("from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer vs = [] analyzer = SentimentIntensityAnalyzer() for i in range(0,len(_arg1)): a = analyzer.polarity_scores(_arg1[i])['compound'] vs.append(a) return vs",ATTR([Reviews]))`
ここでは、
VADER 感情分析
ツールを使用しています。これは、ソーシャルメディアで表される感情に特化した際引き合わせる際に最適化された言葉彙と規則に基づく感情分析ツールです。このツールを使用するには、まずインストールする必要があります。詳細については、彼らのGitHub ページを参照してください。 -
今度は、
Reviews
を行の位置にドラッグし、Sentiment
をテキストと色のマークカードにドラッグしてみてください。魔術的なことが起こります。レビューの感情分析を簡単に行い、結果の可視化も非常に簡単になります。肯定的なレビューは緑色で昇順に、否定的なレビューは赤色で表示されます。
上の例は、TableauとPythonの統合によって提供される力量を明確に示しています。Sentimentスコアを手に入れることで、詳細に掘り下げることができます。たとえば、事業主としては、否定的なレビューをフィルターにかけ、その理由を考えることができます。また、肯定的なレビューに基づいて、消费者が幸せに感じる商品についての考えができます。
TableauとSQL Server
Microsoft SQL Serverのデータには、標準的なレポートや複雑なビジネスインテリジェントツールの背後に隠れた未知の価値があります。Tableauは、SQL Serverのデータに対する高度な可视化分析を行うことができるよう、任何人に機能を提供して、洞察をあらゆる場所に届けます。Tableauは、SQL Serverに対するライブの接続を提供し、データを直接的にTableauの分析エンジンに持ち込んで、データベースの負荷を軽減することができます。
Tableauは、SQL Serverに対する最適化されたライブコネクタを提供し、データを直接操作せずにチャート、レポート、ダッシュボードを作成することができます。分析を進めるにつれて、TableauはSQL Serverで使用されているスキーマを認識しますので、私たちはデータを操作する必要はありません。
SQL ServerデータベースをTableau Desktopに接続し、その後それを可视化に使用する方法を示す例を見てみましょう。
手順:
- SQL Serverにログインします。
- Tableau Desktopを開き、サーversにあるMS SQLに接続します。
- 開いたダイアログボックスにサーバー名を貼り付け、OKをクリックしてください。これにより、TableauをSQL Serverに接続します。選択したいデータベースを選択してください。この例では、salesDBを選択します。次に、TABLESの一覧から選択することもできます。たとえば、Sales Logを選択します。テーブルがTableau環境にインポートされます。その後、新しいワークシートにデータ全体またはその一部を抽出することができます。抽出する行数を指定することもできます。
- 新しいワークシートには、MS SQLから抽出したデータが含まれています。ここから、他のTableauワークシートと同様に操作することができます。
Hands On:

これは、SQL ServerをTableauに簡単に接続し、データを直接そこに抽出する方法です。Tableauは、使用者により、メモリ内のクエリを较大のデータセットに適用するために、接続を一つのクリックで切り替える機能を提供します。
8. 作業の保存
Tableau Desktop
Tableau ワークブックをローカルに保存するには、「ファイル」を選択し、「保存」をクリックします。保存場所
ダイアログボックスで、ワークブックのファイル名を指定してください。Tableauはデフォルトで.twbエクステンションのファイルに保存します。
Tableau Public
Tableau Publicを使用すると、すべてのビューとデータが公開され、インターネット上のどのような人もアクセスできます。サーバーを選択し、Tableau Publicを選択し、Tableau Publicに保存する
を選択し、認証情報を入力します。
Tableau Server
データが機密であり、ストーリーが整个のチームに共有される必要がある場合、Tableau Serverは便利です。Tableau Serverにストーリーを公開するには、選択してサーバー> ワークブックを公開
を選択したり、ツールバーの 共有
をクリックします。しかし、まずアカウントを作成することを忘れないでください。
結論
これでTableauで良い可视化を作成するためのすべてのことが完了しました。しかし、各段階で私たちが行ったように多くの修正を行うことがあるかもしれません。因みによって实验と練習を重ねることで、Tableauに慣れるようになり、分析やデータの表示をサポートする素晴らしい機能を発揮することができます。質問や疑問がある場合は下にコメントをお願いします。おしゃれな可视化をお楽しみください。
私たちの AirBnB データセットを使用してTableau可视化を作成するチュートリアル をご覧ください。
Source:
https://www.datacamp.com/tutorial/data-visualisation-tableau