Nossa meta como Analistas de Dados é organizar as insights dos nossos dados de modo que todas as pessoas que as veem sejam capazes de entender suas implicações e como atuar sobre elas claramente.
Tableau é uma ferramenta de análise de dados e visualização amplamente usada na indústria hoje em dia. Muitas empresas até consideram que é indispensável para trabalhos relacionados à ciência de dados. A facilidade de uso de Tableau vem do fato de que possui uma interface de arrastar e soltar. Essa funcionalidade ajuda a realizar tarefas como classificar, comparar e analisar muito facilmente e rápido. Tableau é também compatível com várias fontes, incluindo Excel, SQL Server e repositórios de dados baseados na nuvem, o que o torna uma excelente escolha para Cientistas de Dados.
1. Introdução ao Tableau
Visão Geral
Tableau Software é uma empresa de software sediada em Seattle, Washington que produz produtos de visualização de dados interativos concentrados em inteligência de negócios. Tableau foi estabelecido no Departamento de Ciência da Computação da Universidade de Stanford entre 1997 e 2002(Wikipedia)
Os principais produtos oferecidos por Tableau são:

Tableau Desktop, Tableau Public, e Tableau Online, todos oferecem criação de visualização de dados e a escolha depende do tipo de trabalho.

Neste tutorial, trabalheremos com o Tableau Desktop. O link para a fonte de referência está aqui.
Instalação
A dependência do produto escolhido, baixe o software no computador. Após aceitar o acordo de licença, você pode verificar a instalação clicando no ícone do Tableau. Se a tela seguinte aparecer, você está pronto para começar.

2. Iniciando
Nesta seção, nós vamos aprender algumas operações básicas no Tableau para nos habituarmos com sua interface.
Workspace do Tableau
O workspace do Tableau é uma coleção de planilhas, barra de menu, toolbar, cartão de marcas, prateleiras e muitos outros elementos sobre os quais vamos aprender nas seções seguintes. As planilhas podem ser planilhas de trabalho, painéis ou histórias. A imagem abaixo destaca os componentes principais do workspace. No entanto, a familiaridade será melhor alcançada quando trabalharmos com dados reais.

Conectando a uma Fonte de Dados
Para começar a trabalhar com o Tableau, precisamos conectar o Tableau à fonte de dados. O Tableau é compatível com muitas fontes de dados. As fontes de dados suportadas pelo Tableau aparecem no lado esquerdo da tela de abertura. Algumas fontes de dados comumente usadas são o Excel, arquivo de texto, banco de dados relacional ou até mesmo em um servidor. Também é possível conectar a uma fonte de banco de dados na nuvem, como o Google Analytics, Amazon Redshift, etc.
A tela de lançamento do Tableau Desktop mostra as fontes de dados disponíveis às quais podemos conectar. Também depende da versão do Tableau, pois a versão paga oferece mais possibilidades. No lado esquerdo da tela, há um painel Conectar
que destaca as fontes disponíveis. Os tipos de arquivos são listados primeiro, seguidos por tipos de servidor comuns ou os servidores aos quais se conectou recentemente. Você pode abrir cadernos de trabalho previamente criados na guia Abrir
. O Tableau Desktop também fornece alguns cadernos de exemplo sob Exemplos de Cadernos
.
Prática

Conectando ao conjunto de dados Sample-Superstore
Dados serão trabalhados com um conjunto de dados de exemplo chamado conjunto de dados do Superstore, que vem pré-carregado no Tableau. No entanto, vamos baixar o arquivo de aqui para que possamos ter uma ideia de como conectar a uma fonte de dados do Excel. Os dados são sobre um supermercado. Contém informações sobre produtos, vendas, lucros, etc. Nossa meta, como Analistas de Dados, é analisar os dados e encontrar áreas críticas de melhoria nesta empresa fictícia.
Passos
-
Importe os Dados para o espaço de trabalho do Tableau a partir do computador.
-
Na guia de Planilhas, três planilhas ficarão visíveis, nomeadamente Pedidos, Pessoas e Devoluções. No entanto, vamos nos concentrar apenas nos dados de Pedidos. Clique duas vezes na planilha Pedidos, e ela abrirá como um livro de cálculo.
-
Observamos que as primeiras três linhas de dados parecem um pouco diferentes e não estão no formato desejado. Aqui faremos uso do Interpretador de Dados, também presente na guia de Planilhas. Clicando nele, obtemos uma planilha bem formatada.
Ambiente de Prática

Criando uma Visualização
Vamos começar criando um gráfico simples. Nessa seção, vamos conhecer os nossos dados e começar a fazer perguntas sobre os dados para obter insights. Existem algumas termos importantes que vamos encontrar nesta seção.
Dimensão
Medidas
Agregação
Dimensões são dados qualitativos, como um nome ou data. Por padrão, o Tableau classifica automaticamente dados que contêm informações qualitativas ou categóricas como dimensão, por exemplo, qualquer campo com valores de texto ou data. Esses campos normalmente aparecem como cabeçalhos de colunas para linhas de dados, como Nome do Cliente ou Data da Compra, e também definem o nível de granularidade que é mostrado na visualização.
Medidas são dados quantitativos numéricos. Por padrão, o Tableau trata qualquer campo que contém esse tipo de dado como uma medida, por exemplo, transações de vendas ou lucro. Dados classificados como medida podem ser agregados com base em uma dimensão dada, por exemplo, total de vendas (Medida) por região (Dimensão).
Agregação é o dado a nível de linha agrupado para uma categoria mais alta, como a soma das vendas ou o lucro total.
Tableau ordena automaticamente os campos em Medidas e Dimensões. No entanto, para qualquer anomalia, pode-se alterá-lo manualmente também.
Passos
-
Vá para a planilha. Clique na guia
Planilha 1
no canto inferior esquerdo da área de trabalho do Tableau. -
Uma vez na planilha, a partir de
Dimensões
no painel de Dados, arraste aData da Ordem
para a prateleira de Coluna.Ao arrastar a
Data da Ordem
para a prateleira de colunas, é criada uma coluna para cada ano das Ordens no conjunto de dados. Um indicador ‘Abc’ é visível sob cada coluna o que implica que dados de texto ou numéricos ou texto podem ser arrastados aqui. Por outro lado, se arrastássemosVendas
aqui, seria criado um cruzamento que mostraria o total de Vendas para cada ano. -
Da mesma forma, na aba
Medições
, arraste o campoVendas
para a prateleira de Linhas.
O Tableau popula um gráfico com as vendas agregadas como soma. As vendas totais agregadas para cada ano por data do pedido são exibidas. O Tableau sempre popula um gráfico de linha para uma visualização que inclui um campo temporal, que neste exemplo é a Data do Pedido.
Prática

O que o gráfico de linha acima transmite? Bem, ele mostra que as vendas parecem bastante promissoras e parecem estar aumentando com o tempo. Isso é uma percepção valiosa, mas dificilmente diz muito sobre os produtos que estão contribuindo para o aumento das Vendas. Vamos nos aprofundar para obter mais insights.
Refinando a Visualização
Vamos nos aprofundar e tentar descobrir mais percepções sobre quais produtos impulsionam mais vendas. Vamos começar adicionando as categorias de produtos para observar os totais de vendas de uma maneira diferente.
Passos
-
A categoria
Categoria
está presente na área Dimensões. Arraste-a para a prateleira das colunas e coloque-a ao lado deANO(Data do Pedido)
. A categoria deve ser colocada à direita do ano. Assim, a visão é alterada imediatamente para um tipo de barra de gráfico de linha. O gráfico mostra o total deVendas
de cadaProduto
por ano.Saiba Mais
Para visualizar informações sobre cada ponto de dados (isto é, marca) na visão, passe o mouse sobre uma das barras para revelar uma dica de ferramenta. A dica de ferramenta mostra as vendas totais para essa categoria. Aqui está a dica de ferramenta para a categoria de Suprimentos de Escritório em 2016:
Para adicionar rótulos à visão, clique em
Mostrar Rótulos de Marca
no painel de ferramentas.O gráfico de barras pode também ser exibido de forma horizontal em vez de vertical. Clique em
Trocar
no painel de ferramentas para fazer isso.
2. A visualização acima mostra vendas
por categoria
, isto é, mobílias, material de escritório e tecnologia. Também podemos inferir que as vendas de mobílias estão crescendo mais rápido do que as vendas de material de escritório, exceto em 2016. Portanto, seria sensato focar os esforços de vendas em mobílias em vez de material de escritório. Mas a categoria de mobílias é vasta e consiste em muitos itens diferentes. Como podemos identificar qual item de mobília está contribuindo para as vendas máximas?
Para ajudar-nos a回答 essa pergunta, decidimos olhar para os produtos por Sub-categoria
para ver quais itens são os maiores vendedores. Digamos que para a categoria Mobílias, queremos ver detalhes apenas sobre prateleiras, cadeiras, decorações e mesas. Vamos fazer um duplo clique ou arrastar a dimensão Sub-Categoria
para a prateleira de colunas.
A subcategoria é outro campo discreto. Ela desmembra ainda mais a Categoria
e mostra uma barra para cada subcategoria
quebrada por categoria e ano. No entanto, é uma quantidade astronômica de dados para serem entendidos visualmente. Na próxima seção, vamos aprender sobre filtros, cor e outros meios para tornar a visualização mais compreensível.
Mãos na massa

3. Enfatizando os Resultados
Nesta seção, tentaremos concentrar-nos em resultados específicos. Filtros e cores são maneiras de adicionar mais foco aos detalhes que interessam a nós.
Adicionando filtros à visão
Filtros podem ser usados para incluir ou excluir valores da visão. Aqui tentamos adicionar dois filtros simples à planilha para torná-la mais fácil de olhar as vendas de produtos por subcategoria the um ano específico.
Passos
No painel de Dados, em Dimensões, clique com o botão direito do mouse em Data de Pedido e selecione Mostrar Filtro. Repita para o campo Sub->categoria também.

Filtros são do tipo de cartões e podem ser movidos pela simples arrastar e soltar na planilha.
Adicionando cores à visão
Cores podem ajudar na identificação visual de um padrão.
Passos
No painel de Dados, em Medidas, arraste Lucro para Cores na carta Marcas.

Pode-se ver que as estantes, mesas e até mesmo máquinas contribuem para lucro negativo, ou seja, perda. Uma visão poderosa.
Mãos na massa

Principais Encontros
Vamos olhar mais de perto os filtros para descobrir mais sobre os produtos não lucrativos.
Passos
- Na visão, na caixa de filtro de
Sub-Category
, desmarque todas as caixas excetoBookcases
,Tables
, eMachines
. Isto revela um facto interessante. Em alguns anos, asBookcases
e asMachines
foram realmente lucrativas. No entanto, em 2016, asMachines
tornaram-se não lucrativas. - Selecione
All
na caixa de filtro deSub-Category
para mostrar todas as subcategorias novamente. - Apartir das Dimensões, arraste
Region
para a prateleiraRows
e coloque-o à esquerda da aba Sum(Sales). Reparamos que as máquinas no Sul estão a relatar um maior lucro negativo global do que nas suas outras regiões. - Vamos agora atribuir um nome à folha. No canto inferior esquerdo do espaço de trabalho, clique duas vezes em
Sheet 1
e digiteSales by Product and Region
. - Para preservar a visão, o Tableau permite que nós duplicemos a nossa folha de trabalho para que possamos continuar noutra folha onde deixámos.
- No seu workbook, clique com o botão direito no
Sales by Product and Region
folha e selecioneDuplicate
e renomeie a folha duplicada paraSales-South
. - Na nova folha, a partir das Dimensões, arraste
Region
para a prateleiraFilters
para adicioná-lo como um filtro na visão. - Na caixa de diálogo Filtro de Região, limpe todas as caixas de marcação exceto Sul e clique em
OK
. Agora podemos concentrar-nos nas vendas e no lucro noSouth
. Descobrimos que as vendas de máquinas tiveram um lucro negativo em 2014 e novamente em 2016. Investigaremos isto na próxima secção. - Não se esqueça de salvar os resultados selecionando
Arquivo > Salvar Como
. Vamos nomear nosso livro de trabalho comoVendas e Lucros Regionais
.
Prática

4. Visualização de Mapa
Criando uma Visualização de Mapa
A visualização de mapa é benéfica quando estamos olhando para dados geográficos (o campo Região). No exemplo atual, o Tableau reconhece automaticamente que os campos País, Estado, Cidade e Código Postal contêm informações geográficas.
Passos
- Crie uma nova planilha.
- Adicione
Estado
ePaís
no painel Dados paraDetalhe
na carta de Marcas. Obtemos a visualização de mapa. - Arraste
Região
para a prateleiraFiltros
, e então filtre para apenasSul
. A visualização de mapa agora faz zoom na região Sul apenas, e uma marca representa cada estado. - Arraste a medida
Vendas
para a guiaCor
na carta de Marcas. Obtemos um mapa preenchido com cores mostrando a faixa de vendas em cada estado. - Podemos alterar a cor do esquema clicando em
Cor
na carta de Marcas e selecionandoEditar Cores
. Podemos experimentar com as paletas disponíveis. - Observamos que Flórida está se destacando em termos de Vendas. Se passarmos o mouse sobre Flórida, mostra um total de 89.474 USD em vendas, em comparação com a Carolina do Sul, por exemplo, que tem apenas 8.482 USD em vendas. Vamos avaliar o desempenho por
Lucro
agora, já que o Lucro é um melhor indicador do que as Vendas sozinhas. - Arraste
Lucro
paraCor
na carta de Marcas. Agora vemos que Tennessee, Carolina do Norte e Flórida têm lucro negativo, embora parecesse que estavam fazendo bem nas Vendas. Renomeie a planilha como Mapa de Lucro
Prática

Entrando nos Detalhes
Os mapas nos permitem visualizar os dados amplamente. Na última etapa, descobrimos que Tennessee, Carolina do Norte e Flórida têm um lucro negativo. Nesta seção, vamos desenhar um gráfico de Barras para explorar a razão para o lucro negativo.
Passos
-
Duplique a planilha Mapa de Lucro e nomeie-a como Gráfico de Barras de Lucro Negativo.
-
Clique em
Mostre-me
na planilha Gráfico de Barras de Lucro Negativo.Mostre-me
apresenta o número de maneiras nas quais um gráfico pode ser plotado entre os itens mencionados na planilha. EmMostre-me
, selecione a opção de barra horizontal e a visualização atualiza instantaneamente de barras verticais para horizontais. -
Nós podemos selecionar mais de uma barra de uma só vez simplesmente clicando e arrastando o cursor sobre elas. Nós queremos concentrar apenas em três estados, ou seja, Tennessee, North Carolina e Florida. Portanto, nós só selecionaremos as barras referentes a eles.
Aprender Mais
Criando Hierarquias
Hierarquias são úteis quando nós queremos agrupar campos semelhantes para que possamos escavar rapidamente entre níveis na visualização.- No painel de Dados, arraste um campo e solte-o diretamente em cima de outro campo ou clique com o botão direito do mouse no campo e selecione
- Arraste campos adicionais para a hierarquia. Campos também podem ser reordenados na hierarquia simplesmente arrastando-os para uma nova posição. Na visualização atual, criaremos as seguintes hierarquias: Localização, Ordem e Produto.
-
No Painel de Linhas, clique no ícone em forma de cruz no campo
Estado
para fazer um drill-down até o nívelCidade
.- É muita informação. Podemos usar o
Filtro N
para filtrar e revelar os piores desempenhos. Para isso, arrasteCidade
do painelDados
para o Painel de Filtros. Clique em Por campo e então clique no menu suspensoTopo
e selecioneInferior
para revelar os piores desempenhos. Digite 5 na caixa de texto para mostrar os 5 piores desempenhos no conjunto de dados.
- É muita informação. Podemos usar o
Agora vemos que as cidades de Jacksonville e Miami, Flórida; Burlington, Carolina do Norte; e Knoxville e Memphis, Tennessee, são as cidades com melhores desempenhos em lucro. Há outra marca na visão – Jacksonville, Carolina do Norte – que não se encaixa aqui, já que ela tem vendas lucrativas. Isto significa que há um problema com o filtro que aplicamos. Vamos procurar ajuda na ordem de operações do Tableau.
-
No estante de Filtros, clique com o botão direito do mouse no conjunto de Inclusões (País, Estado) e selecione
Adicionar ao Contexto
. Descobrimos que agora Concord(Carolina do Norte) aparece na visão enquanto Miami(Flórida) desapareceu. Isto faz sentido agora. -
Mas Jacksonville(Carolina do Norte) ainda está presente, o que é incorreto. No estante de Linhas, clique no ícone de mais de
Cidade
para perfilar até o nível de Código Postal. Clique com o botão direito do mouse no código postal para Jacksonville, NC, 28540, e em seguida, selecioneExcluir
para excluir manualmente Jacksonville. -
Arraste o Código Postal da prateleira de Linhas. Esta é a visualização final.
Prática

Resultados chave
Agora concentremo-nos apenas nas entidades deficitárias, ou seja, os Produtos e também identifiquemos os locais onde esses produtos são vendidos.
Passos
- Arraste
Subcategoria
para as Linhas para uma análise mais aprofundada. - Da mesma forma, arraste
Lucro
paraCor
no cartão de Marcas. Isso permite que localizemos rapidamente os produtos com lucro negativo. - Clique com o botão direito do mouse em
Data da Ordem
e selecioneMostrar Filtro
. Parece que Máquinas, mesas e encadernadores estão se saindo mal. Então o que devemos fazer? Uma solução seria parar a venda desses produtos em Jacksonville, Concord, Burlington, Knoxville e Memphis? Vamos verificar se nossa decisão está certa. - Vamos voltar à guia de planilha
Mapa de Lucro
criada anteriormente. - Agora, clique no campo
Sub-Category
para selecionar a opçãoShow Filter
. - Arraste o
Profit
que está sobMeasures
para a área deLabel
Marks. - novamente, clique no
Order Date
e selecioneShow Filter
. Ao aplicar o filtro, remova os itens que achamos que estão contribuindo para o lucro negativo. Assim, desmarque as caixas em frente aos Binders, Machines e Tables, respectivamente. Agora, somente os elementos que estão fazendo lucro restam. Isso mostra que os elementos como Binders, máquinas e mesas estavam causando prejuízos em algumas áreas e nós estávamos certos nas nossas descobertas.
Hands On
5. Painel
Um painel é uma coleção de várias visões, que permite a comparação de vários tipos de dados simultaneamente.
Criar um Painel
Passos
- Clique no botão
Novo painel
. - Arraste
Vendas no Sul
para o painel vazio. - Arraste o
Mapa de Lucro
para o painel e solte-o acima da visão Vendas no Sul. As duas visões podem ser vistas simultaneamente. Para poder apresentar dados de forma que outros possam entender, podemos organizar o painel à nossa escolha. - Na planilha
Vendas Sul
no modo painel, clique sob oRegion
e remova a opçãoShow Header
. Repita o mesmo processo para todas as outras headers. Isto ajuda a destacar somente o que é necessário e a esconder informações menos importantes. - No
Mapa de Lucro
, esconda o título e execute os mesmos passos para o mapaVendas Sul
. - Podemos ver que a carta de filtro de
Sub-Categoria
e oAno da Data de Envio
foram repetidos no lado direito. Vamos eliminar o extra simplesmente marcando-os com um cruzamento. Finalmente, clique noAno da Data de Envio
. Uma seta de dropdown aparece e selecione a opção deValor único (Slider)
. Agora deixe a magia acontecer. Experimente escolher anos diferentes no slider e as vendas também variam de acordo. - Arraste o filtro
SUM(Profit)
para o final do painel de instrumentos abaixo das vendas no sul para uma melhor visão.
Mãos na massa

Adicionando Interatividade
Para tornar o painel de instrumentos mais interativo, como ver quais sub-categorias são lucrativas em quais estados, são necessárias algumas mudanças.
Passos
- Vamos começar com o
Mapa de Lucro
. Ao clicar no mapa, um ícone deUsar como filtro
aparece no canto superior direito. Clique nele. Se selecionarmos qualquer mapa, as vendas correspondentes a esse estado serão destacadas no mapaVendas Sul
. - Para o
Ano da Data de Envio
, clique na opção de dropdown e vá paraAplicar a Planilhas > Planilhas Selecionadas
. Uma caixa de diálogo abre. Selecione a opçãoTodos
e depoisOK
. O que essa opção faz? Aplica filtros a todas as planilhas que usam a mesma fonte de dados. - Explore e experimente. Na visualização abaixo, podemos filtrar o mapa
Vendas Sul
para ver produtos que estão sendo vendidos apenas na Carolina do Norte. Podemos então explorar facilmente os lucros anualmente. - Renomeie o Dashboard para
Vendas Regionais e Lucro
.
Prática

Assim, vender máquinas na Carolina do Norte não trouxe nenhum lucro à empresa.
6. História
Um dashboard é um recurso legal, mas o Tableau também nos oferece a oportunidade de apresentar nossos resultados no modo de apresentação sob a forma de histórias, sobre as quais discutiremos nesta seção.
Construindo uma História
Passos
- Clique no botão
Nova história
. - Na painel de História à esquerda, arraste a planilha
Vendas no Sul
(criada anteriormente) para a visualização. - Edite o texto na caixa cinza acima da planilha. Este é o subtítulo. Nomeie como
Vendas e lucro por ano
. - As histórias são bastante específicas. Aqui vamos contar uma história sobre a venda de máquinas na Carolina do Norte. No painel de História, clique em
Duplicar
para duplicar o primeiro subtítulo, ou você pode até criar um novo. - Na
Sub-Categoria
, filtreselecione
apenasMáquinas
. Isso ajuda a avaliar as vendas e o lucro das máquinas por ano. - Renomeie o subtítulo para
Vendas e lucro de máquinas por ano
.
Prática

Fazendo uma Conclusão
É claro que as máquinas na Carolina do Norte estão causando perdas de lucro. No entanto, isto não pode ser demonstrado apenas olhando para Lucro e Vendas em sua totalidade. Para isso, precisamos de Lucro regional.
Passos
- No painel da História, selecione
Branco
. Arraste o painel de instrumentosVendas e Lucro Regionais
já criado para o canvase. - Leve-o a
Itens com desempenho baixo no Sul
. - Selecione
Duplicar
para criar outro ponto da história com o painel de Lucro Regional. Selecione Carolina do Norte no gráfico de barras, já que estamos interessados em mostrar mais sobre ele. - Selecione todos os anos.
- Adicione uma legenda para clareza, como
Lucro na NC: 2013-2016
. - Selecione um ano, por exemplo, 2014. Adicione uma legenda, por exemplo,
Lucro na NC: 2014
e clique na aba Duplicar. Repita o mesmo passo para todos os anos restantes. - Clique no modo de apresentação e deixe a
história
ser contada.
Mão no Pão

Agora temos uma ideia sobre quais produtos foram introduzidos no mercado da Carolina do Norte quando e como eles performaram. Não somente identificámos uma maneira de se addressar o negativo lucro, mas também conseguimos apoiá-lo com dados. Esta é a vantagem da História no Tableau.
7. Integração do Tableau com R, Python & SQL
Apartir das várias vantagens de visualização que o Tableau oferece, ele também possui habilidades impressionantes de conexão prontas para uso. O Tableau pode se integrar facilmente com linguagens como Python e R e até mesmo com SGBD como SQL. Isso oferece vantagens incrementais em termos de funcionalidades e é útil para Cientistas de Dados que estão acostumados a trabalhar em Python ou R. Eles podem importar diretamente os scripts R e Python no Tableau e aproveitar suas visualizações, que são muito superiores às dessas linguagens. Além disso, as capacidades de visualização do Tableau são fáceis de usar e muito intuitivas, economizando muito tempo para os Cientistas de Dados.
Nesta seção, veremos como podemos conectar o Tableau com essas fontes externas e as vantagens dessas conexões.
Tableau e R
R é uma linguagem estatística popular usada para executar análises preditivas sofisticadas, como modelagem linear e não linear, testes estatísticos, análise de séries temporais, classificação, agrupamento, etc.(Tableau 8.1 e R) Usar o Tableau em conjunto com R tem as seguintes vantagens:
- Capta o poder estatístico do Tableau, dando aos usuários acesso a bibliotecas R sofisticadas para obter insights mais profundos e melhores a partir dos dados.
- As opções de exploração de dados aprimoradas do Tableau e a capacidade de conectar a várias fontes são úteis para usuários de R.
- Além disso, ele também permite que os usuários do Tableau se beneficiem da utilidade da linguagem R sem precisar saber a linguagem de fato.
Como o Tableau integra-se com o R?
Funções e modelos R podem ser usados no Tableau criando novos campos calculados que invocam dinamicamente o motor R e passam valores para o R. Esses resultados são então retornados ao Tableau para serem usados em visualizações.
Configurando o Tableau Desktop com R
- Baixe e instale
Rserve
.
Você precisará baixar e instalar o pacote Rserve
para que o Tableau possa conectar e utilizar as funções de script R. No console R, insira os seguintes comandos:
install.packages(“Rserve”) library(Rserve) Rserve() / Rserve(args = ‘ — no-save’)
Conectar o Tableau ao Servidor R
Após a instalação bem-sucedida do Rserve
, abra o Tableau Desktop e siga os passos abaixo.
-
Vá para
Ajuda > Configurações e Preferências e selecione Gerenciar Conexão de Serviço Externo
. -
Insira o nome do servidor como “Localhost” (ou “127.0.0.1”) e uma porta “6311”.
-
Clique no botão “Testar Conexão”. Você deve ver uma mensagem de sucesso. Clique em OK para fechar.

Comece a usar os scripts R no Tableau
Após concluir com êxito as etapas acima, seremos capazes de criar novos campos calculados no Tableau Desktop que utilizam as funções SCRIPT_* para fazer chamadas funcionais em R.
Vamos começar a trabalhar e ver como podemos usar as capacidades do Tableau com R. Vamos usar o dataset integrado Sample Superstore para calcular o Lucro usando o script R e o recurso de arrastar e soltar do Tableau. Depois, vamos comparar os resultados.
Passos
- Abrir o workbook do Tableau e conectar ao conjunto de dados do Sample Superstore.
- Conectar ao Rserve. Uma vez que o Tableau Desktop estiver conectado ao Rserve, ele pode invocar o motor R através de campos calculados.
-
Agora vamos criar um campo calculado chamado Lucro Esperado.
Quatro funções estão disponíveis para uso com R, e todas começam com a palavra script. As funções são:
- SCRIPT_REAL: retorna números reais como resultados
- SCRIPT_STR: retorna uma string
- SCRIPT_INT: retorna inteiros
- SCRIPT_BOOL: retorna booleanos
- Para este exemplo, vamos usar a função SCRIPT_REAL. Vamos criar uma simples
regressão linear
no Tableau.
-
Abra o campo calculado e insira o seguinte script.
SCRIPT_REAL("ajuste <- lm(.arg1 ~ .arg2 + .arg3 + .arg4) ajuste$fitted ", SOMA([Lucro]), MÉDIA([Vendas]), MÉDIA([Quantidade]), MÉDIA([Desconto]))
O script acima se refere ao modelo de regressão linear no R. Este modelo terá uma variável dependente(arg1) e três variáveis independentes(arg2, arg3, arg4). Esses argumentos são apenas placeholders, e quando o script for passado de volta para o R, os argumentos serão substituídos pelas colunas do Tableau que eles correspondem. 5. Insira os campos do Tableau que correspondem a cada uma das variáveis. A variável dependente aqui é o lucro, então colocaremos
SOMA(Lucro)
primeiro, pois isso corresponde ao argumento 1. Da mesma forma, usaremos amédia de preço unitário, média de quantidade por pedido
emédia de desconto
para os outros três argumentos, respectivamente. -
Essas entradas agora serão todas puxadas para o modelo para determinar os níveis esperados de lucro. Estamos agora prontos para usar este cálculo nas visualizações do Tableau. Arraste a categoria para as linhas e depois
Profit
para as colunas. Agora arrasteExpected Profit
para as colunas. -
Agora podemos analisar o modelo para ver como o Lucro esperado calculado em R compara ao lucro real. Podemos continuar a analisar mais à frente arrastando segmentos de clientes para as cores, e agora criamos um gráfico de barras empilhadas que também pode utilizar datas ordenadas para separar os dados por anos ou trimestres.
Atividade Prática

Podemos perguntar por que todas as cálculos acima poderiam ter sido feitos no Tableau sem usar o R. Então, por que passar pelo processo de baixar e configurar o Rserve no Tableau e escrever scripts? O R é uma linguagem potente por causa de sua capacidade de previsão, utilizando amplamente bibliotecas que contêm algoritmos conhecidos facilmente. Imagine como seria bom fazer previsões para nosso negócio no Tableau, chamando um simples script em R e então sendo capaz de incorporá-lo nas visualizações do Tableau.
Tableau e Python
Python é uma linguagem de programação de uso geral amplamente utilizada. Python fornece uma grande quantidade de bibliotecas para realizar análise estatística, modelagem preditiva ou aprendizado de máquina. Conectar o Tableau com o Python é uma das melhores abordagens para análise preditiva. O Tabpy é um pacote desenvolvido para fazer o mesmo. Para permitir que o Tableau aproveite o poder do Python, ele pode ser conectado ao servidor TabPy para executar código Python sobre a marcha e exibir resultados na forma de visualizações.
Como o Tableau se integra com o Python?
Quando usamos o TabPy com o Tableau, podemos definir campos calculados em Python, aproveitando assim o poder de uma grande quantidade de bibliotecas de aprendizado de máquina diretamente de nossas visualizações.
Configurando o Tableau Desktop com Python
Baixe e instale o Tabpy
.
A execução de um código Python dentro de um workbook do Tableau requer um servidor Python para executá-lo. O framework TabPy é o que faz o trabalho. Baixe o TabPy do Github usando o seguinte link. Alternativamente, você pode seguir os passos abaixo:
conda install -c anaconda tabpy-server
Então vá para o diretório que contém o servidor tabpy baixado e execute.
python setp.py
Conectando o Tableau com o TabPy
O próximo passo é conectar o Tableau com o TabPy. Isso pode ser feito indo em Ajuda > Configurações e Desempenho > Gerenciar Conexão de Serviço Externo:

Teste a conexão. Se tudo correr bem, você deverá receber uma mensagem de “conectado com sucesso”.
COMECE A USAR OS SCRIPTS PYTHON NO TABLEAU
A integração do Python com o Tableau é uma funcionalidade muito útil. Vejamos, por exemplo, o problema de Análise de Sentimentos. É um problema comum na comunidade de Aprendizagem Automática e pode ser concluído por vários algoritmos de Aprendizagem Automática. No entanto, usando uma combinação de Tableau e Python, o mesmo pode ser alcançado com apenas algumas linhas de código Python. Os resultados então podem ser visualizados no Tableau para obter insights adicionais. Vamos ver isso com um exemplo(Aproveite o poder do Python no Tableau com TabPy)
Análise de Sentimentos com Tabpy
Nós vamos usar o conjunto de dados de avaliações de celulares, que pode ser baixado de aqui.
Passos:
- Importe o conjunto de dados para o Tableau Desktop
- Conecte-se a Tabpy. Assim que o Tableau Desktop for conectado a
Tabpy
, ele pode chamar o motor Python através de campos calculados. -
Agora vamos criar um campo calculado chamado
Sentiment
da seguinte forma: `SCRIPT_REAL("de vaderSentiment.vaderSentiment importar SentimentIntensityAnalyzer vs = [] analyzer = SentimentIntensityAnalyzer() para i em range(0,len(_arg1)): a = analyzer.polarity_scores(_arg1[i])['compound'] vs.append(a) retornar vs",ATTR([Reviews]))`
Estamos usando a ferramenta de
análise de sentimentos VADER
aqui. É uma ferramenta de análise de sentimentos baseada em léxico e regras que é especificamente ajustada para sentimentos expressos nas redes sociais. Para usar esta ferramenta, você precisará instalá-la primeiro. Por favor, leia mais na página do github. -
Agora, arraste
Avaliações
para as linhas eSentimento
para a carta de Texto e Marcas de Cor e veja a magia acontecendo. Nós obtemos a análise de sentimentos da avaliação sem qualquer constrangimento. Além disso, também fica muito fácil visualizar os resultados. As avaliações positivas estão em ordem crescente de verde, enquanto as negativas estão em vermelho.
Você pode ver claramente o poder trazido pela integração do Tableau com o Python. Com as notas de sentimento disponíveis, podemos trabalhar com elas para explorar detalhes mais a fundo. Por exemplo, como dono de negócios, posso filtrar as críticas negativas e refletir sobre as razões para elas. Também posso filtrar as críticas positivas para ter uma ideia dos produtos que fazem os consumidores felizes.
Tableau e SQL Server
Existe um valor oculto em nossos dados do Microsoft SQL Server que está enterrado sob os relatórios padrão e ferramentas complexas de inteligência de negócios. Tableau fornece insights em qualquer lugar, equipando qualquer pessoa para fazer uma análise visual sofisticada dos dados do SQL Server. Podemos conectar o Tableau ao SQL Server ao vivo para consultas otimizadas e específicas para a plataforma, ou trazer os dados diretamente para o mecanismo analítico do Tableau para aliviar a carga no banco de dados.
O Tableau fornece um conector otimizado e ao vivo para o SQL Server para que possamos criar gráficos, relatórios e painéis de controle trabalhando diretamente com nossos dados. À medida que exploramos nossa análise, o Tableau reconhece qualquer esquema usado no SQL Server, então não precisamos manipular nossos dados.
Vamos percorrer um exemplo ilustrando como conectar o banco de dados do SQL Server ao Tableau Desktop e usá-lo para criar visualizações.
Passos:
- Faça login no SQL Server
- Abra o Tableau Desktop e, em Servidores, conecte-se ao MS SQL.
- Coloque o nome do servidor na caixa de diálogo que se abre e clique em ok. Isso conecta o Tableau ao SQL Server. Selecione o banco de dados desejado. Neste exemplo, escolhemos o salesDB. Podemos então selecionar uma lista de TABELAS também, por exemplo, Sales Log. A tabela é importada para o ambiente do Tableau. Agora podemos optar por extrair todos os dados ou apenas uma parte para uma nova planilha. Podemos até mesmo especificar o número de linhas a extrair.
- Na nova planilha temos os dados extraídos do MS SQL, A partir daí podemos trabalhar com ela como qualquer outra planilha do Tableau.
Atividade Prática:

É assim que podemos facilmente conectar o SQL Server ao Tableau e extrair os dados diretamente nele. O Tableau permite que os usuários alterne as conexões com um clique para aplicar consultas em memória em um conjunto de dados maior.
8. Salvando o trabalho
Tableau Desktop
Para salvar um workbook do Tableau localmente, selecione Arquivo > Salvar. Especifique o nome do arquivo do workbook na caixa de diálogo Salvar Como
. O Tableau salva o arquivo por padrão com a extensão .twb.
Tableau Public
Com o Tableau Public, todas as visualizações e dados são tornados públicos e qualquer pessoa na internet tem acesso a eles. Selecione Servidor > Tableau Public > Salvar no Tableau Public
e insira as credenciais.
Tableau Server
No caso dos dados serem confidenciais e a história precisar ser partilhada com toda a equipe, o Tableau Server é muito útil. Para publicar uma história no Tableau Server, selecione Selecionar Servidor > Publicar Planilha
ou clique em Compartilhar
no menu de ferramentas. Mas certifique-se de criar uma conta primeiro.
Conclusão
Essa é tudo o que precisamos para criar uma boa visualização no Tableau, embora, uma pessoa possa achar que fazendo muito mais revisão em cada estado do que aqui. Portanto, com experiências e prática, o Tableau se torna muito mais familiar e libertará funcionalidades incríveis para nos ajudar a analisar e apresentar dados. Por favor, comente abaixo caso tenha dúvidas ou questões e tenha um Bom Visualizar.
Confira nosso Tutorial de Criação de Visualizações no Tableau usando o conjunto de dados do AirBnB.
Source:
https://www.datacamp.com/tutorial/data-visualisation-tableau