Nosso objetivo como Analistas de Dados é apresentar as insights de nossos dados de forma que toda pessoa que as veja possa compreender suas implicações e como agir nelas claramente.
O Tableau é uma ferramenta de análise e visualização de dados amplamente utilizada na indústria hoje. Muitas empresas até consideram-na essencial para trabalhos relacionados à ciência de dados. A facilidade de uso do Tableau vem do fato de ter uma interface de arrastar e soltar. Esse recurso ajuda a executar tarefas como classificar, comparar e analisar muito facilmente e rapidamente. O Tableau também é compatível com várias fontes, incluindo Excel, SQL Server e repositórios de dados baseados na nuvem, o que o torna uma escolha excelente para Cientistas de Dados.
1. Introdução ao Tableau
Visão Geral
Tableau Software é uma empresa de software sediada em Seattle, Washington que produz produtos de visualização interativa de dados focados em inteligência de negócios. O Tableau foi estabelecido no Departamento de Ciência da Computação da Universidade de Stanford entre 1997 e 2002(Wikipedia)
Os principais produtos oferecidos pelo Tableau são:

Tableau Desktop, Tableau Public e Tableau Online, todos oferecem criação de visualização de dados e a escolha depende do tipo de trabalho.

Neste tutorial, trabalharemos com o Tableau Desktop. O link para a fonte de referência é aqui.
Instalação
Dependendo da escolha do produto, faça o download do software no computador. Após aceitar o acordo de licença, você pode verificar a instalação clicando no ícone do Tableau. Se a seguinte tela aparecer, você está pronto para começar.

2. Começando
Nesta seção, vamos aprender algumas operações básicas no Tableau para nos acostumar com sua interface.
Área de trabalho do Tableau
A área de trabalho do Tableau é uma coleção de planilhas, barra de menu, barra de ferramentas, cartão de marcas, prateleiras e muitos outros elementos sobre os quais vamos aprender nas seções seguintes. As planilhas podem ser planilhas de trabalho, painéis ou histórias. A imagem abaixo destaca os principais componentes da área de trabalho. No entanto, uma familiaridade maior será alcançada quando trabalharmos com dados reais.

Conectando a uma fonte de dados
Para começar a trabalhar com o Tableau, precisamos conectar o Tableau à fonte de dados. O Tableau é compatível com muitas fontes de dados. As fontes de dados suportadas pelo Tableau aparecem no lado esquerdo da tela de abertura. Algumas fontes de dados comumente usadas são o Excel, arquivo de texto, banco de dados relacional ou mesmo em um servidor. Também é possível se conectar a uma fonte de banco de dados na nuvem, como o Google Analytics, Amazon Redshift, etc.
A tela de lançamento do Tableau Desktop mostra as fontes de dados disponíveis às quais se pode conectar. Também depende da versão do Tableau, pois a versão paga oferece mais possibilidades. No lado esquerdo da tela, há um painel Conectar
que destaca as fontes disponíveis. Os tipos de arquivos são listados primeiro, seguidos por tipos de servidor comuns ou os servidores aos quais se conectou recentemente. Você pode abrir planilhas de trabalho previamente criadas sob a guia Abrir
. O Tableau Desktop também fornece algumas planilhas de exemplo sob a guia Planilhas de Exemplo
.
Prática

Conectando ao conjunto de dados Sample-Superstore
Vamos trabalhar com um conjunto de dados de exemplo chamado conjunto de dados do Superstore, que vem pré-carregado com Tableau. No entanto, baixaremos o arquivo de aqui para podermos ter uma ideia de como conectar a um provedor de dados Excel. Os dados são de uma superloja, contendo informações sobre produtos, vendas, lucros, etc. O objetivo de nós, como analistas de dados, é analisar os dados e encontrar áreas críticas de melhoria dentro desta empresa fictícia.
Passos
-
Importar dados para o espaço de trabalho do Tableau do computador.
-
Ao abrir a aba Sheets, três planilhas ficarão visíveis: Orders (Pedidos), People (Pessoas) e Returns (Devoluções). No entanto, nós iremos concentrar apenas nos dados de Pedidos. Duplo clique na planilha de Pedidos, e ela abre como uma planilha de computador.
-
Observamos que as primeiras três linhas de dados parecem estar um pouco diferentes e não estão no formato desejado. Aqui nós usamos o Data Interpreter (Interpretador de Dados), também presente na aba Sheets. Ao clicar nele, obtemos uma planilha formatada adequadamente.
Atividade Prática

Criando uma Visualização
Comenzaremos gerando um gráfico simples. Nesta seção, vamos conhecer nossos dados e começaremos a fazer perguntas sobre os dados para obter insights. Existem alguns termos importantes que vamos encontrar nesta seção.
Dimensão
Medidas
Agregação
Dimensões são dados qualitativos, como um nome ou data. Por padrão, o Tableau automaticamente classifica dados que contêm informações qualitativas ou categóricas como uma dimensão, por exemplo, qualquer campo com valores de texto ou data. Esses campos geralmente aparecem como cabeçalhos de coluna para linhas de dados, como Nome do Cliente ou Data da Ordem, e também definem o nível de granularidade que aparece na visualização.
Medidas são dados numéricos quantitativos. Por padrão, o Tableau trata qualquer campo contendo esse tipo de dado como uma medida, por exemplo, transações de vendas ou lucro. Dados que são classificados como medidas podem ser agregados com base em uma determinada dimensão, por exemplo, vendas totais (Medida) por região (Dimensão).
Agregação é o dado a nível de linha rolado para uma categoria superior, como a soma de vendas ou lucro total.
Tableau ordena automaticamente os campos em Medidas e Dimensões. No entanto, para qualquer anomalia, pode-se alterá-lo manualmente também.
Passos
-
Vá para a planilha. Clique na guia
Sheet 1
no canto inferior esquerdo da área de trabalho do Tableau. -
Uma vez na planilha, a partir de
Dimensões
no painel de Dados, arraste aData da Ordem
para a prateleira de Colunas.Ao arrastar a
Data da Ordem
para a prateleira de colunas, é criada uma coluna para cada ano de Pedidos no conjunto de dados. Um indicador ‘Abc’ é visível sob cada coluna o que implica que dados de texto ou numéricos ou de texto podem ser arrastados aqui. Por outro lado, se arrastássemosVendas
aqui, seria criada uma tabela cruzada que mostraria as vendas totais para cada ano. -
Da mesma forma, na aba
Medidas
, arraste o campoVendas
para a prateleira de Linhas.
O Tableau popula um gráfico com as vendas agregadas como uma soma. As vendas totais agregadas para cada ano por data de pedido são exibidas. O Tableau sempre popula um gráfico de linha para uma visualização que inclui um campo de tempo, que neste exemplo é a Data do Pedido.
Prática

O que o gráfico de linha acima transmite? Bem, ele mostra que as vendas parecem bastante promissoras e parecem estar aumentando com o tempo. Esta é uma percepção valiosa, mas dificilmente diz muito sobre os produtos que estão contribuindo para o aumento das Vendas. Vamos aprofundar mais para obter mais insights.
Refinando a Visualização
Vamos aprofundar e tentar descobrir mais insights sobre quais produtos impulsionam mais vendas. Vamos começar adicionando as categorias de produtos para observar os totais de vendas de uma maneira diferente.
Etapas
-
A categoria
Categoria
está presente no painel Dimensões. Arraste-a para a prateleira de colunas e coloque-a ao lado deYEAR(Data do Pedido)
. A categoriaCategoria
deve ser colocada à direita doAno
. Assim fazendo, a visão muda imediatamente para um tipo de barra de gráfico de linha. O gráfico mostra o total deVendas
de cadaProduto
por ano.Saiba Mais
Para visualizar informações sobre cada ponto de dados (isto é, marca) na visão, passe o cursor sobre uma das barras para revelar um tooltip. O tooltip mostra as vendas totais para essa categoria. Aqui está o tooltip para a categoria de Suprimentos de Escritório em 2016:
Para adicionar rótulos à visão, clique em
Mostrar Rótulos de Marca
no painel de ferramentas.O gráfico de barra também pode ser exibido de forma horizontal em vez de vertical. Clique em
Trocar
no painel de ferramentas para isso.
2. A visualização acima mostra muito bem as vendas
por categoria
, ou seja, mobília, suprimentos de escritório e tecnologia. Também podemos inferir que as vendas de mobília estão crescendo mais rápido do que as de suprimentos de escritório, exceto em 2016. Portanto, será mais esperto concentrar os esforços de venda em mobília em vez de suprimentos de escritório. Mas a mobília é uma categoria vasta e consiste em muitos itens diferentes. Como podemos identificar qual item de mobília está contribuindo para as vendas máximas?
Para nos ajudar a responder a essa pergunta, decidimos olhar para os produtos por Subcategoria
para ver quais itens são os maiores vendedores. Digamos para a categoria Mobília; queremos olhar para detalhes apenas sobre prateleiras, cadeiras, mobiliário e mesas. Vamos clicar duas vezes ou arrastar a dimensão Subcategoria
para a prateleira de Colunas.
A subcategoria é outro campo discreto. Ele desmembra ainda mais a Categoria
e exibe uma barra para cada subcategoria
dividida por categoria e ano. No entanto, é uma quantidade enorme de dados para entender visualmente. Na próxima seção, vamos aprender sobre filtros, cores e outras formas de tornar a visualização mais compreensível.
Ao Vivo

3. Enfatizando os Resultados
Nesta seção, vamos tentar concentrar-nos em resultados específicos. Filtros e cores são maneiras de adicionar mais foco aos detalhes que interessam a nós.
Adicionando filtros à visão
Filtros podem ser usados para incluir ou excluir valores da visão. Aqui, tentamos adicionar dois filtros simples à planilha para torná-la mais fácil de olhar para as vendas de produtos por subcategoria the um ano específico.
Passos
No painel de Dados, na pasta Dimensões, clique com o botão direito em Data de Envio e selecione Exibir Filtro. Repita para o campo Sub->categoria também.

Filtros são do tipo de cartões e podem ser movidos pela simples arrastar e soltar na planilha.
Adicionando cores à visão
Cores podem ser úteis na identificação visual de um padrão.
Passos
No painel de Dados, na pasta Medidas, arraste Lucro para Cores na carta Marcas.

Pode-se ver que as prateleiras, mesas e até mesmo máquinas contribuem para lucro negativo, ou seja, perda. Uma visão poderosa.
Ao Vivo

Principais Achados
Vamos olhar mais de perto nos filtros para descobrir mais sobre os produtos não lucrativos.
Passos
- Na visão, na caixa de filtro de
Sub-Category
, desmarque todas as caixas excetoBookcases
,Tables
, eMachines
. Isto revela um facto interessante. Em alguns anos, asBookcases
e asMachines
foram mesmo lucrativas. No entanto, em 2016, asMachines
tornaram-se não lucrativas. - Selecione
All
na caixa de filtro deSub-Category
para mostrar todas as subcategorias novamente. - Apartir das Dimensões, arraste
Region
para a prateleiraRows
e coloque-o à esquerda da aba Sum(Sales). Notamos que as máquinas no Sul estão a reportar um maior lucro negativo global do que nas outras regiões. - Vamos agora atribuir um nome à folha. No canto inferior esquerdo do espaço de trabalho, clique duas vezes em
Sheet 1
e digiteSales by Product and Region
. - Para preservar a visão, o Tableau permite que nós duplicemos a nossa folha de trabalho para que possamos continuar noutra folha do onde deixámos.
- No seu workbook, clique com o botão direito do rato na folha
Sales by Product and Region
e selecioneDuplicate
e renomeie a folha duplicada paraSales-South
. - Na nova folha, a partir das Dimensões, arraste
Region
para a prateleiraFilters
para adicioná-lo como um filtro na visão. - Na caixa de diálogo Filtro de Região, limpe todas as caixas de verificação exceto Sul e clique em
OK
. Agora podemos concentrar-nos nas vendas e no lucro noSouth
. Descobrimos que as vendas de máquinas tiveram um lucro negativo em 2014 e novamente em 2016. Investigaremos isto na próxima seção. - Finalmente, não esqueça de salvar os resultados selecionando
Arquivo > Salvar Como
. Vamos nomear o nosso planilha de trabalho comoVendas e Lucros Regionais
.
Ambiente de Trabalho

4. Visão de Mapa
Criação de uma Visão de Mapa
Visões de mapa são úteis quando estamos olhando para dados geográficos (o campo Região). No exemplo atual, o Tableau automaticamente reconhece que os campos País, Estado, Cidade e Código Postal contêm informações geográficas.
Passos
- Crie uma nova planilha.
- Adicione
Estado
ePaís
sob a painel de Dados paraDetalhe
na carta de Marcas. Obtemos a visão de mapa. - Arraste
Região
para o estante deFiltros
, e em seguida, filtre apenas parasul
. A visão de mapa agora amplia apenas para a região sul, e um marcador representa cada estado. - Arraste a medida
Vendas
para a abaCor
na carta de Marcas. Obtemos um mapa preenchido com as cores mostrando o intervalo de vendas em cada estado. - Podemos alterar o esquema de cores clicando em
Cor
na carta de Marcas e selecionandoEditar Cores
. Podemos experimentar com as paletas disponíveis. - Observamos que Flórida está performando melhor em relação às Vendas. Se passarmos o cursor sobre Flórida, mostra que houve uma venda total de 89.474 dólares, enquanto o Carolina do Sul, por exemplo, apenas teve 8.482 dólares em vendas. Vamos avaliar o desempenho por
Lucro
agora, já que o Lucro é um melhor indicador do que as vendas sozinhas. - Arraste
Lucro
atéCor
na carta de Marcas. Agora vemos que o Tennessee, Carolina do Norte e Flórida têm lucro negativo, mesmo que parecesse que estavam fazendo bem em Vendas. Renomeie a planilha como Mapa de Lucro
Mãos na Massa

Avançando nas Detalhes
Mapas nos permitem visualizar os dados de forma ampla. No passo anterior, descobrimos que o Tennessee, Carolina do Norte e Flórida têm lucro negativo. Nesta seção, vamos desenhar um gráfico de barras para explorar a razão para o lucro negativo.
Passos
-
Copie a planilha Mapa de Lucro e nomeie-a Gráfico de Barras de Lucro Negativo.
-
Clique em
Mostrar-me
na planilha Gráfico de Barras de Lucro Negativo.Mostrar-me
apresenta o número de formas em que um gráfico pode ser plotado entre itens mencionados na planilha. DeMostrar-me
, selecione a opção de barras horizontais e a visualização atualiza instantaneamente de barras verticais para horizontais. -
Nós podemos selecionar mais de uma barra de uma vez simplesmente clicando e arrastando o cursor sobre elas. Nós queremos concentrar apenas em três estados, ou seja, Tennessee, North Carolina e Florida. Portanto, nós selecionaremos apenas as barras referentes a eles.
Saiba Mais
Criando Hierarquias
Hierarquias são úteis quando nós queremos agrupar campos semelhantes para que nós possamos percorrer rapidamente entre níveis na visualização.- Na área de Dados, arraste um campo e solte-o diretamente em cima de outro campo ou clique com o botão direito do mouse no campo e selecione
- Arraste quaisquer campos adicionais para a hierarquia. Campos também podem ser reordenados na hierarquia simplesmente arrastando-os para uma nova posição. Na visualização atual, nós criaremos as seguintes hierarquias: Localização, Ordem e Produto.
-
No painel de Linhas, clique no ícone em formato de plus no campo
Estado
para realizar a divisão até o nívelCidade
.- Isso é muito dado. Podemos usar o
N-Filter
para filtrar e revelar os piores desempenhos. Para isso, arraste oCidade
do painel de Dados para a estante de Filtros. Clique no campo Por e depois clique no botão de dropdownTop
e selecioneBottom
para revelar os piores desempenhos. digite 5 no campo de texto para mostrar os 5 piores desempenhos no conjunto de dados.
- Isso é muito dado. Podemos usar o
Atualmente vemos que Jacksonville e Miami, Flórida; Burlington, Carolina do Norte; e Knoxville e Memphis, Tennessee são as cidades com pior desempenho por lucro. Há outra marca na visualização – Jacksonville, Carolina do Norte – que não pertence aqui, pois tem vendas lucrativas. Isso significa que há um problema no filtro que aplicamos. Vamos usar a ajuda das Operações de Ordem do Tableau.
-
No estante de Filtros, clique com o botão direito no conjunto de Inclusões (País, Estado) e selecione
Adicionar ao Contexto
. Vemos agora que Concord(Carolina do Norte) aparece na visualização enquanto Miami(Flórida) desapareceu. Isso faz sentido agora. -
Mas Jacksonville (Carolina do Norte) ainda está presente, o que é incorreto. No estante de Linhas, clique no ícone em forma de mais na guia
Cidade
para fazer um drill down ao nível do Código Postal. Clique com o botão direito no código postal para Jacksonville, NC, 28540, e selecioneExcluir
para excluir manualmente Jacksonville. -
Arraste o Código Postal da prateleira de Linhas. Essa é a visualização final.
Atividade Prática

Conclusões Chave
Concentremo-nos agora apenas nas entidades com perdas, ou seja, os Produtos, e também identifiquemos os locais onde esses produtos são vendidos.
Passos
- Arraste
Sub-Categoria
para as Linhas para fazer um drill down mais a fundo. - Da mesma forma, arraste
Lucro
paraCor
no cartão de Marcas. Isso nos permite localizar rapidamente os produtos com lucro negativo. - Clique com o botão direito do mouse em
Data da Ordem
e selecioneMostrar Filtro
. Parece que Máquinas, mesas e grampos estão se saindo mal. Então o que devemos fazer? Uma solução seria parar a venda desses produtos em Jacksonville, Concord, Burlington, Knoxville e Memphis? Vamos verificar se nossa decisão está correta. - Vamos voltar à guia
Mapa de Lucro
criada anteriormente. - Agora, clique no campo
Sub-Category
para selecionar a opçãoShow Filter
. - Arraste o
Profit
de baixo deMeasures
para a carta deLabel
Marcas. - Novamente, clique no
Order Date
e selecioneShow Filter
. Na filtragem, vamos apagar os itens que achamos que estão contribuindo para o lucro negativo. Então, desmarque as caixas na frente de Binders, Machines e Tables, respectivamente. Agora, só temos as entidades que estão fazendo lucro. Isto mostra que as entidades como Binders, máquinas e mesas estavam causando prejuízos em algumas áreas e nós estávamos certos em nossos achados.
Hands On
5. Painel
Um painel é uma coleção de várias visões, que permite que você compare uma variedade de dados simultaneamente.
Criando um Painel
Passos
- Clique no botão
Novo painel
. - Arraste
Vendas no Sul
para o painel vazio. - Arraste
Mapa de Lucro
para o painel e solte-o no topo da visão Vendas no Sul. Ambas as visões podem ser vistas ao mesmo tempo. Para poder apresentar dados de uma maneira que outros possam entender, podemos organizar o painel da forma que preferirmos. - No worksheet
Vendas Sul
no modo de painel, clique sob oRegion
e apague a opçãoShow Header
. Repita o mesmo processo para todas as outras headers. Isto ajuda a destacar apenas o que é necessário e a esconder informações menos importantes. - Na
Mapa de Lucros
, esconda também o título e execute os mesmos passos para o mapaVendas Sul
. - Podemos ver que a carta de filtro de
Sub-Categoria
e a data deAno da Ordem de Compra
foram repetidas no lado direito. Vamos eliminar o extra simplesmente marcando-os com um X. Em seguida, clique naAno da Ordem de Compra
. Uma seta de queda aparece e selecione a opção deValor único (Slider)
. Agora deixe a magia acontecer. Experimente selecionar anos diferentes no slider e as vendas também variam de acordo. - Arraste o filtro
SUM(Profit)
para o fundo do painel abaixo das vendas no Sul para uma melhor visão.
Mãos na Massa

Adicionando Interatividade
Para tornar o painel mais interativo, como ver quais sub-categorias são lucrativas em quais estados, precisamos fazer algumas mudanças.
Passos
- Vamos começar com o
Mapa de Lucros
. Ao clicar no mapa, um ícone deUsar como filtro
aparece no canto superior direito. Clique nele. Se selecionarmos qualquer mapa, as vendas correspondentes a esse estado serão destacadas no mapaVendas Sul
. - Para o
Ano da Ordem de Compra
, clique na opção de queda e vá paraAplicar a Planilhas > Planilhas Selecionadas
. Uma caixa de diálogo abre. Selecione a opçãoTodos
seguida deOK
. O que essa opção faz? Aplica filtros a todas as planilhas que usam a mesma fonte de dados. - Explore e experimente. Na visualização abaixo, podemos filtrar o mapa
Vendas Sul
para ver produtos que estão sendo vendidos apenas na Carolina do Norte. Podemos então explorar facilmente os lucros anualmente. - Renomeie o Dashboard para
Vendas Regionais e Lucros
.
Prática

Portanto, vender máquinas na Carolina do Norte não trouxe nenhum lucro à empresa.
6. História
Um dashboard é um recurso legal, mas o Tableau também nos oferece a oportunidade de apresentar nossos resultados no modo de apresentação sob a forma de histórias, sobre as quais discutiremos nesta seção.
Construindo uma História
Passos
- Clique no botão
Nova história
. - Na aba História do lado esquerdo, arraste a planilha
Vendas no Sul
(criada anteriormente) para a visualização. - Edite o texto na caixa cinza acima da planilha. Este é o subtítulo. Nomeie-o como
Vendas e lucro por ano
. - As histórias são bastante específicas. Aqui vamos contar uma história sobre a venda de máquinas na Carolina do Norte. Na aba História, clique em
Duplicar
para duplicar o primeiro subtítulo, ou você pode até criar um novo. - Na
Subcategoria
, filtreselecione
apenasMáquinas
. Isso ajuda a medir as vendas e os lucros de máquinas por ano. - Renomeie o subtítulo para
Vendas e lucro de máquinas por ano
.
Prática

Fazendo uma Conclusão
As máquinas na Carolina do Norte estão levando à perda de lucro. No entanto, isso não pode ser demonstrado olhando para o Lucro e Vendas no todo. Para isso, precisamos de Lucro regional.
Passos
- No painel de História, selecione
Em branco
. Arraste o painel já criadoVendas e Lucro Regionais
para a tela. - Legendá-lo como
Itens de baixo desempenho no Sul
. - Selecione
Duplicar
para criar outro ponto de história com o painel de Lucro Regional. Selecione a Carolina do Norte no gráfico de barras, pois estamos interessados em mostrar mais sobre ela. - Selecione Todos os anos.
- Adicione uma legenda para maior clareza, como,
Lucro em NC: 2013-2016
. - Selecione qualquer ano como 2014. Adicione uma legenda, por exemplo,
Lucro em NC: 2014
e clique na guia Duplicar. Repita o mesmo passo para todos os anos restantes. - Clique no modo de apresentação e deixe a
história
se desenrolar.
Hands On

Agora temos uma ideia sobre quais produtos foram introduzidos no mercado da Carolina do Norte quando e como eles se performaram. Não só identificamos uma forma de abordar o lucro negativo, mas também conseguimos apoiá-lo com dados com sucesso. Essa é a vantagem da História no Tableau.
7. A integração do Tableau com R, Python & SQL
Além das várias vantagens de visualização que o Tableau oferece, ele também possui habilidades impressionantes de conexão prontas para uso. O Tableau pode integrar facilmente com linguagens como Python e R e até mesmo com SGBD como SQL. Isso oferece vantagens crescentes em termos de funcionalidades e é útil para Cientistas de Dados que estão acostumados a trabalhar em Python ou R. Eles podem importar diretamente os scripts R e Python no Tableau e tirar proveito de suas visualizações, que são muito superiores às destas linguagens. Além disso, as capacidades de visualização do Tableau são fáceis de usar e muito intuitivas, economizando muito tempo para os Cientistas de Dados.
Nesta seção, veremos como podemos conectar o Tableau com estas fontes externas e as vantagens dessas conexões.
Tableau e R
O R é uma linguagem estatística popular usada para realizar análises preditivas sofisticadas, como modelagem linear e não-linear, testes estatísticos, análise de séries temporais, classificação, agrupamento, etc.(Tableau 8.1 e R) Usar o Tableau em conjunto com o R tem as seguintes vantagens:
- Levanta o poder estatístico do Tableau, dando a seus usuários acesso a sofisticadas bibliotecas do R para obter insights mais profundos e melhores a partir dos dados.
- As opções aprimoradas de exploração de dados do Tableau e a habilidade de conectar a várias fontes são úteis para os usuários do R.
- Além disso, ele também permite que os usuários do Tableau se beneficiem da utilidade da linguagem R sem precisar realmente saber a linguagem.
Como o Tableau se integra com o R?
Funções e modelos R podem ser usados no Tableau criando novos campos calculados que invocam dinamicamente o motor R e passam valores para o R. Esses resultados são então retornados ao Tableau para serem usados com fins de visualização.
Configurando o Tableau Desktop com R
- Baixe e instale o
Rserve
.
Você precisará baixar e instalar o pacote Rserve
para que o Tableau possa conectar e utilizar as funções de script R. No console R, insira os seguintes comandos:
install.packages(“Rserve”) library(Rserve) Rserve() / Rserve(args = ‘ — no-save’)
Conecte o Tableau ao Servidor R
Após o Rserve
ser instalado com sucesso, abra o Tableau Desktop e siga os passos mencionados abaixo.
-
Vá para
Ajuda > Configurações e Preferências e selecione Gerenciar Conexão de Serviço Externo
. -
Insira o nome do servidor como “Localhost” (ou “127.0.0.1”) e uma porta “6311”.
-
Clique no botão “Testar Conexão”. Você verá uma mensagem de sucesso. Clique em OK para fechar.

Comece a usar os scripts R no Tableau
Após concluir os passos acima com sucesso, será possível criar novos campos calculados no Tableau Desktop que usam as funções SCRIPT_* para fazer chamadas funcionais a R.
Vamos começar o trabalho e ver como podemos usar as capacidades do Tableau com R.Vamos utilizar o conjunto de dados interno Sample Superstore para calcular o Lucro, tanto usando o script R quanto usando a funcionalidade de arrastar e soltar do Tableau. Depois, compararemos ambos os resultados.
Passos
- Abra o planilha do Tableau e conecte-se aos dados do Sample Superstore.
- Conecte-se a Rserve. Assim que o Tableau Desktop estiver conectado a Rserve, ele pode chamar o motor R através de campos calculados.
-
Agora criaremos um campo calculado chamado Lucro Esperado.
Há quatro funções disponíveis para uso com R, e todas começam com a palavra script. As funções são:
- SCRIPT_REAL: retorna números reais como resultado
- SCRIPT_STR: retorna string
- SCRIPT_INT : retorna inteiros
- SCRIPT_BOOL: retorna booleanos
- Para este exemplo, vamos usar a função SCRIPT_REAL. Vamos criar um simples
regressão linear
no Tableau.
-
Abra o campo calculado e insira o seguinte script.
SCRIPT_REAL("fit <- lm(.arg1 ~ .arg2 + .arg3 + .arg4) fit$fitted ", SUM([Lucro]), AVG([Vendas]), AVG([Quantidade]), AVG([Desconto]))
O script acima refere-se ao modelo de regressão linear no R. Este modelo terá uma variável dependente(arg1) e três variáveis independentes(arg2, arg3, arg4). Esses argumentos são apenas espaços reservados, e quando o script for passado para o R, os argumentos serão substituídos pelas colunas do Tableau que correspondem a eles. 5. Insira os campos do Tableau que correspondem a cada uma das variáveis. A variável dependente aqui é o lucro, então colocaremos
SUM(Lucro)
primeiro, já que corresponde ao argumento 1. Da mesma forma, usaremos amédia de preço unitário, média de quantidade por pedido
emédia de desconto
para os outros três argumentos, respectivamente. -
Estas entradas agora serão todas integradas ao modelo para determinar os níveis esperados de lucro. Agora estamos prontos para usar este cálculo nas visualizações do Tableau. Arraste a categoria para as linhas e então
Profit
para as colunas. Agora arrasteLucro Esperado
para as colunas. -
Agora podemos analisar o modelo para ver como o Lucro esperado calculado em R compara com os lucros reais. Podemos continuar a analisar mais ainda ao transferir segmentos de clientes para as cores e agora criamos um gráfico de barras empilhado que também pode utilizar datas ordenadas para quebrar os dados por anos ou trimestres.
Hands On

Podemos perguntar por que todas as cálculos acima poderiam ter sido feitos no Tableau sem usar o R. Então, por que deveríamos passar pelo processo de baixar e configurar o Rserve no Tableau e escrever scripts? O R é uma linguagem poderosa por causa de sua capacidade de previsão, utilizando amplamente bibliotecas que contêm algoritmos conhecidos facilmente. Imagine como seria bom fazer previsões para nosso negócio no Tableau, chamando um simples script em R e então conseguir incorporá-lo nas visualizações do Tableau.
Tableau e Python
Python é uma linguagem de programação de uso geral amplamente utilizada. Python fornece uma grande quantidade de bibliotecas para realizar análise estatística, modelagem preditiva ou aprendizado de máquina. A conexão do Tableau com o Python é uma das melhores abordagens para análise preditiva. O Tabpy é um pacote desenvolvido para fazer o mesmo. Para permitir que o Tableau aproveite o poder do Python, ele pode ser conectado ao servidor TabPy para executar código Python rapidamente e exibir resultados sob a forma de visualizações.
Como o Tableau se integra com o Python?
Quando usamos o TabPy com o Tableau, podemos definir campos calculados em Python, aproveitando assim o poder de uma grande quantidade de bibliotecas de aprendizado de máquina diretamente de nossas visualizações.
Configurando o Tableau Desktop com Python
Baixe e instale o Tabpy
.
A execução de um código Python dentro de um livro de trabalho do Tableau requer um servidor Python para executá-lo. O framework TabPy é o que faz o trabalho. Baixe o TabPy do Github usando o seguinte link. Alternativamente, você pode seguir os passos abaixo:
conda install -c anaconda tabpy-server
Então, vá para o diretório que contém o servidor tabpy baixado e execute.
python setp.py
Conectando o Tableau com o TabPy
O próximo passo é conectar o Tableau com o TabPy. Isso pode ser feito indo em Ajuda > Configurações e Desempenho > Gerenciar Conexão de Serviço Externo:

Teste a conexão. Se tudo correr bem, você deverá receber uma mensagem de “conectado com sucesso”.
Comece a usar os scripts Python no Tableau.
A integração do Python no Tableau é uma funcionalidade muito útil. Tomemos, por exemplo, o problema da Análise de Sentimento. É um problema comum na comunidade de Machine Learning e pode ser alcançado por meio de vários Algoritmos de aprendizado de máquina. No entanto, usando uma combinação de tableau e Python, o mesmo pode ser alcançado em poucas linhas de código Python. Os resultados podem então ser visualizados no Tableau para insights adicionais. Vamos ver isso com um exemplo(Aproveite o poder do Python no Tableau com o TabPy)
Análise de Sentimento com Tabpy
Utilizaremos o conjunto de dados de avaliações de celular que pode ser baixado de aqui.
Passos:
- Importe o conjunto de dados para o Tableau Desktop
- Conecte ao Tabpy. Uma vez que o Tableau Desktop esteja conectado ao
Tabpy
, ele pode invocar o motor do Python através de campos calculados. -
Agora vamos criar um campo calculado chamado
Sentiment
da seguinte forma: `SCRIPT_REAL`
Estamos usando a ferramenta
VADER sentiment analysis
aqui. É uma ferramenta de análise de sentimentos baseada em léxico e regras que é especificamente ajustada para sentimentos expressos em mídias sociais. Para usar esta ferramenta, você precisará instalá-la primeiro. Por favor, leia mais na página do github deles. -
Agora, arraste
Revisões
para as linhas eSentimento
para a carta de Texto e Marcas de Cor e veja a magia acontecendo. Nós obtemos a análise de sentimentos da revisão sem qualquer problema. Além disso, também fica super fácil visualizar os resultados. As avaliações positivas estão em ordem crescente de verde, enquanto as negativas estão em vermelho.
Os exemplos acima mostram claramente o poder trazido pela integração do Tableau com o Python. Ao termos as notas de Sentimento à nossa disposição, podemos trabalhar com elas para ir mais fundo nos detalhes. Por exemplo, como um proprietário de negócios, posso filtrar as críticas negativas e refletir sobre as razões para isso. Também posso filtrar as críticas positivas para ter uma ideia sobre os produtos que fazem os consumidores felizes.
Tableau e SQL Server
Existe um valor oculto em nossos dados do Microsoft SQL Server que está enterrado sob os relatórios padrões e ferramentas complexas de inteligência de negócios. O Tableau fornece insights em qualquer lugar, equipando qualquer pessoa para fazer uma análise visual sofisticada de dados do SQL Server. Podemos conectar o Tableau ao SQL Server em tempo real para consultas específicas da plataforma, ou trazer diretamente os dados para o motor analítico do Tableau para aliviar a carga no banco de dados.
O Tableau fornece um conector otimizado e em tempo real para o SQL Server, para que possamos criar gráficos, relatórios e painéis de controle trabalhando diretamente com nossos dados. À medida que vamos fundo em nossa análise, o Tableau reconhece qualquer esquema usado no SQL Server, então não precisamos manipular nossos dados.
Vamos percorrer um exemplo mostrando como conectar o banco de dados do SQL Server ao Tableau Desktop e então usá-lo para criar visualizações.
Passos:
- Faça login no SQL Server
- Abra o Tableau Desktop e, sob Servidores, conecte-se ao MS SQL.
- Coloque o nome do servidor na caixa de diálogo que abre e clique em OK. Isto conecta o Tableau ao SQL Server. Selecione o banco de dados de preferência. Neste exemplo, escolhemos o salesDB. Podemos então selecionar de uma lista de TABELAS também, por exemplo, Sales Log. A tabela é importada para o ambiente do Tableau. Agora, podemos escolher extrair toda a informação ou apenas uma parte dela para uma nova planilha. Até podemos especificar o número de linhas a serem extraídas.
- Na nova planilha, temos os dados extraídos do MS SQL. A partir daqui, podemos trabalhar com eles como com qualquer outra planilha do Tableau.
Hands On:

Este é o modo como podemos conectar o SQL Server ao Tableau e extrair dados diretamente para ele. O Tableau permite que os usuários alternem conexões com um clique para aplicar consultas em memória a um conjunto de dados maior.
8. Salvar o trabalho
Tableau Desktop
Para salvar um workbook do Tableau localmente, selecione Arquivo > Salvar. Especifique o nome do arquivo do workbook na caixa de diálogo Salvar como
. Por padrão, o Tableau salva o arquivo com a extensão .twb.
Tableau Public
Com o Tableau Public, todas as visualizações e dados são publicados e qualquer pessoa na internet tem acesso a eles. Selecione Servidor > Tableau Public > Salvar no Tableau Public
e insira as credenciais.
Tableau Server
No caso do dado ser confidencial e a história precisar ser partilhada com toda a equipe, o Tableau Server é muito útil. Para publicar uma história no Tableau Server, selecione Selecionar Servidor > Publicar Workbook
ou clique em Compartilhar
no painel de ferramentas. Mas certifique-se de criar uma conta primeiro.
Conclusão
Essa é tudo o que precisamos para criar uma boa visualização no Tableau, embora, uma pessoa possa achar que precisa fazer muito mais revisão em cada estado do que aqui. Portanto, com experiências e prática, o Tableau se torna muito mais familiar e liberará funcionalidades impressionantes para ajudá-nos a analisar e apresentar dados. Por favor, comente abaixo em caso de quaisquer questões ou perguntas e Feliz Visualização.
Conheça nosso Tutorial de Criação de Visualizações no Tableau usando o conjunto de dados do AirBnB.
Source:
https://www.datacamp.com/tutorial/data-visualisation-tableau