Visualização de Dados com Tableau

Nosso objetivo como Analistas de Dados é apresentar as insights de nossos dados de forma que toda pessoa que as veja possa compreender suas implicações e como agir nelas claramente.

O Tableau é uma ferramenta de análise e visualização de dados amplamente utilizada na indústria hoje. Muitas empresas até consideram-na essencial para trabalhos relacionados à ciência de dados. A facilidade de uso do Tableau vem do fato de ter uma interface de arrastar e soltar. Esse recurso ajuda a executar tarefas como classificar, comparar e analisar muito facilmente e rapidamente. O Tableau também é compatível com várias fontes, incluindo Excel, SQL Server e repositórios de dados baseados na nuvem, o que o torna uma escolha excelente para Cientistas de Dados.

1. Introdução ao Tableau

Visão Geral

Tableau Software é uma empresa de software sediada em Seattle, Washington que produz produtos de visualização interativa de dados focados em inteligência de negócios. O Tableau foi estabelecido no Departamento de Ciência da Computação da Universidade de Stanford entre 1997 e 2002(Wikipedia)

Os principais produtos oferecidos pelo Tableau são:

Tableau Desktop, Tableau Public e Tableau Online, todos oferecem criação de visualização de dados e a escolha depende do tipo de trabalho.

Instalação

Dependendo da escolha do produto, faça o download do software no computador. Após aceitar o acordo de licença, você pode verificar a instalação clicando no ícone do Tableau. Se a seguinte tela aparecer, você está pronto para começar.

2. Começando

Nesta seção, vamos aprender algumas operações básicas no Tableau para nos acostumar com sua interface.

Área de trabalho do Tableau

A área de trabalho do Tableau é uma coleção de planilhas, barra de menu, barra de ferramentas, cartão de marcas, prateleiras e muitos outros elementos sobre os quais vamos aprender nas seções seguintes. As planilhas podem ser planilhas de trabalho, painéis ou histórias. A imagem abaixo destaca os principais componentes da área de trabalho. No entanto, uma familiaridade maior será alcançada quando trabalharmos com dados reais.

source:Tableau.com

Conectando a uma fonte de dados

Para começar a trabalhar com o Tableau, precisamos conectar o Tableau à fonte de dados. O Tableau é compatível com muitas fontes de dados. As fontes de dados suportadas pelo Tableau aparecem no lado esquerdo da tela de abertura. Algumas fontes de dados comumente usadas são o Excel, arquivo de texto, banco de dados relacional ou mesmo em um servidor. Também é possível se conectar a uma fonte de banco de dados na nuvem, como o Google Analytics, Amazon Redshift, etc.

A tela de lançamento do Tableau Desktop mostra as fontes de dados disponíveis às quais se pode conectar. Também depende da versão do Tableau, pois a versão paga oferece mais possibilidades. No lado esquerdo da tela, há um painel Conectar que destaca as fontes disponíveis. Os tipos de arquivos são listados primeiro, seguidos por tipos de servidor comuns ou os servidores aos quais se conectou recentemente. Você pode abrir planilhas de trabalho previamente criadas sob a guia Abrir. O Tableau Desktop também fornece algumas planilhas de exemplo sob a guia Planilhas de Exemplo.

Prática

Conectando ao conjunto de dados Sample-Superstore

Vamos trabalhar com um conjunto de dados de exemplo chamado conjunto de dados do Superstore, que vem pré-carregado com Tableau. No entanto, baixaremos o arquivo de aqui para podermos ter uma ideia de como conectar a um provedor de dados Excel. Os dados são de uma superloja, contendo informações sobre produtos, vendas, lucros, etc. O objetivo de nós, como analistas de dados, é analisar os dados e encontrar áreas críticas de melhoria dentro desta empresa fictícia.

Passos

  1. Importar dados para o espaço de trabalho do Tableau do computador.

  2. Ao abrir a aba Sheets, três planilhas ficarão visíveis: Orders (Pedidos), People (Pessoas) e Returns (Devoluções). No entanto, nós iremos concentrar apenas nos dados de Pedidos. Duplo clique na planilha de Pedidos, e ela abre como uma planilha de computador.

  3. Observamos que as primeiras três linhas de dados parecem estar um pouco diferentes e não estão no formato desejado. Aqui nós usamos o Data Interpreter (Interpretador de Dados), também presente na aba Sheets. Ao clicar nele, obtemos uma planilha formatada adequadamente.

Atividade Prática

Criando uma Visualização

Comenzaremos gerando um gráfico simples. Nesta seção, vamos conhecer nossos dados e começaremos a fazer perguntas sobre os dados para obter insights. Existem alguns termos importantes que vamos encontrar nesta seção.

Dimensão

Medidas

Agregação

Dimensões são dados qualitativos, como um nome ou data. Por padrão, o Tableau automaticamente classifica dados que contêm informações qualitativas ou categóricas como uma dimensão, por exemplo, qualquer campo com valores de texto ou data. Esses campos geralmente aparecem como cabeçalhos de coluna para linhas de dados, como Nome do Cliente ou Data da Ordem, e também definem o nível de granularidade que aparece na visualização.

Medidas são dados numéricos quantitativos. Por padrão, o Tableau trata qualquer campo contendo esse tipo de dado como uma medida, por exemplo, transações de vendas ou lucro. Dados que são classificados como medidas podem ser agregados com base em uma determinada dimensão, por exemplo, vendas totais (Medida) por região (Dimensão).

Agregação é o dado a nível de linha rolado para uma categoria superior, como a soma de vendas ou lucro total.

Tableau ordena automaticamente os campos em Medidas e Dimensões. No entanto, para qualquer anomalia, pode-se alterá-lo manualmente também.

Passos

  1. Vá para a planilha. Clique na guia Sheet 1 no canto inferior esquerdo da área de trabalho do Tableau.

  2. Uma vez na planilha, a partir de Dimensões no painel de Dados, arraste a Data da Ordem para a prateleira de Colunas.

    Ao arrastar a Data da Ordem para a prateleira de colunas, é criada uma coluna para cada ano de Pedidos no conjunto de dados. Um indicador ‘Abc’ é visível sob cada coluna o que implica que dados de texto ou numéricos ou de texto podem ser arrastados aqui. Por outro lado, se arrastássemos Vendas aqui, seria criada uma tabela cruzada que mostraria as vendas totais para cada ano.

  3. Da mesma forma, na aba Medidas, arraste o campo Vendas para a prateleira de Linhas.

O Tableau popula um gráfico com as vendas agregadas como uma soma. As vendas totais agregadas para cada ano por data de pedido são exibidas. O Tableau sempre popula um gráfico de linha para uma visualização que inclui um campo de tempo, que neste exemplo é a Data do Pedido.

Prática

O que o gráfico de linha acima transmite? Bem, ele mostra que as vendas parecem bastante promissoras e parecem estar aumentando com o tempo. Esta é uma percepção valiosa, mas dificilmente diz muito sobre os produtos que estão contribuindo para o aumento das Vendas. Vamos aprofundar mais para obter mais insights.

Refinando a Visualização

Vamos aprofundar e tentar descobrir mais insights sobre quais produtos impulsionam mais vendas. Vamos começar adicionando as categorias de produtos para observar os totais de vendas de uma maneira diferente.

Etapas

  1. A categoria Categoria está presente no painel Dimensões. Arraste-a para a prateleira de colunas e coloque-a ao lado de YEAR(Data do Pedido). A categoria Categoria deve ser colocada à direita do Ano. Assim fazendo, a visão muda imediatamente para um tipo de barra de gráfico de linha. O gráfico mostra o total de Vendas de cada Produto por ano.

    Saiba Mais

    Para visualizar informações sobre cada ponto de dados (isto é, marca) na visão, passe o cursor sobre uma das barras para revelar um tooltip. O tooltip mostra as vendas totais para essa categoria. Aqui está o tooltip para a categoria de Suprimentos de Escritório em 2016:

    Para adicionar rótulos à visão, clique em Mostrar Rótulos de Marca no painel de ferramentas.

    O gráfico de barra também pode ser exibido de forma horizontal em vez de vertical. Clique em Trocar no painel de ferramentas para isso.

 2. A visualização acima mostra muito bem as vendas por categoria, ou seja, mobília, suprimentos de escritório e tecnologia. Também podemos inferir que as vendas de mobília estão crescendo mais rápido do que as de suprimentos de escritório, exceto em 2016. Portanto, será mais esperto concentrar os esforços de venda em mobília em vez de suprimentos de escritório. Mas a mobília é uma categoria vasta e consiste em muitos itens diferentes. Como podemos identificar qual item de mobília está contribuindo para as vendas máximas?

Para nos ajudar a responder a essa pergunta, decidimos olhar para os produtos por Subcategoria para ver quais itens são os maiores vendedores. Digamos para a categoria Mobília; queremos olhar para detalhes apenas sobre prateleiras, cadeiras, mobiliário e mesas. Vamos clicar duas vezes ou arrastar a dimensão Subcategoria para a prateleira de Colunas.

A subcategoria é outro campo discreto. Ele desmembra ainda mais a Categoria e exibe uma barra para cada subcategoria dividida por categoria e ano. No entanto, é uma quantidade enorme de dados para entender visualmente. Na próxima seção, vamos aprender sobre filtros, cores e outras formas de tornar a visualização mais compreensível.

Ao Vivo

3. Enfatizando os Resultados

Nesta seção, vamos tentar concentrar-nos em resultados específicos. Filtros e cores são maneiras de adicionar mais foco aos detalhes que interessam a nós.

Adicionando filtros à visão

Filtros podem ser usados para incluir ou excluir valores da visão. Aqui, tentamos adicionar dois filtros simples à planilha para torná-la mais fácil de olhar para as vendas de produtos por subcategoria the um ano específico.

Passos

No painel de Dados, na pasta Dimensões, clique com o botão direito em Data de Envio e selecione Exibir Filtro. Repita para o campo Sub->categoria também.

Filtros são do tipo de cartões e podem ser movidos pela simples arrastar e soltar na planilha.

Adicionando cores à visão

Cores podem ser úteis na identificação visual de um padrão.

Passos

No painel de Dados, na pasta Medidas, arraste Lucro para Cores na carta Marcas.

Pode-se ver que as prateleiras, mesas e até mesmo máquinas contribuem para lucro negativo, ou seja, perda. Uma visão poderosa.

Ao Vivo

Principais Achados

Vamos olhar mais de perto nos filtros para descobrir mais sobre os produtos não lucrativos.

Passos

  1. Na visão, na caixa de filtro de Sub-Category, desmarque todas as caixas exceto Bookcases, Tables, e Machines. Isto revela um facto interessante. Em alguns anos, as Bookcases e as Machines foram mesmo lucrativas. No entanto, em 2016, as Machines tornaram-se não lucrativas.
  2. Selecione All na caixa de filtro de Sub-Category para mostrar todas as subcategorias novamente.
  3. Apartir das Dimensões, arraste Region para a prateleira Rows e coloque-o à esquerda da aba Sum(Sales). Notamos que as máquinas no Sul estão a reportar um maior lucro negativo global do que nas outras regiões.
  4. Vamos agora atribuir um nome à folha. No canto inferior esquerdo do espaço de trabalho, clique duas vezes em Sheet 1 e digite Sales by Product and Region.
  5. Para preservar a visão, o Tableau permite que nós duplicemos a nossa folha de trabalho para que possamos continuar noutra folha do onde deixámos.
  6. No seu workbook, clique com o botão direito do rato na folha Sales by Product and Region e selecione Duplicate e renomeie a folha duplicada para Sales-South.
  7. Na nova folha, a partir das Dimensões, arraste Region para a prateleira Filters para adicioná-lo como um filtro na visão.
  8. Na caixa de diálogo Filtro de Região, limpe todas as caixas de verificação exceto Sul e clique em OK. Agora podemos concentrar-nos nas vendas e no lucro no South. Descobrimos que as vendas de máquinas tiveram um lucro negativo em 2014 e novamente em 2016. Investigaremos isto na próxima seção.
  9. Finalmente, não esqueça de salvar os resultados selecionando Arquivo > Salvar Como. Vamos nomear o nosso planilha de trabalho como Vendas e Lucros Regionais.

Ambiente de Trabalho

4. Visão de Mapa

Criação de uma Visão de Mapa

Visões de mapa são úteis quando estamos olhando para dados geográficos (o campo Região). No exemplo atual, o Tableau automaticamente reconhece que os campos País, Estado, Cidade e Código Postal contêm informações geográficas.

Passos

  1. Crie uma nova planilha.
  2. Adicione Estado e País sob a painel de Dados para Detalhe na carta de Marcas. Obtemos a visão de mapa.
  3. Arraste Região para o estante de Filtros, e em seguida, filtre apenas para sul. A visão de mapa agora amplia apenas para a região sul, e um marcador representa cada estado.
  4. Arraste a medida Vendas para a aba Cor na carta de Marcas. Obtemos um mapa preenchido com as cores mostrando o intervalo de vendas em cada estado.
  5. Podemos alterar o esquema de cores clicando em Cor na carta de Marcas e selecionando Editar Cores. Podemos experimentar com as paletas disponíveis.
  6. Observamos que Flórida está performando melhor em relação às Vendas. Se passarmos o cursor sobre Flórida, mostra que houve uma venda total de 89.474 dólares, enquanto o Carolina do Sul, por exemplo, apenas teve 8.482 dólares em vendas. Vamos avaliar o desempenho por Lucro agora, já que o Lucro é um melhor indicador do que as vendas sozinhas.
  7. Arraste Lucro até Cor na carta de Marcas. Agora vemos que o Tennessee, Carolina do Norte e Flórida têm lucro negativo, mesmo que parecesse que estavam fazendo bem em Vendas. Renomeie a planilha como Mapa de Lucro

Mãos na Massa

Avançando nas Detalhes

Mapas nos permitem visualizar os dados de forma ampla. No passo anterior, descobrimos que o Tennessee, Carolina do Norte e Flórida têm lucro negativo. Nesta seção, vamos desenhar um gráfico de barras para explorar a razão para o lucro negativo.

Passos

  1. Copie a planilha Mapa de Lucro e nomeie-a Gráfico de Barras de Lucro Negativo.

  2. Clique em Mostrar-me na planilha Gráfico de Barras de Lucro Negativo. Mostrar-me apresenta o número de formas em que um gráfico pode ser plotado entre itens mencionados na planilha. De Mostrar-me, selecione a opção de barras horizontais e a visualização atualiza instantaneamente de barras verticais para horizontais.

  3. Nós podemos selecionar mais de uma barra de uma vez simplesmente clicando e arrastando o cursor sobre elas. Nós queremos concentrar apenas em três estados, ou seja, Tennessee, North Carolina e Florida. Portanto, nós selecionaremos apenas as barras referentes a eles.

    Saiba Mais

    Criando Hierarquias
    Hierarquias são úteis quando nós queremos agrupar campos semelhantes para que nós possamos percorrer rapidamente entre níveis na visualização.

    1. Na área de Dados, arraste um campo e solte-o diretamente em cima de outro campo ou clique com o botão direito do mouse no campo e selecione
    2. Arraste quaisquer campos adicionais para a hierarquia. Campos também podem ser reordenados na hierarquia simplesmente arrastando-os para uma nova posição. Na visualização atual, nós criaremos as seguintes hierarquias: Localização, Ordem e Produto.
  4. No painel de Linhas, clique no ícone em formato de plus no campo Estado para realizar a divisão até o nível Cidade.

    1. Isso é muito dado. Podemos usar o N-Filter para filtrar e revelar os piores desempenhos. Para isso, arraste o Cidade do painel de Dados para a estante de Filtros. Clique no campo Por e depois clique no botão de dropdown Top e selecione Bottom para revelar os piores desempenhos. digite 5 no campo de texto para mostrar os 5 piores desempenhos no conjunto de dados.

Atualmente vemos que Jacksonville e Miami, Flórida; Burlington, Carolina do Norte; e Knoxville e Memphis, Tennessee são as cidades com pior desempenho por lucro. Há outra marca na visualização – Jacksonville, Carolina do Norte – que não pertence aqui, pois tem vendas lucrativas. Isso significa que há um problema no filtro que aplicamos. Vamos usar a ajuda das Operações de Ordem do Tableau.

  1. No estante de Filtros, clique com o botão direito no conjunto de Inclusões (País, Estado) e selecione Adicionar ao Contexto. Vemos agora que Concord(Carolina do Norte) aparece na visualização enquanto Miami(Flórida) desapareceu. Isso faz sentido agora.

  2. Mas Jacksonville (Carolina do Norte) ainda está presente, o que é incorreto. No estante de Linhas, clique no ícone em forma de mais na guia Cidade para fazer um drill down ao nível do Código Postal. Clique com o botão direito no código postal para Jacksonville, NC, 28540, e selecione Excluir para excluir manualmente Jacksonville.

  3. Arraste o Código Postal da prateleira de Linhas. Essa é a visualização final.

Atividade Prática

Conclusões Chave

Concentremo-nos agora apenas nas entidades com perdas, ou seja, os Produtos, e também identifiquemos os locais onde esses produtos são vendidos.

Passos

  1. Arraste Sub-Categoria para as Linhas para fazer um drill down mais a fundo.
  2. Da mesma forma, arraste Lucro para Cor no cartão de Marcas. Isso nos permite localizar rapidamente os produtos com lucro negativo.
  3. Clique com o botão direito do mouse em Data da Ordem e selecione Mostrar Filtro. Parece que Máquinas, mesas e grampos estão se saindo mal. Então o que devemos fazer? Uma solução seria parar a venda desses produtos em Jacksonville, Concord, Burlington, Knoxville e Memphis? Vamos verificar se nossa decisão está correta.
  4. Vamos voltar à guia Mapa de Lucro criada anteriormente.
  5. Agora, clique no campo Sub-Category para selecionar a opção Show Filter.
  6. Arraste o Profit de baixo de Measures para a carta de Label Marcas.
  7. Novamente, clique no Order Date e selecione Show Filter. Na filtragem, vamos apagar os itens que achamos que estão contribuindo para o lucro negativo. Então, desmarque as caixas na frente de Binders, Machines e Tables, respectivamente. Agora, só temos as entidades que estão fazendo lucro. Isto mostra que as entidades como Binders, máquinas e mesas estavam causando prejuízos em algumas áreas e nós estávamos certos em nossos achados.

Hands On

5. Painel

Um painel é uma coleção de várias visões, que permite que você compare uma variedade de dados simultaneamente.

Criando um Painel

Passos

  1. Clique no botão Novo painel.
  2. Arraste Vendas no Sul para o painel vazio.
  3. Arraste Mapa de Lucro para o painel e solte-o no topo da visão Vendas no Sul. Ambas as visões podem ser vistas ao mesmo tempo. Para poder apresentar dados de uma maneira que outros possam entender, podemos organizar o painel da forma que preferirmos.
  4. No worksheet Vendas Sul no modo de painel, clique sob o Region e apague a opção Show Header. Repita o mesmo processo para todas as outras headers. Isto ajuda a destacar apenas o que é necessário e a esconder informações menos importantes.
  5. Na Mapa de Lucros, esconda também o título e execute os mesmos passos para o mapa Vendas Sul.
  6. Podemos ver que a carta de filtro de Sub-Categoria e a data de Ano da Ordem de Compra foram repetidas no lado direito. Vamos eliminar o extra simplesmente marcando-os com um X. Em seguida, clique na Ano da Ordem de Compra. Uma seta de queda aparece e selecione a opção de Valor único (Slider). Agora deixe a magia acontecer. Experimente selecionar anos diferentes no slider e as vendas também variam de acordo.
  7. Arraste o filtro SUM(Profit) para o fundo do painel abaixo das vendas no Sul para uma melhor visão.

Mãos na Massa

Adicionando Interatividade

Para tornar o painel mais interativo, como ver quais sub-categorias são lucrativas em quais estados, precisamos fazer algumas mudanças.

Passos

  1. Vamos começar com o Mapa de Lucros. Ao clicar no mapa, um ícone de Usar como filtro aparece no canto superior direito. Clique nele. Se selecionarmos qualquer mapa, as vendas correspondentes a esse estado serão destacadas no mapa Vendas Sul.
  2. Para o Ano da Ordem de Compra, clique na opção de queda e vá para Aplicar a Planilhas > Planilhas Selecionadas. Uma caixa de diálogo abre. Selecione a opção Todos seguida de OK. O que essa opção faz? Aplica filtros a todas as planilhas que usam a mesma fonte de dados.
  3. Explore e experimente. Na visualização abaixo, podemos filtrar o mapa Vendas Sul para ver produtos que estão sendo vendidos apenas na Carolina do Norte. Podemos então explorar facilmente os lucros anualmente.
  4. Renomeie o Dashboard para Vendas Regionais e Lucros.

Prática

Portanto, vender máquinas na Carolina do Norte não trouxe nenhum lucro à empresa.

6. História

Um dashboard é um recurso legal, mas o Tableau também nos oferece a oportunidade de apresentar nossos resultados no modo de apresentação sob a forma de histórias, sobre as quais discutiremos nesta seção.

Construindo uma História

Passos

  1. Clique no botão Nova história.
  2. Na aba História do lado esquerdo, arraste a planilha Vendas no Sul (criada anteriormente) para a visualização.
  3. Edite o texto na caixa cinza acima da planilha. Este é o subtítulo. Nomeie-o como Vendas e lucro por ano.
  4. As histórias são bastante específicas. Aqui vamos contar uma história sobre a venda de máquinas na Carolina do Norte. Na aba História, clique em Duplicar para duplicar o primeiro subtítulo, ou você pode até criar um novo.
  5. Na Subcategoria, filtre selecione apenas Máquinas. Isso ajuda a medir as vendas e os lucros de máquinas por ano.
  6. Renomeie o subtítulo para Vendas e lucro de máquinas por ano.

Prática

Fazendo uma Conclusão

As máquinas na Carolina do Norte estão levando à perda de lucro. No entanto, isso não pode ser demonstrado olhando para o Lucro e Vendas no todo. Para isso, precisamos de Lucro regional.

Passos

  1. No painel de História, selecione Em branco. Arraste o painel já criado Vendas e Lucro Regionais para a tela.
  2. Legendá-lo como Itens de baixo desempenho no Sul.
  3. Selecione Duplicar para criar outro ponto de história com o painel de Lucro Regional. Selecione a Carolina do Norte no gráfico de barras, pois estamos interessados em mostrar mais sobre ela.
  4. Selecione Todos os anos.
  5. Adicione uma legenda para maior clareza, como, Lucro em NC: 2013-2016.
  6. Selecione qualquer ano como 2014. Adicione uma legenda, por exemplo, Lucro em NC: 2014 e clique na guia Duplicar. Repita o mesmo passo para todos os anos restantes.
  7. Clique no modo de apresentação e deixe a história se desenrolar.

Hands On

Agora temos uma ideia sobre quais produtos foram introduzidos no mercado da Carolina do Norte quando e como eles se performaram. Não só identificamos uma forma de abordar o lucro negativo, mas também conseguimos apoiá-lo com dados com sucesso. Essa é a vantagem da História no Tableau.

7. A integração do Tableau com R, Python & SQL

Além das várias vantagens de visualização que o Tableau oferece, ele também possui habilidades impressionantes de conexão prontas para uso. O Tableau pode integrar facilmente com linguagens como Python e R e até mesmo com SGBD como SQL. Isso oferece vantagens crescentes em termos de funcionalidades e é útil para Cientistas de Dados que estão acostumados a trabalhar em Python ou R. Eles podem importar diretamente os scripts R e Python no Tableau e tirar proveito de suas visualizações, que são muito superiores às destas linguagens. Além disso, as capacidades de visualização do Tableau são fáceis de usar e muito intuitivas, economizando muito tempo para os Cientistas de Dados.

Nesta seção, veremos como podemos conectar o Tableau com estas fontes externas e as vantagens dessas conexões.

Tableau e R

O R é uma linguagem estatística popular usada para realizar análises preditivas sofisticadas, como modelagem linear e não-linear, testes estatísticos, análise de séries temporais, classificação, agrupamento, etc.(Tableau 8.1 e R) Usar o Tableau em conjunto com o R tem as seguintes vantagens:

  • Levanta o poder estatístico do Tableau, dando a seus usuários acesso a sofisticadas bibliotecas do R para obter insights mais profundos e melhores a partir dos dados.
  • As opções aprimoradas de exploração de dados do Tableau e a habilidade de conectar a várias fontes são úteis para os usuários do R.
  • Além disso, ele também permite que os usuários do Tableau se beneficiem da utilidade da linguagem R sem precisar realmente saber a linguagem.

Como o Tableau se integra com o R?

Funções e modelos R podem ser usados no Tableau criando novos campos calculados que invocam dinamicamente o motor R e passam valores para o R. Esses resultados são então retornados ao Tableau para serem usados com fins de visualização.

Configurando o Tableau Desktop com R

  • Baixe e instale o Rserve.

Você precisará baixar e instalar o pacote Rserve para que o Tableau possa conectar e utilizar as funções de script R. No console R, insira os seguintes comandos:

install.packages(“Rserve”) library(Rserve) Rserve() / Rserve(args = ‘ — no-save’)

Conecte o Tableau ao Servidor R

Após o Rserve ser instalado com sucesso, abra o Tableau Desktop e siga os passos mencionados abaixo.

  1. Vá para Ajuda > Configurações e Preferências e selecione Gerenciar Conexão de Serviço Externo.

  2. Insira o nome do servidor como “Localhost” (ou “127.0.0.1”) e uma porta “6311”.

  3. Clique no botão “Testar Conexão”. Você verá uma mensagem de sucesso. Clique em OK para fechar.

Comece a usar os scripts R no Tableau

Após concluir os passos acima com sucesso, será possível criar novos campos calculados no Tableau Desktop que usam as funções SCRIPT_* para fazer chamadas funcionais a R.

Vamos começar o trabalho e ver como podemos usar as capacidades do Tableau com R.Vamos utilizar o conjunto de dados interno Sample Superstore para calcular o Lucro, tanto usando o script R quanto usando a funcionalidade de arrastar e soltar do Tableau. Depois, compararemos ambos os resultados.

Passos

  1. Abra o planilha do Tableau e conecte-se aos dados do Sample Superstore.
  2. Conecte-se a Rserve. Assim que o Tableau Desktop estiver conectado a Rserve, ele pode chamar o motor R através de campos calculados.
  3. Agora criaremos um campo calculado chamado Lucro Esperado.

    Há quatro funções disponíveis para uso com R, e todas começam com a palavra script. As funções são:

    • SCRIPT_REAL: retorna números reais como resultado
    • SCRIPT_STR: retorna string
    • SCRIPT_INT : retorna inteiros
    • SCRIPT_BOOL: retorna booleanos
    • Para este exemplo, vamos usar a função SCRIPT_REAL. Vamos criar um simples regressão linear no Tableau.
  4. Abra o campo calculado e insira o seguinte script.

    SCRIPT_REAL("fit <- lm(.arg1 ~ .arg2 + .arg3 + .arg4) fit$fitted ", SUM([Lucro]), AVG([Vendas]), AVG([Quantidade]), AVG([Desconto]))

    O script acima refere-se ao modelo de regressão linear no R. Este modelo terá uma variável dependente(arg1) e três variáveis independentes(arg2, arg3, arg4). Esses argumentos são apenas espaços reservados, e quando o script for passado para o R, os argumentos serão substituídos pelas colunas do Tableau que correspondem a eles. 5. Insira os campos do Tableau que correspondem a cada uma das variáveis. A variável dependente aqui é o lucro, então colocaremos SUM(Lucro) primeiro, já que corresponde ao argumento 1. Da mesma forma, usaremos a média de preço unitário, média de quantidade por pedido e média de desconto para os outros três argumentos, respectivamente.

  5. Estas entradas agora serão todas integradas ao modelo para determinar os níveis esperados de lucro. Agora estamos prontos para usar este cálculo nas visualizações do Tableau. Arraste a categoria para as linhas e então Profit para as colunas. Agora arraste Lucro Esperado para as colunas.

  6. Agora podemos analisar o modelo para ver como o Lucro esperado calculado em R compara com os lucros reais. Podemos continuar a analisar mais ainda ao transferir segmentos de clientes para as cores e agora criamos um gráfico de barras empilhado que também pode utilizar datas ordenadas para quebrar os dados por anos ou trimestres.

Hands On

Podemos perguntar por que todas as cálculos acima poderiam ter sido feitos no Tableau sem usar o R. Então, por que deveríamos passar pelo processo de baixar e configurar o Rserve no Tableau e escrever scripts? O R é uma linguagem poderosa por causa de sua capacidade de previsão, utilizando amplamente bibliotecas que contêm algoritmos conhecidos facilmente. Imagine como seria bom fazer previsões para nosso negócio no Tableau, chamando um simples script em R e então conseguir incorporá-lo nas visualizações do Tableau.

Tableau e Python

Python é uma linguagem de programação de uso geral amplamente utilizada. Python fornece uma grande quantidade de bibliotecas para realizar análise estatística, modelagem preditiva ou aprendizado de máquina. A conexão do Tableau com o Python é uma das melhores abordagens para análise preditiva. O Tabpy é um pacote desenvolvido para fazer o mesmo. Para permitir que o Tableau aproveite o poder do Python, ele pode ser conectado ao servidor TabPy para executar código Python rapidamente e exibir resultados sob a forma de visualizações.

Como o Tableau se integra com o Python?

Quando usamos o TabPy com o Tableau, podemos definir campos calculados em Python, aproveitando assim o poder de uma grande quantidade de bibliotecas de aprendizado de máquina diretamente de nossas visualizações.

Configurando o Tableau Desktop com Python

Baixe e instale o Tabpy.

A execução de um código Python dentro de um livro de trabalho do Tableau requer um servidor Python para executá-lo. O framework TabPy é o que faz o trabalho. Baixe o TabPy do Github usando o seguinte link. Alternativamente, você pode seguir os passos abaixo:

conda install -c anaconda tabpy-server

Então, vá para o diretório que contém o servidor tabpy baixado e execute.

python setp.py

Conectando o Tableau com o TabPy

O próximo passo é conectar o Tableau com o TabPy. Isso pode ser feito indo em Ajuda > Configurações e Desempenho > Gerenciar Conexão de Serviço Externo:

Teste a conexão. Se tudo correr bem, você deverá receber uma mensagem de “conectado com sucesso”.

Comece a usar os scripts Python no Tableau.

A integração do Python no Tableau é uma funcionalidade muito útil. Tomemos, por exemplo, o problema da Análise de Sentimento. É um problema comum na comunidade de Machine Learning e pode ser alcançado por meio de vários Algoritmos de aprendizado de máquina. No entanto, usando uma combinação de tableau e Python, o mesmo pode ser alcançado em poucas linhas de código Python. Os resultados podem então ser visualizados no Tableau para insights adicionais. Vamos ver isso com um exemplo(Aproveite o poder do Python no Tableau com o TabPy)

Análise de Sentimento com Tabpy

Utilizaremos o conjunto de dados de avaliações de celular que pode ser baixado de aqui.

Passos:

  1. Importe o conjunto de dados para o Tableau Desktop
  2. Conecte ao Tabpy. Uma vez que o Tableau Desktop esteja conectado ao Tabpy, ele pode invocar o motor do Python através de campos calculados.
  3. Agora vamos criar um campo calculado chamado Sentiment da seguinte forma: `

    SCRIPT_REAL`

    Estamos usando a ferramenta VADER sentiment analysis aqui. É uma ferramenta de análise de sentimentos baseada em léxico e regras que é especificamente ajustada para sentimentos expressos em mídias sociais. Para usar esta ferramenta, você precisará instalá-la primeiro. Por favor, leia mais na página do github deles.

  4. Agora, arraste Revisões para as linhas e Sentimento para a carta de Texto e Marcas de Cor e veja a magia acontecendo. Nós obtemos a análise de sentimentos da revisão sem qualquer problema. Além disso, também fica super fácil visualizar os resultados. As avaliações positivas estão em ordem crescente de verde, enquanto as negativas estão em vermelho.

Os exemplos acima mostram claramente o poder trazido pela integração do Tableau com o Python. Ao termos as notas de Sentimento à nossa disposição, podemos trabalhar com elas para ir mais fundo nos detalhes. Por exemplo, como um proprietário de negócios, posso filtrar as críticas negativas e refletir sobre as razões para isso. Também posso filtrar as críticas positivas para ter uma ideia sobre os produtos que fazem os consumidores felizes.

Tableau e SQL Server

Existe um valor oculto em nossos dados do Microsoft SQL Server que está enterrado sob os relatórios padrões e ferramentas complexas de inteligência de negócios. O Tableau fornece insights em qualquer lugar, equipando qualquer pessoa para fazer uma análise visual sofisticada de dados do SQL Server. Podemos conectar o Tableau ao SQL Server em tempo real para consultas específicas da plataforma, ou trazer diretamente os dados para o motor analítico do Tableau para aliviar a carga no banco de dados.

O Tableau fornece um conector otimizado e em tempo real para o SQL Server, para que possamos criar gráficos, relatórios e painéis de controle trabalhando diretamente com nossos dados. À medida que vamos fundo em nossa análise, o Tableau reconhece qualquer esquema usado no SQL Server, então não precisamos manipular nossos dados.

Vamos percorrer um exemplo mostrando como conectar o banco de dados do SQL Server ao Tableau Desktop e então usá-lo para criar visualizações.

Passos:

  1. Faça login no SQL Server
  2. Abra o Tableau Desktop e, sob Servidores, conecte-se ao MS SQL.
  3. Coloque o nome do servidor na caixa de diálogo que abre e clique em OK. Isto conecta o Tableau ao SQL Server. Selecione o banco de dados de preferência. Neste exemplo, escolhemos o salesDB. Podemos então selecionar de uma lista de TABELAS também, por exemplo, Sales Log. A tabela é importada para o ambiente do Tableau. Agora, podemos escolher extrair toda a informação ou apenas uma parte dela para uma nova planilha. Até podemos especificar o número de linhas a serem extraídas.
  4. Na nova planilha, temos os dados extraídos do MS SQL. A partir daqui, podemos trabalhar com eles como com qualquer outra planilha do Tableau.

Hands On:

Este é o modo como podemos conectar o SQL Server ao Tableau e extrair dados diretamente para ele. O Tableau permite que os usuários alternem conexões com um clique para aplicar consultas em memória a um conjunto de dados maior.

8. Salvar o trabalho

Tableau Desktop

Para salvar um workbook do Tableau localmente, selecione Arquivo > Salvar. Especifique o nome do arquivo do workbook na caixa de diálogo Salvar como. Por padrão, o Tableau salva o arquivo com a extensão .twb.

Tableau Public

Com o Tableau Public, todas as visualizações e dados são publicados e qualquer pessoa na internet tem acesso a eles. Selecione Servidor > Tableau Public > Salvar no Tableau Public e insira as credenciais.

Tableau Server

No caso do dado ser confidencial e a história precisar ser partilhada com toda a equipe, o Tableau Server é muito útil. Para publicar uma história no Tableau Server, selecione Selecionar Servidor > Publicar Workbook ou clique em Compartilhar no painel de ferramentas. Mas certifique-se de criar uma conta primeiro.

Conclusão

Essa é tudo o que precisamos para criar uma boa visualização no Tableau, embora, uma pessoa possa achar que precisa fazer muito mais revisão em cada estado do que aqui. Portanto, com experiências e prática, o Tableau se torna muito mais familiar e liberará funcionalidades impressionantes para ajudá-nos a analisar e apresentar dados. Por favor, comente abaixo em caso de quaisquer questões ou perguntas e Feliz Visualização.

Conheça nosso Tutorial de Criação de Visualizações no Tableau usando o conjunto de dados do AirBnB.

Source:
https://www.datacamp.com/tutorial/data-visualisation-tableau