Visualização de Dados com Tableau

Nossa meta como Analistas de Dados é organizar as insights dos nossos dados de modo que todas as pessoas que as veem sejam capazes de entender suas implicações e como atuar sobre elas claramente.

Tableau é uma ferramenta de análise de dados e visualização amplamente usada na indústria hoje em dia. Muitas empresas até consideram que é indispensável para trabalhos relacionados à ciência de dados. A facilidade de uso de Tableau vem do fato de que possui uma interface de arrastar e soltar. Essa funcionalidade ajuda a realizar tarefas como classificar, comparar e analisar muito facilmente e rápido. Tableau é também compatível com várias fontes, incluindo Excel, SQL Server e repositórios de dados baseados na nuvem, o que o torna uma excelente escolha para Cientistas de Dados.

1. Introdução ao Tableau

Visão Geral

Tableau Software é uma empresa de software sediada em Seattle, Washington que produz produtos de visualização de dados interativos concentrados em inteligência de negócios. Tableau foi estabelecido no Departamento de Ciência da Computação da Universidade de Stanford entre 1997 e 2002(Wikipedia)

Os principais produtos oferecidos por Tableau são:

Tableau Desktop, Tableau Public, e Tableau Online, todos oferecem criação de visualização de dados e a escolha depende do tipo de trabalho.

Instalação

A dependência do produto escolhido, baixe o software no computador. Após aceitar o acordo de licença, você pode verificar a instalação clicando no ícone do Tableau. Se a tela seguinte aparecer, você está pronto para começar.

2. Iniciando

Nesta seção, nós vamos aprender algumas operações básicas no Tableau para nos habituarmos com sua interface.

Workspace do Tableau

O workspace do Tableau é uma coleção de planilhas, barra de menu, toolbar, cartão de marcas, prateleiras e muitos outros elementos sobre os quais vamos aprender nas seções seguintes. As planilhas podem ser planilhas de trabalho, painéis ou histórias. A imagem abaixo destaca os componentes principais do workspace. No entanto, a familiaridade será melhor alcançada quando trabalharmos com dados reais.

source:Tableau.com

Conectando a uma Fonte de Dados

Para começar a trabalhar com o Tableau, precisamos conectar o Tableau à fonte de dados. O Tableau é compatível com muitas fontes de dados. As fontes de dados suportadas pelo Tableau aparecem no lado esquerdo da tela de abertura. Algumas fontes de dados comumente usadas são o Excel, arquivo de texto, banco de dados relacional ou até mesmo em um servidor. Também é possível conectar a uma fonte de banco de dados na nuvem, como o Google Analytics, Amazon Redshift, etc.

A tela de lançamento do Tableau Desktop mostra as fontes de dados disponíveis às quais podemos conectar. Também depende da versão do Tableau, pois a versão paga oferece mais possibilidades. No lado esquerdo da tela, há um painel Conectar que destaca as fontes disponíveis. Os tipos de arquivos são listados primeiro, seguidos por tipos de servidor comuns ou os servidores aos quais se conectou recentemente. Você pode abrir cadernos de trabalho previamente criados na guia Abrir. O Tableau Desktop também fornece alguns cadernos de exemplo sob Exemplos de Cadernos.

Prática

Conectando ao conjunto de dados Sample-Superstore

Dados serão trabalhados com um conjunto de dados de exemplo chamado conjunto de dados do Superstore, que vem pré-carregado no Tableau. No entanto, vamos baixar o arquivo de aqui para que possamos ter uma ideia de como conectar a uma fonte de dados do Excel. Os dados são sobre um supermercado. Contém informações sobre produtos, vendas, lucros, etc. Nossa meta, como Analistas de Dados, é analisar os dados e encontrar áreas críticas de melhoria nesta empresa fictícia.

Passos

  1. Importe os Dados para o espaço de trabalho do Tableau a partir do computador.

  2. Na guia de Planilhas, três planilhas ficarão visíveis, nomeadamente Pedidos, Pessoas e Devoluções. No entanto, vamos nos concentrar apenas nos dados de Pedidos. Clique duas vezes na planilha Pedidos, e ela abrirá como um livro de cálculo.

  3. Observamos que as primeiras três linhas de dados parecem um pouco diferentes e não estão no formato desejado. Aqui faremos uso do Interpretador de Dados, também presente na guia de Planilhas. Clicando nele, obtemos uma planilha bem formatada.

Ambiente de Prática

Criando uma Visualização

Vamos começar criando um gráfico simples. Nessa seção, vamos conhecer os nossos dados e começar a fazer perguntas sobre os dados para obter insights. Existem algumas termos importantes que vamos encontrar nesta seção.

Dimensão

Medidas

Agregação

Dimensões são dados qualitativos, como um nome ou data. Por padrão, o Tableau classifica automaticamente dados que contêm informações qualitativas ou categóricas como dimensão, por exemplo, qualquer campo com valores de texto ou data. Esses campos normalmente aparecem como cabeçalhos de colunas para linhas de dados, como Nome do Cliente ou Data da Compra, e também definem o nível de granularidade que é mostrado na visualização.

Medidas são dados quantitativos numéricos. Por padrão, o Tableau trata qualquer campo que contém esse tipo de dado como uma medida, por exemplo, transações de vendas ou lucro. Dados classificados como medida podem ser agregados com base em uma dimensão dada, por exemplo, total de vendas (Medida) por região (Dimensão).

Agregação é o dado a nível de linha agrupado para uma categoria mais alta, como a soma das vendas ou o lucro total.

Tableau ordena automaticamente os campos em Medidas e Dimensões. No entanto, para qualquer anomalia, pode-se alterá-lo manualmente também.

Passos

  1. Vá para a planilha. Clique na guia Planilha 1 no canto inferior esquerdo da área de trabalho do Tableau.

  2. Uma vez na planilha, a partir de Dimensões no painel de Dados, arraste a Data da Ordem para a prateleira de Coluna.

    Ao arrastar a Data da Ordem para a prateleira de colunas, é criada uma coluna para cada ano das Ordens no conjunto de dados. Um indicador ‘Abc’ é visível sob cada coluna o que implica que dados de texto ou numéricos ou texto podem ser arrastados aqui. Por outro lado, se arrastássemos Vendas aqui, seria criado um cruzamento que mostraria o total de Vendas para cada ano.

  3. Da mesma forma, na aba Medições, arraste o campo Vendas para a prateleira de Linhas.

O Tableau popula um gráfico com as vendas agregadas como soma. As vendas totais agregadas para cada ano por data do pedido são exibidas. O Tableau sempre popula um gráfico de linha para uma visualização que inclui um campo temporal, que neste exemplo é a Data do Pedido.

Prática

O que o gráfico de linha acima transmite? Bem, ele mostra que as vendas parecem bastante promissoras e parecem estar aumentando com o tempo. Isso é uma percepção valiosa, mas dificilmente diz muito sobre os produtos que estão contribuindo para o aumento das Vendas. Vamos nos aprofundar para obter mais insights.

Refinando a Visualização

Vamos nos aprofundar e tentar descobrir mais percepções sobre quais produtos impulsionam mais vendas. Vamos começar adicionando as categorias de produtos para observar os totais de vendas de uma maneira diferente.

Passos

  1. A categoria Categoria está presente na área Dimensões. Arraste-a para a prateleira das colunas e coloque-a ao lado de ANO(Data do Pedido). A categoria deve ser colocada à direita do ano. Assim, a visão é alterada imediatamente para um tipo de barra de gráfico de linha. O gráfico mostra o total de Vendas de cada Produto por ano.

    Saiba Mais

    Para visualizar informações sobre cada ponto de dados (isto é, marca) na visão, passe o mouse sobre uma das barras para revelar uma dica de ferramenta. A dica de ferramenta mostra as vendas totais para essa categoria. Aqui está a dica de ferramenta para a categoria de Suprimentos de Escritório em 2016:

    Para adicionar rótulos à visão, clique em Mostrar Rótulos de Marca no painel de ferramentas.

    O gráfico de barras pode também ser exibido de forma horizontal em vez de vertical. Clique em Trocar no painel de ferramentas para fazer isso.

 2. A visualização acima mostra vendas por categoria, isto é, mobílias, material de escritório e tecnologia. Também podemos inferir que as vendas de mobílias estão crescendo mais rápido do que as vendas de material de escritório, exceto em 2016. Portanto, seria sensato focar os esforços de vendas em mobílias em vez de material de escritório. Mas a categoria de mobílias é vasta e consiste em muitos itens diferentes. Como podemos identificar qual item de mobília está contribuindo para as vendas máximas?

Para ajudar-nos a回答 essa pergunta, decidimos olhar para os produtos por Sub-categoria para ver quais itens são os maiores vendedores. Digamos que para a categoria Mobílias, queremos ver detalhes apenas sobre prateleiras, cadeiras, decorações e mesas. Vamos fazer um duplo clique ou arrastar a dimensão Sub-Categoria para a prateleira de colunas.

A subcategoria é outro campo discreto. Ela desmembra ainda mais a Categoria e mostra uma barra para cada subcategoria quebrada por categoria e ano. No entanto, é uma quantidade astronômica de dados para serem entendidos visualmente. Na próxima seção, vamos aprender sobre filtros, cor e outros meios para tornar a visualização mais compreensível.

Mãos na massa

3. Enfatizando os Resultados

Nesta seção, tentaremos concentrar-nos em resultados específicos. Filtros e cores são maneiras de adicionar mais foco aos detalhes que interessam a nós.

Adicionando filtros à visão

Filtros podem ser usados para incluir ou excluir valores da visão. Aqui tentamos adicionar dois filtros simples à planilha para torná-la mais fácil de olhar as vendas de produtos por subcategoria the um ano específico.

Passos

No painel de Dados, em Dimensões, clique com o botão direito do mouse em Data de Pedido e selecione Mostrar Filtro. Repita para o campo Sub->categoria também.

Filtros são do tipo de cartões e podem ser movidos pela simples arrastar e soltar na planilha.

Adicionando cores à visão

Cores podem ajudar na identificação visual de um padrão.

Passos

No painel de Dados, em Medidas, arraste Lucro para Cores na carta Marcas.

Pode-se ver que as estantes, mesas e até mesmo máquinas contribuem para lucro negativo, ou seja, perda. Uma visão poderosa.

Mãos na massa

Principais Encontros

Vamos olhar mais de perto os filtros para descobrir mais sobre os produtos não lucrativos.

Passos

  1. Na visão, na caixa de filtro de Sub-Category, desmarque todas as caixas exceto Bookcases, Tables, e Machines. Isto revela um facto interessante. Em alguns anos, as Bookcases e as Machines foram realmente lucrativas. No entanto, em 2016, as Machines tornaram-se não lucrativas.
  2. Selecione All na caixa de filtro de Sub-Category para mostrar todas as subcategorias novamente.
  3. Apartir das Dimensões, arraste Region para a prateleira Rows e coloque-o à esquerda da aba Sum(Sales). Reparamos que as máquinas no Sul estão a relatar um maior lucro negativo global do que nas suas outras regiões.
  4. Vamos agora atribuir um nome à folha. No canto inferior esquerdo do espaço de trabalho, clique duas vezes em Sheet 1 e digite Sales by Product and Region.
  5. Para preservar a visão, o Tableau permite que nós duplicemos a nossa folha de trabalho para que possamos continuar noutra folha onde deixámos.
  6. No seu workbook, clique com o botão direito no Sales by Product and Region folha e selecione Duplicate e renomeie a folha duplicada para Sales-South.
  7. Na nova folha, a partir das Dimensões, arraste Region para a prateleira Filters para adicioná-lo como um filtro na visão.
  8. Na caixa de diálogo Filtro de Região, limpe todas as caixas de marcação exceto Sul e clique em OK. Agora podemos concentrar-nos nas vendas e no lucro no South. Descobrimos que as vendas de máquinas tiveram um lucro negativo em 2014 e novamente em 2016. Investigaremos isto na próxima secção.
  9. Não se esqueça de salvar os resultados selecionando Arquivo > Salvar Como. Vamos nomear nosso livro de trabalho como Vendas e Lucros Regionais.

Prática

4. Visualização de Mapa

Criando uma Visualização de Mapa

A visualização de mapa é benéfica quando estamos olhando para dados geográficos (o campo Região). No exemplo atual, o Tableau reconhece automaticamente que os campos País, Estado, Cidade e Código Postal contêm informações geográficas.

Passos

  1. Crie uma nova planilha.
  2. Adicione Estado e País no painel Dados para Detalhe na carta de Marcas. Obtemos a visualização de mapa.
  3. Arraste Região para a prateleira Filtros, e então filtre para apenas Sul. A visualização de mapa agora faz zoom na região Sul apenas, e uma marca representa cada estado.
  4. Arraste a medida Vendas para a guia Cor na carta de Marcas. Obtemos um mapa preenchido com cores mostrando a faixa de vendas em cada estado.
  5. Podemos alterar a cor do esquema clicando em Cor na carta de Marcas e selecionando Editar Cores. Podemos experimentar com as paletas disponíveis.
  6. Observamos que Flórida está se destacando em termos de Vendas. Se passarmos o mouse sobre Flórida, mostra um total de 89.474 USD em vendas, em comparação com a Carolina do Sul, por exemplo, que tem apenas 8.482 USD em vendas. Vamos avaliar o desempenho por Lucro agora, já que o Lucro é um melhor indicador do que as Vendas sozinhas.
  7. Arraste Lucro para Cor na carta de Marcas. Agora vemos que Tennessee, Carolina do Norte e Flórida têm lucro negativo, embora parecesse que estavam fazendo bem nas Vendas. Renomeie a planilha como Mapa de Lucro

Prática

Entrando nos Detalhes

Os mapas nos permitem visualizar os dados amplamente. Na última etapa, descobrimos que Tennessee, Carolina do Norte e Flórida têm um lucro negativo. Nesta seção, vamos desenhar um gráfico de Barras para explorar a razão para o lucro negativo.

Passos

  1. Duplique a planilha Mapa de Lucro e nomeie-a como Gráfico de Barras de Lucro Negativo.

  2. Clique em Mostre-me na planilha Gráfico de Barras de Lucro Negativo. Mostre-me apresenta o número de maneiras nas quais um gráfico pode ser plotado entre os itens mencionados na planilha. Em Mostre-me, selecione a opção de barra horizontal e a visualização atualiza instantaneamente de barras verticais para horizontais.

  3. Nós podemos selecionar mais de uma barra de uma só vez simplesmente clicando e arrastando o cursor sobre elas. Nós queremos concentrar apenas em três estados, ou seja, Tennessee, North Carolina e Florida. Portanto, nós só selecionaremos as barras referentes a eles.

    Aprender Mais

    Criando Hierarquias
    Hierarquias são úteis quando nós queremos agrupar campos semelhantes para que possamos escavar rapidamente entre níveis na visualização.

    1. No painel de Dados, arraste um campo e solte-o diretamente em cima de outro campo ou clique com o botão direito do mouse no campo e selecione
    2. Arraste campos adicionais para a hierarquia. Campos também podem ser reordenados na hierarquia simplesmente arrastando-os para uma nova posição. Na visualização atual, criaremos as seguintes hierarquias: Localização, Ordem e Produto.
  4. No Painel de Linhas, clique no ícone em forma de cruz no campo Estado para fazer um drill-down até o nível Cidade.

    1. É muita informação. Podemos usar o Filtro N para filtrar e revelar os piores desempenhos. Para isso, arraste Cidade do painel Dados para o Painel de Filtros. Clique em Por campo e então clique no menu suspenso Topo e selecione Inferior para revelar os piores desempenhos. Digite 5 na caixa de texto para mostrar os 5 piores desempenhos no conjunto de dados.

Agora vemos que as cidades de Jacksonville e Miami, Flórida; Burlington, Carolina do Norte; e Knoxville e Memphis, Tennessee, são as cidades com melhores desempenhos em lucro. Há outra marca na visão – Jacksonville, Carolina do Norte – que não se encaixa aqui, já que ela tem vendas lucrativas. Isto significa que há um problema com o filtro que aplicamos. Vamos procurar ajuda na ordem de operações do Tableau.

  1. No estante de Filtros, clique com o botão direito do mouse no conjunto de Inclusões (País, Estado) e selecione Adicionar ao Contexto. Descobrimos que agora Concord(Carolina do Norte) aparece na visão enquanto Miami(Flórida) desapareceu. Isto faz sentido agora.

  2. Mas Jacksonville(Carolina do Norte) ainda está presente, o que é incorreto. No estante de Linhas, clique no ícone de mais de Cidade para perfilar até o nível de Código Postal. Clique com o botão direito do mouse no código postal para Jacksonville, NC, 28540, e em seguida, selecione Excluir para excluir manualmente Jacksonville.

  3. Arraste o Código Postal da prateleira de Linhas. Esta é a visualização final.

Prática

Resultados chave

Agora concentremo-nos apenas nas entidades deficitárias, ou seja, os Produtos e também identifiquemos os locais onde esses produtos são vendidos.

Passos

  1. Arraste Subcategoria para as Linhas para uma análise mais aprofundada.
  2. Da mesma forma, arraste Lucro para Cor no cartão de Marcas. Isso permite que localizemos rapidamente os produtos com lucro negativo.
  3. Clique com o botão direito do mouse em Data da Ordem e selecione Mostrar Filtro. Parece que Máquinas, mesas e encadernadores estão se saindo mal. Então o que devemos fazer? Uma solução seria parar a venda desses produtos em Jacksonville, Concord, Burlington, Knoxville e Memphis? Vamos verificar se nossa decisão está certa.
  4. Vamos voltar à guia de planilha Mapa de Lucro criada anteriormente.
  5. Agora, clique no campo Sub-Category para selecionar a opção Show Filter.
  6. Arraste o Profit que está sob Measures para a área de Label Marks.
  7. novamente, clique no Order Date e selecione Show Filter. Ao aplicar o filtro, remova os itens que achamos que estão contribuindo para o lucro negativo. Assim, desmarque as caixas em frente aos Binders, Machines e Tables, respectivamente. Agora, somente os elementos que estão fazendo lucro restam. Isso mostra que os elementos como Binders, máquinas e mesas estavam causando prejuízos em algumas áreas e nós estávamos certos nas nossas descobertas.

Hands On

5. Painel

Um painel é uma coleção de várias visões, que permite a comparação de vários tipos de dados simultaneamente.

Criar um Painel

Passos

  1. Clique no botão Novo painel.
  2. Arraste Vendas no Sul para o painel vazio.
  3. Arraste o Mapa de Lucro para o painel e solte-o acima da visão Vendas no Sul. As duas visões podem ser vistas simultaneamente. Para poder apresentar dados de forma que outros possam entender, podemos organizar o painel à nossa escolha.
  4. Na planilha Vendas Sul no modo painel, clique sob o Region e remova a opção Show Header. Repita o mesmo processo para todas as outras headers. Isto ajuda a destacar somente o que é necessário e a esconder informações menos importantes.
  5. No Mapa de Lucro, esconda o título e execute os mesmos passos para o mapa Vendas Sul.
  6. Podemos ver que a carta de filtro de Sub-Categoria e o Ano da Data de Envio foram repetidos no lado direito. Vamos eliminar o extra simplesmente marcando-os com um cruzamento. Finalmente, clique no Ano da Data de Envio. Uma seta de dropdown aparece e selecione a opção de Valor único (Slider). Agora deixe a magia acontecer. Experimente escolher anos diferentes no slider e as vendas também variam de acordo.
  7. Arraste o filtro SUM(Profit) para o final do painel de instrumentos abaixo das vendas no sul para uma melhor visão.

Mãos na massa

Adicionando Interatividade

Para tornar o painel de instrumentos mais interativo, como ver quais sub-categorias são lucrativas em quais estados, são necessárias algumas mudanças.

Passos

  1. Vamos começar com o Mapa de Lucro. Ao clicar no mapa, um ícone de Usar como filtro aparece no canto superior direito. Clique nele. Se selecionarmos qualquer mapa, as vendas correspondentes a esse estado serão destacadas no mapa Vendas Sul.
  2. Para o Ano da Data de Envio, clique na opção de dropdown e vá para Aplicar a Planilhas > Planilhas Selecionadas. Uma caixa de diálogo abre. Selecione a opção Todos e depois OK. O que essa opção faz? Aplica filtros a todas as planilhas que usam a mesma fonte de dados.
  3. Explore e experimente. Na visualização abaixo, podemos filtrar o mapa Vendas Sul para ver produtos que estão sendo vendidos apenas na Carolina do Norte. Podemos então explorar facilmente os lucros anualmente.
  4. Renomeie o Dashboard para Vendas Regionais e Lucro.

Prática

Assim, vender máquinas na Carolina do Norte não trouxe nenhum lucro à empresa.

6. História

Um dashboard é um recurso legal, mas o Tableau também nos oferece a oportunidade de apresentar nossos resultados no modo de apresentação sob a forma de histórias, sobre as quais discutiremos nesta seção.

Construindo uma História

Passos

  1. Clique no botão Nova história.
  2. Na painel de História à esquerda, arraste a planilha Vendas no Sul (criada anteriormente) para a visualização.
  3. Edite o texto na caixa cinza acima da planilha. Este é o subtítulo. Nomeie como Vendas e lucro por ano.
  4. As histórias são bastante específicas. Aqui vamos contar uma história sobre a venda de máquinas na Carolina do Norte. No painel de História, clique em Duplicar para duplicar o primeiro subtítulo, ou você pode até criar um novo.
  5. Na Sub-Categoria, filtre selecione apenas Máquinas. Isso ajuda a avaliar as vendas e o lucro das máquinas por ano.
  6. Renomeie o subtítulo para Vendas e lucro de máquinas por ano.

Prática

Fazendo uma Conclusão

É claro que as máquinas na Carolina do Norte estão causando perdas de lucro. No entanto, isto não pode ser demonstrado apenas olhando para Lucro e Vendas em sua totalidade. Para isso, precisamos de Lucro regional.

Passos

  1. No painel da História, selecione Branco. Arraste o painel de instrumentos Vendas e Lucro Regionais já criado para o canvase.
  2. Leve-o a Itens com desempenho baixo no Sul.
  3. Selecione Duplicar para criar outro ponto da história com o painel de Lucro Regional. Selecione Carolina do Norte no gráfico de barras, já que estamos interessados em mostrar mais sobre ele.
  4. Selecione todos os anos.
  5. Adicione uma legenda para clareza, como Lucro na NC: 2013-2016.
  6. Selecione um ano, por exemplo, 2014. Adicione uma legenda, por exemplo, Lucro na NC: 2014 e clique na aba Duplicar. Repita o mesmo passo para todos os anos restantes.
  7. Clique no modo de apresentação e deixe a história ser contada.

Mão no Pão

Agora temos uma ideia sobre quais produtos foram introduzidos no mercado da Carolina do Norte quando e como eles performaram. Não somente identificámos uma maneira de se addressar o negativo lucro, mas também conseguimos apoiá-lo com dados. Esta é a vantagem da História no Tableau.

7. Integração do Tableau com R, Python & SQL

Apartir das várias vantagens de visualização que o Tableau oferece, ele também possui habilidades impressionantes de conexão prontas para uso. O Tableau pode se integrar facilmente com linguagens como Python e R e até mesmo com SGBD como SQL. Isso oferece vantagens incrementais em termos de funcionalidades e é útil para Cientistas de Dados que estão acostumados a trabalhar em Python ou R. Eles podem importar diretamente os scripts R e Python no Tableau e aproveitar suas visualizações, que são muito superiores às dessas linguagens. Além disso, as capacidades de visualização do Tableau são fáceis de usar e muito intuitivas, economizando muito tempo para os Cientistas de Dados.

Nesta seção, veremos como podemos conectar o Tableau com essas fontes externas e as vantagens dessas conexões.

Tableau e R

R é uma linguagem estatística popular usada para executar análises preditivas sofisticadas, como modelagem linear e não linear, testes estatísticos, análise de séries temporais, classificação, agrupamento, etc.(Tableau 8.1 e R) Usar o Tableau em conjunto com R tem as seguintes vantagens:

  • Capta o poder estatístico do Tableau, dando aos usuários acesso a bibliotecas R sofisticadas para obter insights mais profundos e melhores a partir dos dados.
  • As opções de exploração de dados aprimoradas do Tableau e a capacidade de conectar a várias fontes são úteis para usuários de R.
  • Além disso, ele também permite que os usuários do Tableau se beneficiem da utilidade da linguagem R sem precisar saber a linguagem de fato.

Como o Tableau integra-se com o R?

Funções e modelos R podem ser usados no Tableau criando novos campos calculados que invocam dinamicamente o motor R e passam valores para o R. Esses resultados são então retornados ao Tableau para serem usados em visualizações.

Configurando o Tableau Desktop com R

  • Baixe e instale Rserve.

Você precisará baixar e instalar o pacote Rserve para que o Tableau possa conectar e utilizar as funções de script R. No console R, insira os seguintes comandos:

install.packages(“Rserve”) library(Rserve) Rserve() / Rserve(args = ‘ — no-save’)

Conectar o Tableau ao Servidor R

Após a instalação bem-sucedida do Rserve, abra o Tableau Desktop e siga os passos abaixo.

  1. Vá para Ajuda > Configurações e Preferências e selecione Gerenciar Conexão de Serviço Externo.

  2. Insira o nome do servidor como “Localhost” (ou “127.0.0.1”) e uma porta “6311”.

  3. Clique no botão “Testar Conexão”. Você deve ver uma mensagem de sucesso. Clique em OK para fechar.

Comece a usar os scripts R no Tableau

Após concluir com êxito as etapas acima, seremos capazes de criar novos campos calculados no Tableau Desktop que utilizam as funções SCRIPT_* para fazer chamadas funcionais em R.

Vamos começar a trabalhar e ver como podemos usar as capacidades do Tableau com R. Vamos usar o dataset integrado Sample Superstore para calcular o Lucro usando o script R e o recurso de arrastar e soltar do Tableau. Depois, vamos comparar os resultados.

Passos

  1. Abrir o workbook do Tableau e conectar ao conjunto de dados do Sample Superstore.
  2. Conectar ao Rserve. Uma vez que o Tableau Desktop estiver conectado ao Rserve, ele pode invocar o motor R através de campos calculados.
  3. Agora vamos criar um campo calculado chamado Lucro Esperado.

    Quatro funções estão disponíveis para uso com R, e todas começam com a palavra script. As funções são:

    • SCRIPT_REAL: retorna números reais como resultados
    • SCRIPT_STR: retorna uma string
    • SCRIPT_INT: retorna inteiros
    • SCRIPT_BOOL: retorna booleanos
    • Para este exemplo, vamos usar a função SCRIPT_REAL. Vamos criar uma simples regressão linear no Tableau.
  4. Abra o campo calculado e insira o seguinte script.

    SCRIPT_REAL("ajuste <- lm(.arg1 ~ .arg2 + .arg3 + .arg4) ajuste$fitted ", SOMA([Lucro]), MÉDIA([Vendas]), MÉDIA([Quantidade]), MÉDIA([Desconto]))

    O script acima se refere ao modelo de regressão linear no R. Este modelo terá uma variável dependente(arg1) e três variáveis independentes(arg2, arg3, arg4). Esses argumentos são apenas placeholders, e quando o script for passado de volta para o R, os argumentos serão substituídos pelas colunas do Tableau que eles correspondem. 5. Insira os campos do Tableau que correspondem a cada uma das variáveis. A variável dependente aqui é o lucro, então colocaremos SOMA(Lucro) primeiro, pois isso corresponde ao argumento 1. Da mesma forma, usaremos a média de preço unitário, média de quantidade por pedido e média de desconto para os outros três argumentos, respectivamente.

  5. Essas entradas agora serão todas puxadas para o modelo para determinar os níveis esperados de lucro. Estamos agora prontos para usar este cálculo nas visualizações do Tableau. Arraste a categoria para as linhas e depois Profit para as colunas. Agora arraste Expected Profit para as colunas.

  6. Agora podemos analisar o modelo para ver como o Lucro esperado calculado em R compara ao lucro real. Podemos continuar a analisar mais à frente arrastando segmentos de clientes para as cores, e agora criamos um gráfico de barras empilhadas que também pode utilizar datas ordenadas para separar os dados por anos ou trimestres.

Atividade Prática

Podemos perguntar por que todas as cálculos acima poderiam ter sido feitos no Tableau sem usar o R. Então, por que passar pelo processo de baixar e configurar o Rserve no Tableau e escrever scripts? O R é uma linguagem potente por causa de sua capacidade de previsão, utilizando amplamente bibliotecas que contêm algoritmos conhecidos facilmente. Imagine como seria bom fazer previsões para nosso negócio no Tableau, chamando um simples script em R e então sendo capaz de incorporá-lo nas visualizações do Tableau.

Tableau e Python

Python é uma linguagem de programação de uso geral amplamente utilizada. Python fornece uma grande quantidade de bibliotecas para realizar análise estatística, modelagem preditiva ou aprendizado de máquina. Conectar o Tableau com o Python é uma das melhores abordagens para análise preditiva. O Tabpy é um pacote desenvolvido para fazer o mesmo. Para permitir que o Tableau aproveite o poder do Python, ele pode ser conectado ao servidor TabPy para executar código Python sobre a marcha e exibir resultados na forma de visualizações.

Como o Tableau se integra com o Python?

Quando usamos o TabPy com o Tableau, podemos definir campos calculados em Python, aproveitando assim o poder de uma grande quantidade de bibliotecas de aprendizado de máquina diretamente de nossas visualizações.

Configurando o Tableau Desktop com Python

Baixe e instale o Tabpy.

A execução de um código Python dentro de um workbook do Tableau requer um servidor Python para executá-lo. O framework TabPy é o que faz o trabalho. Baixe o TabPy do Github usando o seguinte link. Alternativamente, você pode seguir os passos abaixo:

conda install -c anaconda tabpy-server

Então vá para o diretório que contém o servidor tabpy baixado e execute.

python setp.py

Conectando o Tableau com o TabPy

O próximo passo é conectar o Tableau com o TabPy. Isso pode ser feito indo em Ajuda > Configurações e Desempenho > Gerenciar Conexão de Serviço Externo:

Teste a conexão. Se tudo correr bem, você deverá receber uma mensagem de “conectado com sucesso”.

COMECE A USAR OS SCRIPTS PYTHON NO TABLEAU

A integração do Python com o Tableau é uma funcionalidade muito útil. Vejamos, por exemplo, o problema de Análise de Sentimentos. É um problema comum na comunidade de Aprendizagem Automática e pode ser concluído por vários algoritmos de Aprendizagem Automática. No entanto, usando uma combinação de Tableau e Python, o mesmo pode ser alcançado com apenas algumas linhas de código Python. Os resultados então podem ser visualizados no Tableau para obter insights adicionais. Vamos ver isso com um exemplo(Aproveite o poder do Python no Tableau com TabPy)

Análise de Sentimentos com Tabpy

Nós vamos usar o conjunto de dados de avaliações de celulares, que pode ser baixado de aqui.

Passos:

  1. Importe o conjunto de dados para o Tableau Desktop
  2. Conecte-se a Tabpy. Assim que o Tableau Desktop for conectado a Tabpy, ele pode chamar o motor Python através de campos calculados.
  3. Agora vamos criar um campo calculado chamado Sentiment da seguinte forma: `

    SCRIPT_REAL("de vaderSentiment.vaderSentiment importar SentimentIntensityAnalyzer vs = [] analyzer = SentimentIntensityAnalyzer() para i em range(0,len(_arg1)): a = analyzer.polarity_scores(_arg1[i])['compound'] vs.append(a) retornar vs",ATTR([Reviews]))`

    Estamos usando a ferramenta de análise de sentimentos VADER aqui. É uma ferramenta de análise de sentimentos baseada em léxico e regras que é especificamente ajustada para sentimentos expressos nas redes sociais. Para usar esta ferramenta, você precisará instalá-la primeiro. Por favor, leia mais na página do github.

  4. Agora, arraste Avaliações para as linhas e Sentimento para a carta de Texto e Marcas de Cor e veja a magia acontecendo. Nós obtemos a análise de sentimentos da avaliação sem qualquer constrangimento. Além disso, também fica muito fácil visualizar os resultados. As avaliações positivas estão em ordem crescente de verde, enquanto as negativas estão em vermelho.

Você pode ver claramente o poder trazido pela integração do Tableau com o Python. Com as notas de sentimento disponíveis, podemos trabalhar com elas para explorar detalhes mais a fundo. Por exemplo, como dono de negócios, posso filtrar as críticas negativas e refletir sobre as razões para elas. Também posso filtrar as críticas positivas para ter uma ideia dos produtos que fazem os consumidores felizes.

Tableau e SQL Server

Existe um valor oculto em nossos dados do Microsoft SQL Server que está enterrado sob os relatórios padrão e ferramentas complexas de inteligência de negócios. Tableau fornece insights em qualquer lugar, equipando qualquer pessoa para fazer uma análise visual sofisticada dos dados do SQL Server. Podemos conectar o Tableau ao SQL Server ao vivo para consultas otimizadas e específicas para a plataforma, ou trazer os dados diretamente para o mecanismo analítico do Tableau para aliviar a carga no banco de dados.

O Tableau fornece um conector otimizado e ao vivo para o SQL Server para que possamos criar gráficos, relatórios e painéis de controle trabalhando diretamente com nossos dados. À medida que exploramos nossa análise, o Tableau reconhece qualquer esquema usado no SQL Server, então não precisamos manipular nossos dados.

Vamos percorrer um exemplo ilustrando como conectar o banco de dados do SQL Server ao Tableau Desktop e usá-lo para criar visualizações.

Passos:

  1. Faça login no SQL Server
  2. Abra o Tableau Desktop e, em Servidores, conecte-se ao MS SQL.
  3. Coloque o nome do servidor na caixa de diálogo que se abre e clique em ok. Isso conecta o Tableau ao SQL Server. Selecione o banco de dados desejado. Neste exemplo, escolhemos o salesDB. Podemos então selecionar uma lista de TABELAS também, por exemplo, Sales Log. A tabela é importada para o ambiente do Tableau. Agora podemos optar por extrair todos os dados ou apenas uma parte para uma nova planilha. Podemos até mesmo especificar o número de linhas a extrair.
  4. Na nova planilha temos os dados extraídos do MS SQL, A partir daí podemos trabalhar com ela como qualquer outra planilha do Tableau.

Atividade Prática:

É assim que podemos facilmente conectar o SQL Server ao Tableau e extrair os dados diretamente nele. O Tableau permite que os usuários alterne as conexões com um clique para aplicar consultas em memória em um conjunto de dados maior.

8. Salvando o trabalho

Tableau Desktop

Para salvar um workbook do Tableau localmente, selecione Arquivo > Salvar. Especifique o nome do arquivo do workbook na caixa de diálogo Salvar Como. O Tableau salva o arquivo por padrão com a extensão .twb.

Tableau Public

Com o Tableau Public, todas as visualizações e dados são tornados públicos e qualquer pessoa na internet tem acesso a eles. Selecione Servidor > Tableau Public > Salvar no Tableau Public e insira as credenciais.

Tableau Server

No caso dos dados serem confidenciais e a história precisar ser partilhada com toda a equipe, o Tableau Server é muito útil. Para publicar uma história no Tableau Server, selecione Selecionar Servidor > Publicar Planilha ou clique em Compartilhar no menu de ferramentas. Mas certifique-se de criar uma conta primeiro.

Conclusão

Essa é tudo o que precisamos para criar uma boa visualização no Tableau, embora, uma pessoa possa achar que fazendo muito mais revisão em cada estado do que aqui. Portanto, com experiências e prática, o Tableau se torna muito mais familiar e libertará funcionalidades incríveis para nos ajudar a analisar e apresentar dados. Por favor, comente abaixo caso tenha dúvidas ou questões e tenha um Bom Visualizar.

Confira nosso Tutorial de Criação de Visualizações no Tableau usando o conjunto de dados do AirBnB.

Source:
https://www.datacamp.com/tutorial/data-visualisation-tableau