O que é um gráfico de bolhas?

Os gráficos de bolhas , também conhecidos como plots de bolhas, são usados quando os dados precisam de uma terceira dimensão para fornecer informações mais ricas aos leitores. Um gráfico de bolhas é um gráfico relacional projetado para comparar três variáveis.

Ao contrário de outros gráficos tridimensionais que processam e representam dados em três eixos (geralmente x, y e z), um gráfico de bolhas é representado em dois eixos (x e y), e o tamanho da bolha comunica a terceira informação vital.

Exemplo de gráfico de bolhas

De todos os gráficos usados para representar dados, os gráficos de bolhas são interessantes por causa de sua aparência. Além das informações representadas relacionalmente, os gráficos de bolhas visualizam uma terceira dimensão crítica, geralmente não diretamente dependente das duas primeiras dimensões.

Embora um gráfico de linhas padrão possa mostrar os gastos com um determinado tipo de mercadoria (por exemplo, o valor em dólares das vendas de eletrônicos), os gráficos de bolhas incluem informações extras. No exemplo abaixo, você pode ver o valor das vendas de eletroeletrônicos e o valor das vendas de móveis; os círculos representam o número de itens comprados.

Como criar um gráfico de bolhas

Os gráficos de bolhas são bons para estudar relacionamentos, mas não para representar dados exatos. A taxa de crescimento do tamanho de uma bolha por si só não pode fornecer informações precisas sobre a taxa de crescimento da quantidade, mas pode fornecer aos leitores uma estimativa e definir o contexto para ler a taxa de crescimento em relação às outras duas quantidades.

Gráficos de bolhas com Spotfire
Visualizações/gráficos com Spotfire
Confira esta demonstração para ver como o Spotfire torna fácil começar a visualizar todos os aspectos de seus dados.

Por que usar um gráfico de bolhas?

Um gráfico de bolhas é mais útil para responder a uma pergunta binária; por exemplo, se três variáveis compartilham uma relação ou não. Essa relação pode destacar um padrão.

Por exemplo, a população de um país pode ser grande ou pequena para começar, mas cresce mais rápido quando instalações de saúde e saneamento estão disponíveis. Também cai rapidamente quando são implementadas medidas de controle populacional. Esse cenário mostraria o aumento do tamanho da bolha ao longo do tempo à medida que a infraestrutura fosse aprimorada. Neste exemplo socioeconômico, um gráfico de bolhas pode nos ajudar a entender como os diferentes parâmetros se movem ao longo do tempo.

Os gráficos de bolhas também podem ser úteis em um contexto de negócios. Na verdade, um gráfico de bolhas é frequentemente usado em um dos principais processos financeiros de hoje: avaliação e investimentos. Por exemplo, o custo de avaliação pode ser estudado em relação ao risco usando os eixos padrão para representar custo e valor e os tamanhos de bolha para representar risco.

Observando o gráfico de vendas de eletrônicos e móveis acima, há um padrão. O aspecto desafiador do gráfico de bolhas é interpretar o padrão.

Como ler e entender um gráfico de bolhas

Um gráfico de bolhas, como todo gráfico bidimensional, começa com a plotagem dos eixos X e Y. Normalmente, essas variáveis são escolhidas para um relacionamento pré-existente ou para determinar se realmente existe um relacionamento entre as variáveis escolhidas – por exemplo, as vendas de móveis e produtos eletrônicos.

O tamanho da bolha é usado para representar a importância de um parâmetro. No contexto de uma população, esse geralmente é o tamanho da população de cada país. No contexto de negócios, pode ser o tamanho do público, o crescimento potencial do valor ao longo do tempo, o tamanho da loja ou qualquer outro parâmetro baseado em tamanho.

Para representar grandes conjuntos de dados que precisam ser divididos, bolhas de cores diferentes são usadas para marcar as diferenças. Por exemplo, os itens comprados em lojas dos Estados Unidos podem ser exibidos em vermelho, e lojas da Oceania podem ser exibidas em azul. O nível de granularidade dos detalhes depende da finalidade do gráfico. Hoje, várias ferramentas podem representar esses gráficos dinamicamente e mostrar o movimento nos padrões ao longo do tempo.

Todo gráfico de bolhas pode ter esses recursos, característicos de conjuntos de dados selecionados. Os gráficos de bolhas servem para destacar elementos como:

  • Valores discrepantes: bolhas em um gráfico de bolhas que não se comportam como as outras no gráfico. Esses valores discrepantes fornecem informações vitais.
  • Lacunas: como ocorre em outros gráficos, uma lacuna em um gráfico de bolhas exige uma investigação mais aprofundada para entender se há dados ausentes.
  • Clusters: em um gráfico de bolhas, são exatamente o oposto dos valores discrepantes. São grupos de bolhas que estão ao redor do mesmo espaço sobreposto no gráfico. Por exemplo, se várias regiões geográficas parecem estar agrupadas em algum lugar, vale a pena entender o porquê.

Antes de identificar e estudar esses padrões, certifique-se de que os dados estejam livres de erros e que todas as comparações sejam baseadas em dados coletados usando métodos uniformes.

Usando a pandemia como exemplo, é seguro supor que o número de casos positivos aumentaria à medida que o número de testes realizados também aumentasse. Portanto, o aumento de casos positivos por milhão não pode ser plotado sem usar uma bolha para representar o aumento no número de testes sendo realizados. A aplicação de algumas regras simples de heurística ao gráfico e aos dados pode evitar confusão e incerteza.

Experimente TIBCO Spotfire - Teste Grátis
Experimente TIBCO Spotfire - Teste Grátis
Com o TIBCO Spotfire, a solução analítica mais completa do mercado, descubra facilmente novos insights de seus dados.

Práticas recomendadas e armadilhas comuns a serem evitadas ao usar um gráfico de bolhas

Ao usar um gráfico de bolhas, lembre-se de que apenas duas dimensões são representadas com base em dados concretos. Como há dois outros parâmetros também sendo representados, seguir as práticas recomendadas evita confusão.

Além disso, ao contrário dos gráficos de dispersão que fornecem mais dados à medida que o número de pontos aumenta, os gráficos de bolhas podem se tornar rapidamente confusos se forem usados para representar muitos dados. As bolhas começam a se sobrepor ou se aglomerar, fazendo com que o leitor tire conclusões erradas. Portanto, em um gráfico de bolhas, menos é mais.

Normalmente, um gráfico de bolhas não é ideal para representar valores negativos porque círculos não podem ter uma área negativa. No entanto, círculos vazios podem ser usados para representar esses valores negativos, e círculos cheios podem ser usados para valores positivos, se necessário. Observe que este é um caso raro, e a maioria dos gráficos de bolhas usa bolhas apenas para representar valores positivos; por exemplo, a população de um país nunca pode ser negativa.

Quando usado com pleno conhecimento de suas limitações, um gráfico de bolhas pode ser uma ferramenta valiosa para representar dados sem sobrecarregar o leitor. Esses gráficos criam um impacto visual fantástico, mas podem não ser a maneira mais clara ou eficaz de compartilhar dados.

Alternativas ao gráfico de bolhas

Gráfico de dispersão

Um gráfico de dispersão é semelhante em aparência ao gráfico de bolhas, mas mede apenas duas variáveis. Por exemplo, pode mostrar apenas o valor das compras de eletrônicos cruzado com o valor das compras de móveis. Mas essas duas variáveis plotadas não mostram nada de interessante ou pertinente, razão pela qual as informações da relação fornecidas pelo gráfico de bolhas são úteis.

Gráficos de colunas categóricas

Embora não se pareçam com um gráfico de bolhas, os gráficos de colunas categóricas são semelhantes na intenção. Eles usam gráficos de barras para mostrar os valores comparados diretamente, permitindo informações imediatas que dão suporte a uma tomada de decisão muito mais eficiente. É fácil ver diferenças de valores e proporções de valores.

Gráfico de cereja

Este gráfico de aparência simples é plotado de maneira semelhante aos gráficos de dispersão, mas em vez de usar um tamanho de bolha, eles usam um comprimento de “haste” como um indicador de volume. Isso apresenta alguns desafios semelhantes a um gráfico de bolhas com dados sobrepostos dificultando a visualização de dados granulares. No entanto, eles podem dar uma ideia rápida das tendências e do tamanho dos efeitos.