O que é big data?
Big data refere-se às quantidades volumosas e em constante crescimento de dados que uma organização possui e que não podem ser analisadas usando-se métodos tradicionais. O big data, que inclui tipos de dados estruturados e não estruturados, geralmente é a matéria-prima para as organizações executarem análises e extraírem informações que podem ajudá-las a criar melhores estratégias de negócios. É mais do que um subproduto de processos e aplicações tecnológicas: o big data é um dos ativos mais importantes hoje.
O big data pode ser composto de dados estruturados tradicionais, dados não estruturados ou dados semiestruturados. Um exemplo de big data não estruturado – e em constante crescimento – são os dados gerados pelos usuários em redes sociais. O processamento desses dados requer uma abordagem diferente daquela dos dados estruturados, juntamente com ferramentas e técnicas especializadas.
O big data é o subproduto da explosão de informações de hoje. Todas as áreas dos negócios e da vida cotidiana contribuem para a crescente pilha de big data: varejo, imóveis, viagens e turismo, finanças, redes sociais e tecnologia: todos os aspectos de nossas vidas, de quantos passos damos até nossas histórias financeiras, são dados.
Em 2017, estimava-se que cerca de 3,8 bilhões de pessoas, cerca de 47% da população mundial, estivessem usando a Internet. O número e a variedade de dispositivos eletrônicos inteligentes dispararam nos últimos anos e continuam a crescer. Todos os dias, geramos cerca de 2,5 quintilhões de bytes de dados, um número que só cresce.
Com o número de pessoas que usam a internet aumentando exponencialmente, os dados nunca descansam.
Os números abaixo ajudarão a lançar alguma perspectiva sobre o tamanho do gigante big data. Veja o que acontece no reino cibernético a cada minuto e faça as contas.
- Canais meteorológicos recebem 18.055.555 solicitações de previsão
- As pessoas fazem 176.220 chamadas usando o Skype
- Usuários do Instagram postam 49.380 fotos
- Usuários da Netflix assistem 97.222 horas de vídeo
Características do big data
Os cinco Vs do big data são universalmente aceitos:
- Volume
- Velocidade
- Variedade
- Veracidade
- Valor
1. Volume
Se pensarmos em big data como uma pirâmide, o volume formará sua ampla base. O volume de dados que as empresas em todo o mundo gerenciam começou a disparar por volta de 2012, quando as organizações começaram a coletar mais de três milhões de dados todos os dias. Desde então, estima-se que esse volume dobre a cada 40 meses, de acordo com um professor de MBA da Universidade Antonio de Nebrija.
2. Velocidade
O termo 'velocidade' refere-se à velocidade com que os dados são gerados.
Não é apenas o volume de big data que pode ser um ativo: a rapidez com que os dados fluem, ou seja, sua velocidade, também é importante. Quanto mais próxima a velocidade estiver do tempo real, melhor em termos de vantagem competitiva para as empresas que procuram extrair desses dados informações práticas e valiosas.
Um exemplo é quando uma empresa de entrega de refeições decide comprar uma campanha do Google Ads com base em seus dados de vendas 45 minutos após o início de um grande evento esportivo. Os mesmos dados terão perdido sua relevância algumas horas depois.
As tecnologias que impulsionam essa necessidade de dados rápidos incluem etiquetas RFID, medição inteligente e vários tipos de sensores.
3. Variedade
A variedade refere-se ao espectro de fontes das quais uma empresa pode adquirir big data e a infinidade de formatos em que os dados podem aparecer. Isso inclui smartphones, dispositivos internos, conversas de rede social, dados de ações e dados de transações financeiras. A fonte deve ser particularmente relevante para a natureza do negócio para o qual os dados estão sendo coletados. Por exemplo, uma empresa de varejo deve estar sintonizada com o que os usuários estão dizendo nas redes sociais sobre sua linha de roupas lançada recentemente. Uma empresa de manufatura teria menos valor embutido em seguir redes sociais.
Uma variedade de dados também pode ser usada para ajudar as organizações a entender os perfis e tipos de clientes. Por exemplo, uma empresa pode achar útil saber não apenas quantas pessoas abrem seu boletim informativo, mas também por que o abriram e as características distintivas do público.
4. Veracidade
A veracidade questiona a qualidade e a precisão dos dados. Dados limpos são os mais confiáveis. As organizações devem conectar, limpar e transformar seus dados em todos os sistemas para confiar neles. Elas precisam de hierarquias e várias vinculações de dados para manter o controle sobre eles.
5. Valor
No ápice da pirâmide está o valor, a capacidade de extrair informações de negócios viáveis da avalanche de dados.
Valor é poder prever quantos novos membros irão registrar-se no site, quantos clientes irão renovar apólices de seguro, quantos pedidos esperar etc. Valor é saber quem são os melhores clientes e quem sairá do mapa em algumas semanas ou meses, para nunca mais voltar.
As empresas ganham valor por meio de sua capacidade de monetizar as informações fornecidas pelo big data. Elas conhecem melhor seus clientes e continuam a fazer ofertas mais relevantes.

Principais tipos e fontes de big data
Dados de streaming
Esses são os dados que vêm da Internet das Coisas e dos dispositivos conectados. São dados que fluem para os sistemas em ordem cronológica. Podem ser transmitidos para sistemas de TI a partir de uma infinidade de dispositivos conectados, como smartphones, wearables, carros inteligentes, equipamentos industriais e dispositivos médicos. Os dados de streaming podem ser analisados por ordem de chegada ou continuamente, verificando-se se vale a pena armazená-los para análise posterior ou se podem ser descartados com segurança.
Dados de rede social:
As milhões de interações diárias em plataformas de redes sociais como Facebook, Instagram e YouTube, na forma de fotos, imagens, GIFS, vídeos, voz, comentários (texto) e arquivos de som, compõem o repertório de dados das redes sociais. Isso é especialmente valioso para campanhas de vendas, suporte e marketing. O desafio está no fato de que os dados estão em forma não estruturada ou semiestruturada; portanto, é necessário processamento adicional antes que possam ser analisados.
Dados disponíveis publicamente
Referem-se ao enorme número de fontes de dados abertos, incluindo portais data.gov dos principais governos mundiais.
O restante do big data vem da nuvem e de data lakes, fornecedores ou clientes.
Como o big data é processado
O processamento de big data começa com a definição de uma estratégia para aproveitá-lo. A próxima etapa é identificar e catalogar suas fontes, locais, sistemas, usuários e proprietários e como eles fluem. Em seguida, crie uma infraestrutura para armazenar e gerenciar os dados para que estejam prontamente acessíveis para análise, a etapa final para facilitar a tomada de decisão. Este protocolo é útil para gerenciar conjuntos de dados estruturados tradicionais, bem como dados não estruturados e semiestruturados.
Ao desenvolver uma estratégia de gerenciamento de big data, é imperativo levar em consideração as metas de negócios atuais e futuras do ponto de vista do crescimento dos negócios e da tecnologia, e tratar o big data como qualquer outro ativo comercial de valor.
Os dados podem ser armazenados no local em um data warehouse tradicional, mas as soluções de armazenamento em nuvem ganharam popularidade nos últimos anos. Essas soluções são mais econômicas e fornecem um certo grau de flexibilidade. No que diz respeito ao processamento, os sistemas de computação disponíveis hoje são iguais à velocidade, potência e agilidade necessárias para atender às demandas de acesso a esses volumes de dados tão grandes. Integrar dados, garantir o controle de qualidade, fornecer governança de dados e prepará-los para que as ferramentas analíticas façam seu trabalho também são parâmetros necessários.
Ferramentas para extrair o máximo do big data
O big data é o que alimenta os esforços de análise avançada de nossa era, como a inteligência artificial. Quanto mais eficientemente uma empresa usar seus dados coletados, mais potencial poderá extrair deles. Investir em software que possa gerenciar e analisar grandes volumes de dados, principalmente em tempo real, é um passo vital para o gerenciamento de big data.
MapReduce, BigTable e Hadoop: quando grandes quantidades de dados devem ser armazenadas e formas melhores ou mais eficientes de conduzir atividades de negócios devem ser identificadas, ferramentas como Hadoop e análises baseadas em nuvem são utilizadas. Essas ferramentas ajudam na otimização de processos para oferecer vantagens de custo.
Além disso, a alta velocidade de ferramentas como o Hadoop, juntamente com a análise na memória, ajuda a identificar recursos inexplorados, ou seja, novas fontes de dados para análise. A velocidade de captura e análise de dados é um grande trunfo para as empresas tomarem decisões rápidas.
Desafios complexos precisam de soluções inteligentes. As plataformas precisam capacitar as organizações com interfaces intuitivas e simples que garantem que até mesmo os menos experientes em TI possam usá-las. A plataforma também deve ser capaz de aproveitar todo o espectro de big data, resultando em análises precisas e em tempo real. Ser capaz de lidar com vários terabytes de clusters de dados de diversas fontes e transformá-los com sucesso em painéis que fornecem informações úteis e análises de fluxo de trabalho tornam um sistema bem-sucedido.

Análise de big data: insights
- A análise de big data fornece uma compreensão mais profunda das condições atuais do mercado, do comportamento de compra dos clientes, da popularidade de produtos e assim por diante, a fim de otimizar o planejamento de manufatura ou aquisição.
- Da mesma forma, o big data ajuda uma empresa a ver o que seus clientes gostam, em qual demografia seus clientes pagantes se enquadram e, depois, cria maneiras de recompensar e promover sua fidelidade para retê-los a longo prazo.
- Manter os clientes satisfeitos é crucial para a longevidade do negócio. As informações fornecidas pelo big data ajudam muito no gerenciamento de expectativas e na criação de campanhas de marketing memoráveis e eficazes para várias tipos de clientes.
- A análise de big data também pode ser um medidor de sentimentos, avaliando como os consumidores se sentem em relação à sua marca, serviço ou produto. Isso pode ser uma grande ajuda na gestão da imagem da marca. As informações de big data podem ajudar a melhorar a visibilidade e a popularidade online e manter as altas classificações.
- As informações fornecidas pela análise de big data ajudam as empresas a inovar e desenvolver constantemente seus produtos para ficar à frente da concorrência. Elas ajudam a identificar a causa-raiz de falhas, problemas e defeitos.
- O big data ajuda a identificar padrões, calcular portfólios de risco e interceptar comportamentos fraudulentos antes que danos sérios sejam causados.
Benefícios de longo prazo derivados do processamento de big data
Depois que as organizações investirem tempo e recursos na infraestrutura necessária para processar big data, elas poderão colher os seguintes benefícios:
- Otimização de recursos e planejamento de estoque
- Melhor gerenciamento de ativos
- Compreensão mais intuitiva dos perfis dos clientes
- Melhoria no relacionamento com clientes e fornecedores
- Tempos mais curtos do pedido até a entrega
- Melhor integração em toda a cadeia de suprimentos
- Planejamento estratégico mais eficaz
- Tempo de reação mais curto para resolver problemas da cadeia de suprimentos
- Melhor atendimento ao cliente e retorno mais rápido
Como o big data está impactando vários setores: exemplos
Big data no setor de educação
O big data tem impulsionado grandes mudanças no setor de educação, particularmente em:
- Criação de programas de aprendizagem e desenvolvimento mais personalizados, dinâmicos e interativos
- Redefinição do escopo de materiais de curso
- Modificação de sistemas de classificação para maior precisão
- Previsão de carreira e aconselhamento
Big data no setor de seguros
O setor de seguros é relevante não apenas para pessoas físicas que buscam cobertura de seguro de vida, mas também para empresas de diversos tipos e portes. O fator comum é que tanto as pessoas quanto as organizações são vulneráveis a tempos de adversidade, calamidades e outras incertezas. Como resultado, os dados no setor de seguros podem vir em vários formatos, de fontes diferentes, e estão sujeitos a alterações.
Por exemplo, se um cliente estiver interessado em comprar um seguro de carro para viagem em um determinado país, a seguradora pode coletar e verificar os dados das condições de direção e segurança rodoviária naquele país e ajustar o prêmio de acordo. Ela também pode reunir o histórico de direção da pessoa e levar isso em consideração antes de apresentar uma apólice ao cliente.
Além dessa avaliação de risco, as seguradoras também podem usar big data para mapeamento de ameaças. Isso significa que podem levar em consideração as diferentes possibilidades em que as coisas podem dar errado com um determinado cliente ou empresa, o que pode levá-los a registrar um sinistro.
Big data no governo
O big data provou ser especialmente impactante para governos em todo o mundo. Ele é fundamental para abordar questões complexas, garantir a governança e influenciar grandes eventos não apenas em escala local, mas também em escala nacional e global.
O big data deu início a uma nova e enorme oportunidade para coletar e reunir dados acumulados e extrair insights úteis deles, imbuindo-os de viabilidade e contexto para vários processos organizacionais.