O que é integração de dados?
A integração de dados é o processo de reunir dados de fontes distintas para fornecer aos usuários uma visão unificada. A premissa da integração de dados é tornar os dados mais disponíveis e fáceis de consumir e processar por sistemas e usuários. A integração de dados feita da maneira certa pode reduzir os custos de TI, liberar recursos, melhorar a qualidade dos dados e promover a inovação, tudo sem grandes mudanças nos aplicativos ou estruturas de dados existentes. E embora as organizações de TI sempre tenham que se integrar, os resultados nunca foram tão positivos quanto agora.
Empresas com recursos de integração madura de dados têm vantagens significativas em relação à concorrência, que inclui:
- Maior eficiência operacional reduzindo a necessidade de transformar e combinar manualmente os conjuntos de dados
- Melhor qualidade de dados por meio de transformações de dados automatizadas que aplicam regras de negócios aos dados
- Desenvolvimento de informações mais valiosas por meio de uma visão holística dos dados que podem ser analisados com mais facilidade
Um negócio digital é construído em torno dos dados e dos algoritmos que os processam, e extrai o máximo valor de seus ativos de informação - de todos os lugares do ecossistema de negócios, a qualquer momento que for necessário. Em um negócio digital, os dados e serviços relacionados fluem desimpedidos, mas com segurança, por todo o cenário de TI. A integração de dados permite uma visão completa de todas as informações que fluem por uma organização e deixa seus dados prontos para análise.

A evolução da integração de dados
O escopo e a importância da integração de dados mudaram completamente. Hoje, aumentamos os recursos de negócios, aproveitando os aplicativos SaaS padrão, ao mesmo tempo em que continuamos a desenvolver aplicativos personalizados. Com um rico ecossistema de parceiros prontos para alavancar as informações de uma organização, as informações sobre os serviços de uma organização que são expostas aos clientes agora são tão importantes quanto os próprios serviços. Hoje, integrar SaaS, aplicativos personalizados e de parceiros e os dados neles contidos é um requisito. Hoje em dia, uma organização se diferencia ao combinar recursos de negócios de uma maneira única. Por exemplo, muitas empresas estão analisando dados em movimento e em repouso, usando suas descobertas para criar regras de negócios e, em seguida, aplicando essas regras para responder ainda mais rápido a novos dados. Os objetivos típicos para esse tipo de inovação são experiências de usuário mais rígidas e operações de negócios aprimoradas.
Como funciona a integração de dados?
Um dos maiores desafios que as organizações enfrentam é tentar acessar e dar sentido aos dados que descrevem o ambiente em que operam. Todos os dias, as organizações capturam mais e mais dados, em uma variedade de formatos, de um número maior de fontes de dados. As organizações precisam de uma maneira para que funcionários, usuários e clientes capturem o valor desses dados. Isso significa que as organizações devem ser capazes de reunir dados relevantes onde quer que estejam, para fins de suporte aos relatórios da organização e aos processos de negócios.
Porém, os dados necessários geralmente são distribuídos entre aplicativos, bancos de dados e outras fontes de dados hospedados no local, na nuvem, em dispositivos IoT ou fornecidos por terceiros. As organizações não mantêm mais os dados simplesmente em um banco de dados, ao invés, mantêm os dados mestres e transacionais tradicionais, bem como novos tipos de dados estruturados e não estruturados , em várias fontes. Por exemplo, uma organização pode ter dados em um arquivo simples ou pode desejar acessar dados de um serviço da web.
A abordagem tradicional de integração de dados é conhecida como abordagem de integração física de dados. E isso envolve a movimentação física de dados de seu sistema de origem para uma área de preparação onde a limpeza, o mapeamento e a transformação ocorrem antes que os dados sejam movidos fisicamente para um sistema de destino, por exemplo, um data warehouse ou um data mart. A outra opção é a abordagem de virtualização de dados. Essa abordagem envolve o uso de uma camada de virtualização para se conectar a armazenamentos físicos de dados. Ao contrário da integração física de dados, a virtualização de dados envolve a criação de visualizações virtualizadas do ambiente físico subjacente sem a necessidade de movimentação física de dados.
Uma técnica comum de integração de dados é Extract Transform and Load (ETL), em que os dados são extraídos fisicamente de vários sistemas de origem, transformados em um formato diferente e carregados em um armazenamento de dados centralizado.
Considerações para melhorar a integração simples
O valor obtido com a implementação da tecnologia de integração de dados é, em primeiro lugar, o custo de não precisar mais integrar os dados manualmente. Existem outros benefícios, incluindo a redução de evitar a codificação personalizada para a integração. Sempre que possível, as organizações devem procurar usar uma ferramenta de integração de um fornecedor em vez de escrever um código de integração personalizado. As razões para fazer isso são a) melhor qualidade dos dados b) desempenho ideal c) economia de tempo.
As organizações podem obter um valor muito maior agregando as seguintes metas adicionais aos seus roteiros de maturidade de integração:
Dinamização do Desenvolvimento
Escolha uma solução que permite criar um catálogo de formatos e subprocessos para reutilização, especialmente processos não funcionais, como registro, novas tentativas, etc. A capacidade de testar qualquer lógica de integração em tempo real também reduzirá drasticamente o tempo necessário para implementação e manutenção.
Configuração
Os processos de integração de dados são configurados para conectar aplicativos e sistemas. Essas configurações precisam imediatamente refletir qualquer mudança, garantir que os sistemas corretos estejam sendo usados e propagar as mudanças em vários ambientes (desenvolvimento, teste, garantia de qualidade e produção). A maioria das organizações relata que ainda estão alterando parâmetros de configuração manualmente em seu ambiente de desenvolvimento integrado (IDE), um processo humano caro que também pode envolver adulteração da lógica de integração. A melhor alternativa, acessar e gerenciar as variáveis em scripts ou interfaces de implantação, permitindo implantações totalmente automatizadas que reduzem a duração do projeto.
Teste
O teste está no centro do desenvolvimento da integração de dados. Ele verifica a tecnologia de integração de dados e os sistemas de destino, portanto, deve ser executado imediatamente, assim que o desenvolvedor criar ou atualizar a lógica. No entanto, está claro que a maioria das organizações precisa implantar processos antes de poder testá-los, o que causa atrasos. Um IDE que permite a depuração imediata reduzindo drasticamente o desenvolvimento do processo de integração. Além disso, como certos processos de integração de dados são tão críticos, eles precisam ser testados em ambientes muito semelhantes ao ambiente de produção, e as atualizações precisam ser testadas para não regressão. Este teste requer que cenários de teste sejam escritos. Muitas organizações precisam desenvolver essa lógica em cima da lógica do processo de integração, bem como as análises para capturar os resultados. Isso aumenta a duração e os custos do desenvolvimento. Usar uma API para inserir dados e registrar cenários de teste ou uma solução de teste de integração pode reduzir drasticamente a duração do projeto.
Estabelecimento de um modelo de dados comum
Além de limitar as tecnologias, construir um modelo de dados comum facilita as integrações futuras porque todos os processos de integração falarão a mesma língua. O negócio também será ajudado porque serviços e eventos envolvendo objetos de negócios podem ser facilmente criados, e a assinatura dos eventos certos fornece uma maior visibilidade do negócio.
Economia de alavancagem de investimentos anteriores
Muitos aplicativos legados ainda são uma parte vital dos processos de negócios e contêm dados importantes que precisam ser integrados a todos os outros sistemas em seu ambiente. Embora suas principais funcionalidades de negócios forneçam grandes ativos para reutilização em outros serviços, muitos de seus componentes e recursos foram substituídos por outros aplicativos. A integração de dados pode ajudá-lo a inserir os dados de seus sistemas legados em seus ambientes mais modernos.
Normalmente, a integração de dados é usada como um pré-requisito para mais processamento dos dados, principalmente análises. Você precisa reunir os dados para facilitar a geração de relatórios analíticos e fornecer aos usuários uma visão completa e unificada de todas as informações que fluem pela organização. Uma verdadeira analogia da integração de dados é criar uma vez e usar várias vezes. Por exemplo, você não quer ter que inserir um pedido em um sistema manualmente. Você deseja inseri-lo uma vez e que um sistema o passe para outro - esse é o principal valor da integração de dados.
