Skip to main content

O que é integração de dados?

Integração de dados é a fusão de várias fontes de dados em uma única fonte de dados. Essa prática geralmente consome muito tempo e está envolvida, pois as diferentes fontes de dados provavelmente são incompatíveis entre si. Coisas simples como nomes de colunas diferentes em uma planilha são suficientes para exigir a reformatação da data. Esse processo é mais comum em situações em que dois grupos começaram sem conexão, mas são colocados juntos depois de trabalharem independentemente. A integração de dados se tornou um tópico mais importante devido à prevalência de fontes de dados gratuitas e bancos de dados online.

A parte de dados da integração de dados pode ser quase qualquer coisa, desde que seja armazenada em um sistema de computador. O conteúdo real dos dados raramente é tão importante quanto a maneira como os dados são armazenados. Na maioria das vezes, os dados são mantidos em bancos de dados, sistemas organizados de informação. Esses sistemas contêm entradas e campos exclusivos que permitem aos usuários encontrar informações rapidamente.

O maior obstáculo para qualquer processo de integração de dados é os próprios dados. Em muitos casos, quando os dados foram configurados pela primeira vez, não havia intenção de mesclar o conjunto de dados com outro. Isso significa que, embora dois conjuntos de dados possam se referir à mesma coisa, eles são totalmente incompatíveis.

Quase qualquer coisa tornará os bancos de dados incompatíveis. Algo tão simples quanto uma diferença na apresentação, como a ordem dos campos ou a largura da coluna, pode ser suficiente para impedir uma fusão fácil. Quando os dados são significativamente diferentes, como um banco de dados que contém mais ou menos informações, a fusão é muito mais difícil.

As duas situações que exigem mais integração de dados do que qualquer outra estão nos campos de negócios e de pesquisa. No mundo dos negócios, a fusão de departamentos ou empresas exige a combinação das informações anteriormente separadas em uma única estrutura. Essa forma de integração geralmente é muito difícil, a menos que os grupos originais usem software semelhante e tenham objetivos de informação semelhantes.

Quando a integração de dados é realizada para fins de pesquisa, geralmente fica muito mais suave. Quando um pesquisador dá acesso a suas informações para outro, as duas partes geralmente estão analisando o mesmo processo. Isso significa que eles usarão métodos semelhantes para catalogar e armazenar seus dados.

No passado, a integração de dados era uma área relativamente menor de estudos de dados, mas isso mudou desde o início do século XXI. Com os bancos de dados online gratuitos se tornando mais populares e precisos, as empresas estão se esforçando para obter suas informações em um formato compartilhável. Isso lhes permite liberar suas informações de forma pública e integrar versões privadas de interfaces públicas conhecidas em seus sistemas.