Che cos'è l'integrazione dei dati?
L'integrazione dei dati è l'unione di più origini dati in un'unica fonte dati. Questa pratica è spesso molto dispendiosa in termini di tempo e di coinvolgimento, poiché le diverse fonti di dati sono probabilmente incompatibili tra loro. Cose semplici come nomi di colonne differenti su un foglio di calcolo sono sufficienti per richiedere la riformattazione della data. Questo processo è più comune nelle situazioni in cui due gruppi sono iniziati senza connessione, ma sono messi insieme dopo aver lavorato in modo indipendente. L'integrazione dei dati è diventata un argomento più importante a causa della prevalenza di fonti di dati gratuiti e database online.
La parte dei dati di integrazione dei dati può essere quasi tutto purché sia archiviata in un sistema informatico. Il contenuto effettivo dei dati è raramente importante quanto il modo in cui i dati vengono archiviati. Il più delle volte, i dati sono conservati in banche dati, sistemi organizzati di informazioni. Questi sistemi contengono voci e campi univoci che consentono agli utenti di trovare rapidamente le informazioni.
Il principale ostacolo a qualsiasi processo di integrazione dei dati sono i dati stessi. In molti casi, quando i dati sono stati impostati per la prima volta, non vi era alcuna intenzione di unire il set di dati con un altro. Ciò significa che anche se due set di dati possono fare riferimento alla stessa cosa, sono totalmente incompatibili.
Quasi tutto renderà i database incompatibili. Qualcosa di semplice come una differenza nella presentazione, come l'ordine dei campi o la larghezza della colonna, può essere sufficiente per impedire una facile fusione. Quando i dati sono significativamente diversi, come un database che contiene più o meno informazioni, l'unione è molto più difficile.
Le due situazioni che richiedono l'integrazione dei dati più di ogni altra sono nel business e nei campi di ricerca. Nel mondo degli affari, la fusione di dipartimenti o aziende richiede la combinazione di informazioni precedentemente separate in un'unica struttura. Questa forma di integrazione è generalmente molto difficile a meno che i gruppi originali non utilizzassero software simili e avessero obiettivi informativi simili.
Quando l'integrazione dei dati viene eseguita a scopo di ricerca, in genere diventa molto più agevole. Quando un ricercatore dà accesso alle sue informazioni a un altro, le due parti stanno generalmente esaminando lo stesso processo. Ciò significa che useranno metodi simili per catalogare e archiviare i loro dati.
In passato, l'integrazione dei dati era un'area relativamente minore di studi sui dati, ma questo è cambiato dalla prima parte del 21 ° secolo. Con i database online gratuiti che diventano più popolari e precisi, le aziende si stanno mescolando per ottenere le loro informazioni in un formato condivisibile. Ciò consente loro sia di rilasciare le proprie informazioni in forma pubblica sia di integrare versioni private di interfacce pubbliche note nei loro sistemi.