Wat is een datapool?
De term "datapool" verwijst naar een gerelateerde reeks waarden die zijn verkregen uit een gecentraliseerde database. De gegevens kunnen van alles zijn, van supply chain-informatie tot werknemersrecords. De gegevens kunnen automatisch of handmatig worden gegenereerd voor analyse met behulp van de volledige gegevensset of een deelverzameling van waarden. Databasesoftware is ontworpen om de verschillende functies van datapools aan te kunnen, waaronder synchronisatie en verificatie van informatie.
In zeer eenvoudige zin is elke verzameling gegevens die voor analyse wordt verzameld, een gegevenspool. De methode voor het verzamelen van gegevens kan de nauwkeurigheid van de waarden binnen de pool beïnvloeden en daarmee de uitkomst van de analyse. Als de gegevensset deel uitmaakt van een eenvoudig kwantitatief experiment zonder een enorme gegevensset, kan handmatige gegevensverzameling redelijk betrouwbaar zijn. Integendeel, als de gegevensset groot is, is een automatisch gegevensverzamelingsproces het meest nauwkeurig en nauwkeurig.
De nauwkeurigheid en juistheid van de waarden in een gegevensset is altijd belangrijk, maar kan noodzakelijk zijn voor sommige industrieën die vertrouwen op het volgen van de chain of custody in de supply chain. Het Global Data Synchronization Network (GSDN) certificeert datapools en vergemakkelijkt het datasynchronisatieproces door een jaarlijkse audit uit te voeren op alle GDSN-gecertificeerde datapools. Supply chain-gegevens die worden vastgelegd in een GDSN-gecertificeerde datapool zijn gekoppeld aan een wereldwijd locatienummer (GLN) en een wereldwijd handelsnummer (GLIT). Deze twee nummers worden gebruikt om respectievelijk de relevante locaties en bijbehorende artikelen voor de handel te identificeren, terwijl het artikel door de toeleveringsketen van de fabrikant naar de consument gaat.
In andere gevallen worden gegevenspools automatisch benaderd door databasesoftware terwijl een computer opstart of tijdens een installatie- of upgradeproces. Deze processen omvatten het overbrengen en verifiëren van informatie tussen databases. De informatie die wordt overgedragen en geverifieerd is de gegevenspool. Als zich tijdens het proces een datapoolfout voordoet, is er mogelijk een probleem met de gegevens, zoals een beschadigd opstartbestand, onjuiste instellingen op de harde schijf of een defecte harde schijf.
Voor een aangepaste database die gegevens van werknemers of historische temperatuurgegevens bevat, kan de toegang tot de gegevenspool privé of gedeeld zijn. Een privépool kan door niemand anders dan de beheerder worden gezien of geopend. Een gedeelde pool is toegankelijk voor anderen die waarden kunnen toevoegen, bewerken of verwijderen. Gegevens kunnen automatisch, handmatig en via een spreadsheet worden geïmporteerd of geëxporteerd. Een webgebaseerde pool wordt meestal gemanipuleerd door een beheerder, maar gedeeld zodat online gebruikers de gegevens voor verschillende doeleinden kunnen bekijken en exporteren.