Wat is datawarehouse-testen?
Datawarehouse-testen is een proces dat wordt gebruikt om de integriteit van gegevens te inspecteren en te kwalificeren die in een bepaald type opslagfaciliteit worden onderhouden. Het idee achter de tests is om ervoor te zorgen dat de gegevens geen enkele vorm van corruptie hebben ondervonden en volledig en opvraagbaar blijven wanneer en wanneer dat nodig is. Regelmatig testen van opgeslagen gegevens maakt het mogelijk om eventuele problemen te identificeren en deze problemen te corrigeren voordat de opgeslagen gegevens volledig beschadigd raken en slechts gedeeltelijk kunnen worden gereconstrueerd met behulp van een bepaald type gegevensherstelproces.
In veel opzichten is datawarehouse-testen erg vergelijkbaar met elk type test dat wordt uitgevoerd om de integriteit van informatie te waarborgen die is opgeslagen op een harde schijf van een computer of een extern opslagapparaat. De gegevens in het magazijn worden systematisch gecontroleerd met behulp van een softwareprogramma dat elk bestand of elke andere gegevensbron leest om ervoor te zorgen dat het volledig intact en toegankelijk blijft. Sommige soorten datawarehouse-testsoftware hebben de mogelijkheid om een beperkt aantal fouten te corrigeren als onderdeel van het algehele testproces. Anderen stellen eenvoudig een lijst met uitzonderingen samen, zodat de gebruiker elke uitzondering afzonderlijk kan evalueren voordat er actie wordt ondernomen.
Het testen van datawarehouses maakt meestal gebruik van een door het systeem geactiveerd model. Dit betekent eenvoudig dat de software een basisformule gebruikt die bekend staat als ETL, of extractie-transformatie-laden. Het idee is om de huidige toestand van de gegevens te vergelijken met de toestand van de informatie toen deze voor het eerst werd opgeslagen. Als er fouten worden geïdentificeerd, worden de gegevens gemarkeerd voor verdere beoordeling. In de meeste gevallen zijn de fouten of uitzonderingen klein en kunnen met relatief weinig moeite worden gerepareerd, hetzij met behulp van protocollen die zijn ingebouwd in de testsoftware of door beoordeling door een analist die de reparatie kan goedkeuren of de uitzondering kan afwijzen als een soort van corruptie .
Het basisproces van het testen van datawarehouses lijkt veel op het testen van elk type elektronische transactie van informatie. De informatie wordt onderzocht in blokken of cellen die vervolgens worden gewist of genoteerd voor eventuele uitzonderingen die de software heeft geïdentificeerd voordat het naar het volgende blok gaat. Zodra het proces is voltooid, wordt een samenvatting van de test opgesteld, inclusief informatie over de gevonden soorten uitzonderingen en of die uitzonderingen tijdens de test zijn gecorrigeerd of wachten op handmatige beoordeling. Zoals bij elk type systeemtest, is het een goed idee om regelmatig datawarehouse-testen uit te voeren om ervoor te zorgen dat de informatie volledig en vrij van corruptie blijft.