Wat is een gegevensset?
Een gegevensset is een verzameling verwante gegevens verzameld uit een enkele bron. De term kent verschillende toepassingen, van informatie die is samengesteld uit onderzoeksresultaten tot sets van wetenschappelijke onderzoeksresultaten. In de computer- en internetarena is een gegevensset een groep getallen of bytes, vaak weergegeven in een tabel met de kolommen die de gegevens indelen in subsets. Er zijn verschillende soorten gegevenssets, waaronder sequentiële, gepartitioneerde en virtuele opslagtoegangsmethode (VSAM).
Gegevenssets geven inzicht in een bepaald thema of concept. Ze slaan de informatie op die applicaties of besturingssystemen nodig hebben om correct te functioneren. Typische systemen zijn macrobibliotheken, bronprogramma's en systeemparameters of variabelen. Deze sets kunnen worden gecatalogiseerd zodat ze kunnen worden aangeduid met een gemakkelijk te begrijpen naam zonder verwijzing naar het specifieke opslaggebied.
Programma's voor databanken met informatie zoals verzekeringen of medische dossiers kunnen ook datasets gebruiken. Het programma dat op het systeem wordt uitgevoerd, slaat informatie op in de gegevenssets. Sommige van deze gegevenssets bevatten leesbare tekst die in rapporten kan worden gegenereerd. Naar dit soort records wordt vaak verwezen als eenheden en ze worden gecategoriseerd door een enkele identificatie, zoals een klant- of patiëntnaam.
Gegevenssets zijn georganiseerd op basis van hun hoeveelheid en de frequentie en de methode waarmee ze worden benaderd. Het formaat van de individuele gegevenssets hangt ook af van het beoogde gebruik van de informatie. De verschillende soorten gegevenssets zijn verschillend, maar hebben veel overeenkomsten.
De opeenvolgende verscheidenheid aan gegevenssets slaat informatie op in een soort opeenvolgende volgorde. Deze methode wordt meestal gebruikt voor informatie die numeriek of alfabetisch is georganiseerd. Om toegang te krijgen tot een item uit een sequentiële gegevensset, moet het systeem de items passeren die eraan voorafgaan in welk organisatorisch systeem dan ook is geprogrammeerd.
Gepartitioneerde gegevenssets bieden meer directe toegang tot items. Deze methode wordt gebruikt wanneer er grote hoeveelheden informatie zijn, zoals een uitgebreide database met adressen of klantinformatie. Deze gegevenssets worden ook wel bibliotheken genoemd. De informatie is georganiseerd op een manier die enigszins lijkt op de sequentiële methode, ondanks het verschil in de methode voor toegang tot de informatie.
De Virtual Storage Access Method (VSAM) is een key-sequenced dataset (KSDS). Deze gegevenssets worden opgeslagen met specifieke zoekinformatie die aan elk item is gekoppeld, zodat elk sneller toegankelijk is. Dit systeem is het beste voor datasets die op een onvoorspelbare manier en met een hoge frequentie worden gebruikt.