Wat is hiërarchisch opslagbeheer?
Hiërarchisch opslagbeheer (HSM) biedt organisaties de mogelijkheid om gegevensopslag en -opvraging in afzonderlijke lagen te organiseren voor kostenbeheer en efficiënte opslagruimte. De techniek wordt soms ook gelaagde opslag genoemd. Het werkt zoiets als een cache, maar op een veel grotere schaal, waar veelgebruikte gegevens vooraf worden opgeslagen op snellere schijfstations en gearchiveerd op langzamere media op de lagere niveaus. Omdat bepaalde bestanden vaker worden gebruikt, bevinden ze zich op de eerste laag en worden ze vervolgens verplaatst naar de onderste lagen wanneer ze buiten gebruik raken.
De ruggengraat van hiërarchisch opslagbeheer is de software. Zeer gedetailleerde logica is vereist om de gegevens te catalogiseren en te zoeken naar veelgebruikte bestanden die zich op de bovenste laag moeten bevinden. De software is ook verantwoordelijk voor het beheer van de verzoeken aan de bibliotheeklaag en om ervoor te zorgen dat deze verzoeken op een enigszins tijdige manier gebeuren.
Er zijn een aantal verschillende functies voor de verschillende beschikbare implementaties van hiërarchische opslagbeheersoftware. Sommige software maakt een back-uplaag mogelijk, waarbij alle gegevens, ongeacht of deze vaak worden gebruikt of in archivering, ook naar extra langetermijnopslagmedia worden verzonden. Andere functies kunnen integratie met computersystemen zijn die de HSM gebruiken. Hier worden gegevens opgehaald van andere servers of werkstations in het netwerk naar de primaire HSM en verder georganiseerd naar de schijflaag of opslaglaag, of naar een volledige back-up.
Hiërarchische implementaties voor opslagbeheer kunnen ook per gebruik verschillen. In sommige situaties bevindt een deel van een groot bestand zich op een hogesnelheidsschijf en wordt het gekoppeld aan de rest van het bestand op het opslagmedium. Wanneer een gebruikersverzoek binnenkomt, wordt het eerste deel van het bestand van schijf gelezen, terwijl de rest van het opslagmedium wordt opgehaald. Deze techniek wordt vaak gebruikt in grote mediastream-implementaties, zoals internetvideo.
Er zijn ook enkele nadelen aan hiërarchisch opslagbeheer. Het meest opvallend is de tijd die nodig is om minder vaak gebruikte gegevens uit de opslaglaag op te halen. In het geval van veel kleine bestanden kan het bijvoorbeeld uren of zelfs dagen duren voordat de robotica het verzoek samenvoegt dat mogelijk over meerdere schijven in de jukebox is verspreid. In deze gevallen raden systeembeheerders de gebruiker meestal aan om hun grote hoeveelheden kleinere bestanden samen te voegen in bestanden met een enkel archiefformaat. De opslaglaag hoeft dan alleen maar op zoek te gaan naar een enkel bestand, meestal opgeslagen op een enkel medium in de bibliotheek.