Hva er en Hash-funksjon?

En hasjfunksjon er en metode for kontroll av datamaskinfeil og organisering av data. En stor mengde data blir manipulert med en matematisk algoritme til et lite antall er igjen. Dette nummeret brukes som en del av katalogen som lar en datamaskin finne den spesifikke informasjonen senere. En god hasjfunksjon skal gi et lite nok resultat slik at det er enkelt å bruke, men gi et unikt resultat for hvert datasett. En hasjfunksjon gir også minimal feilsjekk, ettersom en ødelagt og et godt stykke data bør gi forskjellige resultater når du haster.

I en datamaskindatabase er det vanligvis lettere å lagre steder med tall i stedet for bokstaver. Sifre har et mye større antall metoder for organisering og sortering enn bokstaver. Som et resultat blir numre ofte tildelt steder som inneholder variabel informasjon i datamaskinens database. Disse tallene kan være vilkårlige eller representative for informasjonen.

Vilkårlige tall tildeles ganske enkelt basert på plassering i datamaskinens minne eller i hvilken rekkefølge dataene ble lagret. Lagring av informasjon på denne måten er vanlig i mindre databaser eller steder der dataene ikke endres veldig ofte. Når det brukes på andre områder, begynner å indeksere databasen mer og mer tid før den ikke lenger er effektiv.

Representativ informasjon er der hasjfunksjonen kommer inn. Informasjonen, uansett hva den inneholder, er oversatt til tall. Disse tallene mates inn i en matematisk konstruksjon som gir ut et lite tall, typisk et helt tall. Hvis hasjfunksjonen fungerer som den skal, vil hvert sted i den delen av databasen ha sitt eget unike resultat. Hvis to eller flere lokasjoner har samme resultat, kan programmer hente frem feil informasjon basert på den dupliserte hasjen.

Det er mulig å bruke en hasjfunksjon også for andre ting. Store mengder svært repeterende data kan deles inn i mindre verdier. Dette er spesielt hyggelig når du leter etter gjentatte sekvenser i store datasett. For eksempel består deoksyribonukleinsyre (DNA) av et veldig lite antall forskjellige komponenter. Når du bryter ned disse komponentene ved å bruke hasjverdier, blir steder der to DNA-strenger er like og forskjellige veldig tydelige, ganske enkelt fra å sammenligne to små tallkolonner.

Det siste området som hasjfunksjoner er nyttige, er ved feilsjekk. Når informasjonen er begynt å begynne med, blir verdien registrert som en del av stedets indeks. Hvis den informasjonen er nødvendig senere, blir informasjonen hentet sammen med den verdien. Hvis programmet omskolerer informasjonen og resultatet er annerledes, skjedde det på et tidspunkt korrupsjon. Denne korrupsjonen er vanligvis med dataene, ettersom en hasjkorrupsjon ville ha forhindret dataene fra å bli hentet i utgangspunktet.

Hva er en Hash-funksjon?

Hjalp denne artikkelen deg?