Hva er en hasjfunksjon?

A Hash -funksjon er en metode for datamaskinfeilkontroll og dataorganisasjon. En stor mengde data manipuleres med en matematisk algoritme til et lite tall er igjen. Dette nummeret brukes som en del av katalogen som lar en datamaskin finne den spesifikke informasjonen senere. En god hasjfunksjon skal gi et lite nok resultat, så det er enkelt å bruke, men gi et unikt resultat for hvert datasett. En hash -funksjon gir også minimal feilkontroll, ettersom en ødelagt og et godt stykke data skal gi forskjellige resultater når hashed.

I en database er det vanligvis enklere å lagre steder med tall i stedet for bokstaver. Sifre har et mye større antall metoder for organisering og sortering enn bokstaver. Som et resultat blir tall ofte tilordnet steder som inneholder variabel informasjon i datamaskinens database. Disse tallene kan være vilkårlige eller representative for informasjonen.

vilkårlige tall tildeles ganske enkelt basert på posisjon i tHan datamaskinens minne eller rekkefølgen dataene ble lagret i. Å lagre informasjon på denne måten er vanlig i mindre databaser eller på steder der dataene ikke endres veldig ofte. Når det brukes i andre områder, begynner å indeksere databasen å ta mer og mer tid til den ikke lenger er effektiv.

Representativ informasjon er der hasjfunksjonen kommer inn. Informasjonen, uavhengig av hva den inneholder, blir oversatt til tall. Disse tallene mates inn i en matematisk konstruksjon som gir ut et lite antall, typisk et heltall. Hvis hasjfunksjonen fungerer som den skal, vil hvert sted i den delen av databasen ha sitt eget unike resultat. Hvis to eller flere lokasjoner har samme resultat, kan programmer få opp feil informasjon basert på den dupliserte hasj.

Det er mulig å bruke en hasjfunksjon for andre ting også. Store mengder svært repeterende data kan være BROken ned i mindre verdier. Dette er spesielt fint når du leter etter gjentatte sekvenser i store datasett. For eksempel består deoksyribonukleinsyre (DNA) av et veldig lite antall forskjellige komponenter. Når du bryter disse komponentene ved å bruke hasjverdier, blir steder der to strenger av DNA er de samme og forskjellige veldig klare, ganske enkelt fra å sammenligne to små kolonner med tall.

Det siste området der hasjfunksjonene er nyttige, er i feilkontroll. Når informasjonen først hashes, registreres verdien som en del av stedets indeks. Hvis denne informasjonen er nødvendig senere, hentes informasjonen sammen med den verdien. Hvis programmet omskyller informasjonen og resultatet er annerledes, skjedde en korrupsjon på et tidspunkt. Denne korrupsjonen er vanligvis med dataene, da en hasjkorrupsjon ville ha forhindret at dataene ble hentet i utgangspunktet.

ANDRE SPRÅK