O que é uma função hash?

Uma função de hash é um método de verificação de erros do computador e organização de dados. Uma grande quantidade de dados é manipulada com um algoritmo matemático até que um pequeno número seja deixado. Esse número é usado como parte do catálogo que permite que um computador encontre essa informação específica posteriormente. Uma boa função de hash deve fornecer um resultado pequeno o suficiente para facilitar o uso, mas fornecer um resultado exclusivo para cada conjunto de dados. Uma função de hash também fornece verificação mínima de erros, pois dados corrompidos e uma boa parte de dados devem gerar resultados diferentes ao serem hash.

Em um banco de dados de computador, normalmente é mais fácil salvar locais com números do que com letras. Os dígitos têm um número muito maior de métodos de organização e classificação do que as letras. Como resultado, os números geralmente são atribuídos a locais que contêm informações variáveis ​​no banco de dados de um computador. Esses números podem ser arbitrários ou representativos das informações.

Os números arbitrários são simplesmente atribuídos com base na posição na memória do computador ou na ordem em que os dados foram salvos. Salvar informações dessa maneira é comum em bancos de dados menores ou em locais em que os dados não mudam com muita frequência. Quando usado em outras áreas, a reindexação do banco de dados começa a demorar cada vez mais até que não seja mais eficiente.

A informação representativa é onde entra a função hash. A informação, independentemente do que ela contém, é convertida em números. Esses números são alimentados em uma construção matemática que gera um número pequeno, geralmente um número inteiro. Se a função hash estiver funcionando corretamente, todos os locais nessa parte do banco de dados terão seu próprio resultado exclusivo. Se dois ou mais locais tiverem o mesmo resultado, os programas poderão exibir as informações incorretas com base no hash duplicado.

É possível usar uma função de hash para outras coisas também. Grandes quantidades de dados altamente repetitivos podem ser divididos em valores menores. Isso é especialmente bom ao procurar seqüências repetidas em grandes conjuntos de dados. Por exemplo, o ácido desoxirribonucleico (DNA) é constituído por um número muito pequeno de componentes diferentes. Ao dividir esses componentes usando valores de hash, lugares onde duas seqüências de DNA são iguais e diferentes se tornam muito claras, simplesmente pela comparação de duas pequenas colunas de números.

A última área na qual as funções de hash são úteis está na verificação de erros. Quando as informações são hash inicialmente, o valor é registrado como parte do índice do local. Se essas informações forem necessárias posteriormente, elas serão recuperadas junto com esse valor. Se o programa repassar as informações e o resultado for diferente, ocorreu uma corrupção em algum momento. Essa corrupção geralmente ocorre com os dados, pois uma corrupção de hash teria impedido que os dados fossem recuperados em primeiro lugar.

OUTRAS LÍNGUAS

Este artigo foi útil? Obrigado pelo feedback Obrigado pelo feedback

Como podemos ajudar? Como podemos ajudar?