Che cos'è l'integrità delle entità?
L'integrità dell'entità è una delle regole primarie per un'efficace costruzione del database. Si riferisce al processo di applicazione di una chiave primaria per ogni tabella in un database, in cui la chiave deve essere una riga o una combinazione di righe che sono valori univoci non nulli. Mantenendo l'integrità dell'entità, ogni record in ciascuna tabella di un database può essere specificamente identificato tramite la chiave primaria. Ciò impedisce record duplicati e altri problemi che comprometterebbero indirettamente l'integrità del database. In assenza di integrità dell'entità, le voci in un database possono sovrapporsi accidentalmente, poiché non vi sarà modo di estrarre una voce specifica dalla tabella.
Quando si considera la prima parte dell'integrità dell'entità, un valore "unico", il concetto di chiave primaria è importante da capire. Una chiave primaria in un database è un valore utilizzato per identificare in modo specifico ogni singolo record. Per essere efficace, una chiave primaria deve essere unica; in altre parole, deve essere impossibile recuperare più record cercando una singola chiave primaria. Un numero di previdenza sociale sarebbe una buona chiave primaria per un database incentrato sui singoli record personali negli Stati Uniti, dal momento che due persone non hanno mai lo stesso numero. Chiunque cerchi nel database un determinato numero di previdenza sociale, per definizione, recupererebbe solo un singolo record alla volta.
Per vedere i problemi che sorgono in assenza di integrità dell'entità attraverso chiavi primarie univoche, si potrebbe immaginare un database in cui il cognome di un individuo viene usato come chiave primaria. Dal momento che più di una persona può condividere un cognome, inserendo "Smith" o "Jones" in quanto i criteri di ricerca potrebbero produrre decine di record. In tal caso, l'integrità del database è in questione poiché l'utente finale non ha più un metodo per recuperare i singoli record.
La seconda parte dell'integrità dell'entità afferma che il valore scelto come chiave primaria non deve mai essere un valore nullo o vuoto per qualsiasi elemento nel database. Se il valore della chiave primaria rimanesse nullo per uno o più record nel database, alcuni record diventerebbero impossibili da recuperare, poiché un valore null non è sufficiente per identificare in modo univoco questi record. In altre parole, se un numero di previdenza sociale viene utilizzato come chiave primaria e un dipendente non proviene dagli Stati Uniti e quindi non ne ha uno, il record del dipendente straniero sarà impossibile da identificare utilizzando la chiave primaria, invalidando l'integrità del database .