Che cos'è il vocabolario controllato?
Il vocabolario controllato è un concetto di informatica e programmazione informatica che prevede l'utilizzo di termini precedentemente concordati o approvati nella costruzione di database relazionali, metadati ricercabili o altri sistemi in cui le parole leggibili dall'uomo sono utilizzate per contrassegnare le informazioni per il successivo recupero. La metodologia di utilizzo di un vocabolario controllato per classificare le informazioni è in diretto contrasto con il concetto di vocabolario del linguaggio naturale, in cui non vi sono termini concordati e tutte le parole utilizzate sono invece collegate da relazioni ponderate. Oltre alle parole di livello superiore utilizzate in un vocabolario controllato, è possibile utilizzare parole di supporto in modo che sinonimi o altri termini fortemente associati al termine di livello superiore possano attivare l'uso della parola di livello superiore. Le principali differenze misurate tra i sistemi di linguaggio naturale e i sistemi di vocabolario controllato sono la pertinenza dei risultati di una query utilizzando le parole, il volume di informazioni restituite e l'usabilità complessiva del sistema.
Vi sono molti casi in cui una raccolta di parole o termini viene utilizzata per rendere le informazioni arbitrarie, in costante cambiamento o disorganizzate più accessibili agli utenti. I termini di ricerca all'interno di un motore di ricerca Internet, un database di informazioni aziendali e persino una biblioteca di ricerca digitale sono tutti esempi di applicazioni attraverso le quali le informazioni possono essere classificate con termini di metadati anziché con una rigida struttura gerarchica. Le parole usate per descrivere un oggetto in tali situazioni costruiscono una sorta di indice ricercabile del più ampio pool di informazioni.
Un esempio dell'uso del vocabolario controllato può essere visto quando si considera un sistema di archiviazione per un'azienda. I file devono essere classificati in modo tale da essere facilmente e prevedibilmente recuperabili. Se un file riguarda le auto, potrebbe essere archiviato nella categoria "auto". Se un'altra persona avesse anche un file che tratta di automobili, senza un vocabolario controllato, il file potrebbe essere posizionato sotto l'intestazione "automobili", rendendo i due file difficili da trovare con una sola ricerca. Quando le categorie sono controllate, tutti i file relativi alle auto verrebbero inseriti in un'unica voce concordata.
Il vantaggio dell'uso di un vocabolario controllato è che le informazioni sono rigorosamente descritte in modo prevedibile. Ciò significa che chiunque sia a conoscenza del vocabolario sarà in grado di cercare informazioni in modo efficace e accurato. Una complicazione con il vocabolario, tuttavia, è che i termini di ricerca sono più difficili, se non impossibili, da generare automaticamente e di solito richiedono un intervento umano, il che rende un grande compito convertire i database esistenti per utilizzare un vocabolario controllato. Se il vocabolario non è abbastanza grande, allora c'è anche la possibilità che una singola query faccia apparire un così grande volume di informazioni che diventa poco pratico ordinare senza l'uso di un altro metodo di query.