Co to jest kontrolowane słownictwo?
Słownictwo kontrolowane to koncepcja w zakresie informatyki i programowania komputerowego, która obejmuje używanie jedynie wcześniej uzgodnionych lub zatwierdzonych warunków podczas konstruowania relacyjnych baz danych, metadanych do wyszukiwania lub innych systemów, w których słowa są używane do oznaczania informacji do późniejszego wyszukiwania. Metodologia stosowania kontrolowanego słownictwa do klasyfikowania informacji jest bezpośrednio kontrastowa z koncepcją słownictwa języka naturalnego, w którym nie ma uzgodnionych warunków, a wszystkie używane słowa są zamiast tego połączone relacjami ważonymi. Oprócz słów najwyższego poziomu, które są używane w kontrolowanym słownictwie, można użyć słów pomocniczych, więc synonimy lub inne terminy, które są silnie powiązane z terminem na najwyższym poziomie, mogą wyzwolić użycie słowa najwyższego poziomu. Główne różnice mierzone między systemami języka naturalnego a kontrolowanymi systemami słownictwa są znaczenie wyników zapytania za pomocą słów, objętości zwróconych informacji i oveUżyteczność systemu.
Istnieje wiele przypadków, w których zbiór słów lub terminów służy do tworzenia arbitralnych, stale zmieniających się lub zdezorganizowanych bardziej dostępnych dla użytkowników. Wyszukiwane kategorie w wyszukiwarce internetowej, korporacyjnej bazie danych informacji, a nawet cyfrowej biblioteki badawczej są przykładami aplikacji, za pomocą których informacje można podzielić na warunki metadanych, w przeciwieństwie do ścisłej struktury hierarchicznej. Słowa używane do opisania obiektu w takich sytuacjach budują rodzaj indeksu możliwego do przeszukiwania większej puli informacji.
Jeden przykład użycia kontrolowanego słownictwa można zobaczyć przy rozważaniu systemu zgłoszenia dla firmy. Pliki muszą być kategoryzowane w sposób, aby były łatwe i przewidywalnie do pobierania. Jeśli jeden plik dotyczy samochodów, można go złożyć w kategorii „samochody”. Jeśli inna osoba również ma plikTo dotyczy samochodów, bez kontrolowanego słownictwa, plik może być umieszczony pod nagłówkiem „samochody”, co utrudnia znalezienie dwóch plików za pomocą jednego wyszukiwania. Gdy kategorie są kontrolowane, wszystkie pliki zajmujące się samochodami zostaną umieszczone pod jednym uzgodnionym na kierunku.
Zaletą użycia kontrolowanego słownictwa jest to, że informacje są ściśle opisane w przewidywalny sposób. Oznacza to, że każdy, kto jest świadomy słownictwa, będzie w stanie skutecznie i dokładnie szukać informacji. Komplikacją słownictwa jest jednak to, że wyszukiwane terminy są trudniejsze, jeśli nie niemożliwe, generowanie automatycznie i zwykle wymagają pewnej interwencji człowieka, co czyni dużym zadaniem konwersji istniejących baz danych w celu użycia kontrolowanego słownictwa. Jeśli słownictwo nie jest wystarczająco duże, istnieje również możliwość, że jedno zapytanie przyniesie tak dużą ilość informacji, że sortowanie bez użycia innej q staje się niepraktyczneMetoda Uerying.