Co je automatické indexování?
Automatické indexování je úkon používání počítačového programu nebo algoritmu k procházení souborů, dokumentů a webových stránek při hledání klíčových slov. To lze použít v jednotlivých programech, ale také je oblíbeným algoritmem pro vyhledávače, které musí procházet různými weby, aby zjistily své informace. Výhodou automatického indexování je, že počítač může snadno indexovat a prohledávat dokument mnohem rychleji, než může osoba. Nevýhodou je, že osoba musí provést indexování, a je možné, aby indexátor vynechal klíčové body kvůli chybnému programování.
Na internetu, počítačích a úložných zařízeních je mnoho souborů. Každý z těchto dokumentů se obvykle týká konkrétního tématu a opakující se slova odhalí předmět dokumentů. Například lékařský dokument bude obvykle používat lékařské termíny. Program automatického indexování prochází dokumentem a dokument na základě těchto slov roztřídí.
Některé jednotlivé programy, například čtečky dokumentů, jsou schopny provádět automatické indexování. Pokud jde o vyhledávání v místní síti, je tato funkce obvykle součástí databází, které mohou být obtížně prohledávány ručně. Nejoblíbenějším místem, kde lze najít automatické indexování, je online vyhledávač, protože vyhledávač musí odpovídat klíčovému slovu uživatele nebo hledanému výrazu se všemi existujícími webovými stránkami. Bez této funkce by bylo pro lidi obtížné najít relevantní webové stránky.
Nejviditelnější výhodou automatického indexování je to, že práci odvádí lidi, kteří nemohou skenovat dokument tak rychle, jak to dokáže počítač. Počítač může také dokumenty po naskenování roztřídit, takže uživatelé nebudou muset tuto zdlouhavou práci provádět. I když uživatelé možná budou muset zkontrolovat organizaci kvůli chybám, protože indexátor někdy může dokument umístit špatně, je to stále snazší než všechno dělat ručně.
I když existuje mnoho výhod, existují také nevýhody používání automatického indexování. Stejně jako u každého programu nebo algoritmu musí osoba program vytvořit. To znamená, že programátor musí indexátorovi sdělit, jak párovat slova, což může vést k nepřesnostem způsobeným špatným programováním. Indexer také nemusí být schopen rozeznat určitá slova od sebe, nebo může mít velký počet nepřesností kvůli lichým klíčovým slovům. Například lékařský dokument, který pojednává o nebezpečích kosmetiky, může být nesprávně klasifikován jako dokument o kráse a líčení.