Hvad er automatisk indeksering?
Automatisk indeksering er handlingen ved at bruge et computerprogram eller en algoritme til at gå gennem filer, dokumenter og websteder på søgning efter nøgleord. Dette kan bruges i individuelle programmer, men er også en populær algoritme for søgemaskiner, der skal gennemgå forskellige websteder for at finde ud af, om deres information er. En fordel ved automatisk indeksering er, at computeren let kan indeksere og søge i et dokument meget hurtigere, end en person kan. Ulempen er, at en person skal fremstille indekseren, og det er muligt for indeksøren at gå glip af nøglepunkter på grund af forkert programmering.
Der findes mange filer på Internettet, computere og lagerenheder. Hver af disse dokumenter angår normalt et specifikt emne, og tilbagevendende ord afslører dokumenternes emne. For eksempel bruger et medicinsk dokument typisk medicinske termer. Et automatisk indekseringsprogram går gennem dokumentet og kategoriserer dokumentet baseret på disse ord.
Nogle individuelle programmer, såsom dokumentlæsere, er i stand til at udføre automatisk indeksering. Når det kommer til søgning på et lokalt netværk, er denne funktion typisk inkluderet i databaser, der kan være vanskelige at søge manuelt. Det mest populære sted at finde automatisk indeksering er en online søgemaskine, fordi søgemaskinen skal matche brugerens nøgleord eller søgeterm med alle de eksisterende websteder. Uden denne funktion ville det være vanskeligt for folk at finde relevante websteder.
Den mest åbenlyse fordel ved automatisk indeksering er, at det tager arbejdet væk fra mennesker, der ikke kan scanne et dokument så hurtigt, som en computer kan. Computeren kan også kategorisere dokumenterne efter scanning af dem, så brugerne ikke behøver at udføre dette kedelige arbejde. Mens brugere muligvis bliver nødt til at kontrollere organisationen for fejl, fordi en indeksør nogle gange kan forkert placere et dokument, er dette stadig lettere end at gøre alt manuelt.
Selvom der er mange fordele, er der også ulemper ved at bruge automatisk indeksering. Som med ethvert program eller algoritme, skal en person oprette programmet. Dette betyder, at programmereren skal fortælle indeksøren, hvordan man parrer ord, hvilket kan føre til unøjagtigheder, der skyldes dårlig programmering. Indeksøren kan muligvis ikke være i stand til at adskille bestemte ord fra hinanden, eller den kan have et stort antal unøjagtigheder på grund af ulige nøgleord. For eksempel kan et medicinsk dokument, der diskuterer farerne ved kosmetik, forkert kategoriseres som et skønheds- og makeup-dokument.