Hvad er mønstergenkendelse?
Mønstergenkendelse er et systems evne til at genkende mønstre inden for datasæt, der er afhængige af programmeret såvel som indlært viden. Dette er en vigtig del af datalogi, fordi det giver mulighed for udvikling af systemer, der er i stand til kompleks dataanalyse. Dette kan hjælpe forskere med at sortere data hurtigt for at finde meningsfulde oplysninger, fordi de ikke behøver at læse dataene manuelt for at finde interessante steder. Mønstergenkendelse kan også være nyttig til at opdage fejl, svig og andre problemer inden for datasæt.
Dette adskiller sig fra mønstermatchning, hvor systemet nøjagtigt kan matche materialer ved hjælp af en kendt database. Et klart eksempel på denne sondring kan ses i e-mail-filtre. Mange webbaserede e-mail-konti leveres med en spam-mappe. E-mail-udbyderen scanner indgående e-mail og bruger mønstergenkendelse til at identificere spam og slippe den i denne mappe. Brugeren kan også filtrere sin e-mail og bede klienten om at slippe e-mail fra en bestemt afsender eller med bestemt indhold i en bestemt mappe.
Handlingen med at kontrollere for spam kræver evnen til at genkende generelle mønstre, såsom tilstedeværelsen af specifikke ord, kendte mistænkelige internetprotokoller (IP) adresser og andre røde flag, der kan markere et brev som falsk. Dette er mere avanceret end et filter, som simpelthen beder systemet om at matche mønstre. Hvis systemet ser et ord eller afsender, der passer til mønsteret, kan det flytte e-mailen til den relevante mappe.
Komplekse algoritmer understøtter mønstergenkendelse. Systemet kan bruge flere måder til at undersøge indgående data og beslutte, hvordan de bedst skal håndteres. Det kan programmeres til at udføre specifikke funktioner, såsom at dirigere mistænkelige eller korrupte data til et bestemt sted, klassificere data på en meningsfuld måde og så videre. Systemet er i stand til at lære og bruger dette som et værktøj til at blive bedre til mønstergenkendelse. Hver gang en bruger markerer for eksempel en e-mail som spam, scanner systemet e-mailen for at lære mere om den, og systemet fortsætter ikke med at begå fejlen ved at lægge lignende e-mails i indbakken.
Computerforskere udvikler nye mønstergenkendelsesteknikker i laboratorie- og forskningsmiljøer. Disse kan bruges til en række forskellige opgaver og kræver konstruktion af neurale netværk, der er i stand til at interagere med data og ændre sig over tid. Nogle programmer er ekstremt sofistikerede og er i stand til meget detaljeret mønstergenkendelse, og andre er mere forenklede. Sådanne programmer skærer ned på antallet af menneskelige timer, der kræves for at analysere data og kan fange ting, som et menneske måtte gå glip af, såsom bevis for svig i form af uregelmæssigheder, der spænder over tusinder af forsikringskrav.