Hva er mønstergjenkjenning?
Mønstergjenkjenning er et systems evne til å gjenkjenne mønstre i sett med data, avhengig av både programmert og innlært kunnskap. Dette er en viktig del av informatikk, fordi det gir mulighet for utvikling av systemer som er i stand til kompleks dataanalyse. Dette kan hjelpe forskere til å sortere data raskt for å finne meningsfull informasjon, fordi de ikke trenger å lese dataene manuelt for å finne interessante steder. Mønstergjenkjenning kan også være nyttig for å oppdage feil, svindel og andre problemer i datasettene.
Dette er forskjellig fra mønstermatching, der systemet nøyaktig kan matche materialer ved å bruke en kjent database. Et tydelig eksempel på denne skillet kan sees i e-postfilter. Mange nettbaserte e-postkontoer har en spam-mappe. E-postleverandøren skanner innkommende e-post og bruker mønstergjenkjenning for å identifisere spam og slippe den inn i denne mappen. Brukeren kan også filtrere e-posten sin og be klienten om å slippe e-post fra en bestemt avsender eller med bestemt innhold til en bestemt mappe.
Handlingen for å se etter spam krever muligheten til å gjenkjenne generelle mønstre, for eksempel tilstedeværelsen av spesifikke ord, kjente mistenkelige internettprotokoller (IP) -adresser og andre røde flagg som kan merke en bokstav som falsk. Dette er mer avansert enn et filter, som ganske enkelt ber systemet om å matche mønstre. Hvis systemet ser et ord eller avsender som passer til mønsteret, kan det flytte e-posten til riktig mappe.
Komplekse algoritmer støtter mønstergjenkjenning. Systemet kan bruke flere måter for å utforske innkommende data og bestemme hvordan de skal håndteres best. Den kan programmeres til å utføre spesifikke funksjoner, for eksempel å dirigere mistenkelige eller korrupte data til et bestemt sted, klassifisere data på en meningsfull måte og så videre. Systemet er i stand til å lære og bruker dette som et verktøy for å bli bedre på mønstergjenkjenning. Hver gang en bruker flagger en e-post som spam, for eksempel, skanner systemet e-posten for å lære mer om den, og systemet vil ikke fortsette å gjøre feilen ved å legge lignende e-poster i innboksen.
Datavitere utvikler nye mønstergjenkjenningsteknikker i laboratorie- og forskningsmiljøer. Disse kan brukes på en rekke oppgaver og krever bygging av nevrale nettverk som er i stand til å samhandle med data og endre seg over tid. Noen programmer er ekstremt sofistikerte og i stand til veldig detaljert mønstergjenkjenning, og andre er mer enkle. Slike programmer reduserer antallet menneskelige timer som kreves for å analysere data og kan fange ting som et menneske kan gå glipp av, for eksempel bevis på svindel i form av uregelmessigheter som spenner over tusenvis av forsikringskrav.