Wat is patroonherkenning?
Patroonherkenning is het vermogen van een systeem om patronen in gegevenssets te herkennen op basis van zowel geprogrammeerde als aangeleerde kennis. Dit is een belangrijk onderdeel van de informatica, omdat hiermee systemen kunnen worden ontwikkeld die in staat zijn tot complexe gegevensanalyse. Dit kan onderzoekers helpen gegevens snel te sorteren om betekenisvolle informatie te vinden, omdat ze de gegevens niet handmatig hoeven door te lezen om interessante plaatsen te vinden. Patroonherkenning kan ook nuttig zijn voor het opsporen van fouten, fraude en andere problemen binnen gegevenssets.
Dit verschilt van patroonvergelijking, waarbij het systeem materialen exact kan matchen met behulp van een bekende database. Een duidelijk voorbeeld van dit onderscheid is te zien in e-mailfilters. Veel webgebaseerde e-mailaccounts worden geleverd met een spammap. De e-mailprovider scant inkomende e-mail en gebruikt patroonherkenning om spam te identificeren en in deze map te plaatsen. De gebruiker kan ook zijn of haar e-mail filteren en de cliënt vragen e-mail van een bepaalde afzender of met bepaalde inhoud in een specifieke map te plaatsen.
Het controleren op spam vereist de mogelijkheid om algemene patronen te herkennen, zoals de aanwezigheid van specifieke woorden, bekende verdachte internetprotocoladressen (IP) en andere rode vlaggen die een brief als vals kunnen markeren. Dit is geavanceerder dan een filter, dat het systeem eenvoudig vraagt om patronen te matchen. Als het systeem een woord of afzender ziet die bij het patroon past, kan het de e-mail naar de juiste map verplaatsen.
Complexe algoritmen ondersteunen patroonherkenning. Het systeem kan verschillende middelen gebruiken om inkomende gegevens te onderzoeken en te beslissen hoe deze het beste kunnen worden verwerkt. Het kan worden geprogrammeerd om specifieke functies uit te voeren, zoals verdachte of corrupte gegevens naar een bepaalde locatie leiden, gegevens op een zinvolle manier classificeren, enzovoort. Het systeem is in staat om te leren en gebruikt dit als een hulpmiddel om beter te worden in patroonherkenning. Telkens wanneer een gebruiker bijvoorbeeld een e-mail als spam markeert, scant het systeem de e-mail om er meer over te weten te komen en zal het systeem niet de fout blijven maken soortgelijke e-mails in de inbox te plaatsen.
Computerwetenschappers ontwikkelen nieuwe patroonherkenningstechnieken in lab- en onderzoeksomgevingen. Deze kunnen voor verschillende taken worden toegepast en vereisen de bouw van neurale netwerken die kunnen communiceren met gegevens en in de loop van de tijd kunnen veranderen. Sommige programma's zijn uiterst geavanceerd en in staat tot zeer gedetailleerde patroonherkenning, en andere zijn eenvoudiger. Zulke programma's verminderen het aantal menselijke uren dat nodig is om gegevens te analyseren en kunnen dingen vangen die een mens zou kunnen missen, zoals bewijs van fraude in de vorm van onregelmatigheden die duizenden verzekeringsclaims omvatten.