Hoe wordt entiteitherkenning genoemd?
Hoewel het perspectief van een eindgebruiker het proces van het invoeren van gegevens in een computer vrij eenvoudig is, initieert het proces eigenlijk verschillende andere kleinere processen. Voor elk stukje gegevens moet de computer die informatie vertalen in een taal die hij begrijpt. Computers gebruiken een interne taal die bekend staat als binary waarin een verzameling "1" en "0" tekens samen vormen om de computer te vertellen wat te doen. De naam Entity Recognition is een methode om het vertaalproces te stroomlijnen van invoer naar gegevens, de computer te helpen bij het breken van zinnen in hun onderdelen.
Wanneer u gegevens invoert met de meeste computerprogramma's of webpagina's, vraagt het programma of webpagina u in het algemeen om een specifiek stukje informatie in elk veld in te voeren, zoals de "naam" of "Adres" -velden. Een benoemd entiteitherkenningsprogramma maakt het meeste van dat, waardoor de eindgebruiker in plaats daarvan snaren-zinnen-van tekst kan invoeren, waardoor een meer natuurlijke interface wordt geboden. Het programma neemt deGegevens die u hebt ingevoerd en sorteert deze in stukken die het gemakkelijker kan begrijpen.
Neem een zin als "Joe bestelde vier bushels bananen." In een traditioneel programma zou de eindgebruiker "Joe" moeten invoeren in het veld "Werknemersnaam", "bananen" in het veld "Aankooptype", "Four" in het veld "Quantity" en "Bushels" in het veld "Units". In een genoemde instelling van de entiteitherkenning zou de eindgebruiker eenvoudigweg de hele zin invoeren zoals geschreven. Zodra de gebruiker klikt, sorteert de computer de zin in stukken en voert hij dezelfde uitsplitsing uit van gegevens die de gebruiker vroeger zou hebben gebruikt.
Hoewel dit veel gestroomlijnder is dan een traditioneel invoerprogramma dat is ontworpen uit velden, is er één aanzienlijk nadeel: potentieel falen van het vertaalalgoritme. Minder intelligente genoemde algoritmen voor entiteitherkenning kunnen de zin slechts op één specifieke manier 'begrijpen'. In andere WORDS, als de werknemer de straf opnieuw had geformuleerd en schreef: "Vier bushels bananen werden besteld door Joe", het programma kan moeite hebben om de onderdelen te begrijpen en te sorteren. Om deze reden, hoewel de eindgebruiker niet langer verantwoordelijk is voor het invoeren van gegevens in velden, is het nog steeds niet zo freeform als het systeem in het begin.