Hvad er naturlig sprogbehandling?
Natural Language Processing (NLP) er en måde at oversætte mellem computersprog og menneskelige sprog. Målet med dette felt er at give computere mulighed for at forstå, hvad en tekst siger uden at få præcise værdier og ligninger for de data, som teksten indeholder. I det væsentlige automatiserer naturlig sprogbehandling oversættelsesprocessen mellem menneskelige og computersprog. Mens meget af dette felt er afhængig af statistikker og modeller for at bestemme sandsynlige betydninger af en sætning, er der og har været mange forskellige tilgange til dette problem. Resultater på dette felt har anvendelser inden for områderne talegenkendelse, oversættelse af menneskelige sprog, indhentning af oplysninger og endda kunstig intelligens.
Udvikling af baggrund inden for datalogi og sprogvidenskab står naturligt sprogbehandling over for mange problemer, fordi sprog ikke altid er konsistent, og ikke alle ledetråde til mening er Contained på selve sproget. Selv en komplet redegørelse for hele grammatikken på et sprog, der inkluderer alle undtagelser, tillader ikke altid en computer at analysere oplysningerne i en tekst. Nogle sætninger er syntaktisk tvetydige, ord har ofte mere end én betydning, og nogle kombinationer af lyde eller symboler ændrer deres betydning afhængigt af ordets grænser - som alle kan være problemer for en computer, der ikke forstår kontekst. Vigtigere er det, at meget af sproget afhænger af en forbindelse til det fysiske og sociale univers - nogle sætninger, såsom talehandlinger, formidler ikke information så meget som handling om verden. Selv hvis en computer har en perfekt forståelse af menneskelig sprogsyntaks og semantik, skal teksten, der skal analyseres, være fri for menneskelige enheder, såsom sarkasme eller passiv aggression, for at computeren korrekt skal konstatere, hvad teksten betyder.
Ideologisk er naturlig sprogbehandling et system med interaktion mellem mennesker og computer, som jegS styret af ideen om, at de fleste computerbrugere er mere komfortable med at arbejde med computere på et menneskeligt sprog, de allerede kender, end at tilpasse sig en computers sprog. Det kapitaliserer også, at meget af menneskelig viden allerede er kodet på menneskets sprog, og de tekster, der indeholder denne viden, kan oversættes til logiske strukturer, der kan strømline til en computer. Mens mange projekter på dette felt arbejder for at udtrække computerlæsbare data fra menneskelige sprogtekster, bruges naturlig sprogbehandling også til at generere menneskelige læsbare tekster fra computerdata. Både disse forståelse og generering af faciliteter kan bruges af den samme teknologi, såsom i tilfælde af applikationer, der oversættes fra et menneskeligt sprog til et andet ved at først afkode teksten til et computersprog og derefter kode den på et andet menneskeligt sprog. De innovationer, der er opnået i naturlige sprogbehandlingsbestræbelserI hvilken grad menneskelig lignende intelligens defineres ved en mestring af kompleksiteten af menneskeligt sprog.