Vad är naturligt språkbearbetning?
Naturligt språkbearbetning (NLP) är ett sätt att översätta mellan datorspråk och mänskliga språk. Målet med detta fält är att låta datorer förstå vad en text säger utan att ges exakta värden och ekvationer för data som texten innehåller. I huvudsak automatiserar naturligt språkbearbetning översättningsprocessen mellan mänskliga och datorspråk. Även om mycket av detta fält förlitar sig på statistik och modeller för att bestämma sannolika betydelser för en fras, finns det och har funnits många olika tillvägagångssätt för detta problem. Fynd inom detta område har tillämpningar inom områdena taligenkänning, översättning av mänskligt språk, informationssökning och till och med artificiell intelligens.
Utvecklingen av en bakgrund inom datavetenskap och lingvistik, naturliga språkbehandling står inför många problem eftersom språket inte alltid är konsekvent och inte alla ledtrådar till betydelse finns i själva språket. Till och med en komplett redogörelse för hela grammatiken på ett språk inklusive alla undantag gör det inte alltid möjligt för en dator att analysera informationen i en text. Vissa meningar är syntaktiskt tvetydiga, ord har ofta mer än en betydelse, och vissa kombinationer av ljud eller symboler ändrar sin betydelse beroende på ordsgränserna - allt kan vara problem för en dator som inte förstår sammanhang. Ännu viktigare är att mycket av språket beror på en anslutning till det fysiska och sociala universum - vissa meningar, till exempel talhandlingar, förmedlar inte information lika mycket som handlar om världen. Även om en dator har en perfekt förståelse av mänskligt språk syntax och semantik, måste den text som ska analyseras vara fri från mänskliga enheter, som sarkasme eller passiv aggression, för att datorn korrekt kan fastställa vad texten betyder.
Ideologiskt är naturligt språkbearbetning ett system för människa-datorinteraktion som styrs av idén att de flesta datoranvändare är bekvämare att arbeta med datorer på ett mänskligt språk som de redan känner än att anpassa sig till en dators språk. Det utnyttjar också det faktum att mycket av mänsklig kunskap redan är kodad på mänskligt språk, och texterna som innehåller den kunskapen kan översättas till logiska strukturer som kan rationaliseras för en dator. Medan många projekt inom detta område arbetar för att extrahera dataläsbar data från mänskliga språktexter, används naturligt språkbearbetning för att generera mänskliga läsbara texter från datordata. Både dessa förståelses- och genereringsfaciliteter kan användas av samma teknik, till exempel när det gäller applikationer som översätter från ett mänskligt språk till ett annat genom att först avkoda texten till ett datorspråk och sedan koda det på ett annat mänskligt språk. De innovationer som erhållits i naturliga språkbearbetningsinsatser är också påfallande tillämpliga för konstgjord intelligensprojekt på grund av i vilken grad mänsklig liknande intelligens definieras av en behärskning av det mänskliga språkets komplexitet.