Vad är Word Sense Disambiguation?

Word sense disambiguation (WSD) ligger i kärnan i programvara som är utformade för att tolka språk. Tvetydiga ord eller meningar kan förstås på flera sätt, även om endast en mening är avsedd. Dis ambiguation försöker dechiffrera den avsedda betydelsen av ord och meningar. Detta område är oerhört utmanande för programmerare som har till uppgift att utforma exakta gränssnitt för att överbrygga klyftan mellan talat och skriftligt språk och datorgenererade översättningar.

Programvara utformad för att konvertera tal-till-text kan "lyssna" på en användare som talar till en mikrofon och översätta talade ord till typade meningar. Användaren dikterar skiljetecken, interjecterar ord som "komma" och "period" där det är lämpligt. Detta låter ganska enkelt förutom att många ord låter exakt lika.

Till exempel vet och ingen eller jag och öga är fonetiskt omöjliga att skilja. Förkänsla av ordkänsla hjälper till att översätta "jag borde veta i nästa vecka" på rätt sätt genom att använda det som i princip är en uppsättning "om, då" -regler som tar hänsyn till ordplacering och angränsande ord som indikatorer för det avsedda ordet. Denna typ av disambiguation av ordkänsla är känd som "grunt synsätt" och är ganska exakt, men kan inte alltid räknas med.

Ett annat tillvägagångssätt är att tillämpa ”världskunskap”, eller vad datalingvistik kallar ”djup metod.” Denna metod förlitar sig på lexikoner som ordböcker och ordböcker för att hjälpa till att bestämma ordets rätta förnuft. Tyvärr är det inte en lätt uppgift att utforma en databas som är tillräckligt omfattande för att ge bättre noggrannhet än den grunt.

Programvara som läser text högt (text-till-tal) kräver också oordning för ordkänslighet. Ordet bas , till exempel, kan betyda ett musikinstrument, en anteckning eller en fisk. I det senare fallet uttalas det annorlunda och lämnar det till WSD för att härleda vilket uttal som ska användas. Om den skrivna meningen är "Bassen är tung", kan bara en genomsökning av omgivande meningar avslöja ledtrådar, till exempel att hitta orden "fiske", "båt", "docka" eller omvänt "band", " musik ”eller” låt. ”Om programmets förkänning av ordkänsla inte är tillräckligt robust, eller om ytterligare ledtrådar saknas, kan programmet göra fel i översättningen.

Förutom "om, då" -reglerna för den grunda metoden, används också algoritmer för att bestämma korrekta tolkningar. I exemplet ovan kan en algoritm hitta nyckelord i hela dokumentet som tydligt pekar på en musikalisk tolkning, eller visa versa. Andra tillvägagångssätt används också i WSD som i princip är förfining eller förlängning av dessa grundläggande tillvägagångssätt.

Förkänsla av ordkänsla är också avgörande i verbala kommandogränssnitt som är utformade för att ersätta tangentbordet - inte bara för att vidarebefordra enkla operativsystemkommandon, utan i så komplicerade uppgifter som att undersöka webben. Andra områden där WSD spelar en roll inkluderar utveckling av den semantiska webben och förbättrade modeller för artificiell intelligens. I själva verket kommer alla vetenskapsområden som förlitar sig på en språklig bro mellan människa och maskin använder ordkänslediskambudering.

ANDRA SPRÅK

Hjälpte den här artikeln dig? Tack för feedbacken Tack för feedbacken

Hur kan vi hjälpa? Hur kan vi hjälpa?