Vad är Word Sense Disambiguation?
Word Sense Disambiguation (WSD) ligger i kärnan i programprogram som är utformade för att tolka språk. Tvetydiga ord eller meningar kan förstås flera sätt, även om bara en betydelse är avsedd. dis AMBIGUATION syftar till att dechiffrera den avsedda betydelsen av ord och meningar. Detta område är oerhört utmanande för programmerare som har till uppgift att utforma exakta gränssnitt för att överbrygga klyftan mellan talat och skriftligt språk och datorgenererade översättningar.
Programvara utformad för att konvertera tal-till-text kan "lyssna" på en användare som talar till en mikrofon och översätt talade ord till typade meningar. Användaren dikterar skiljetecken, avbryter ord som "komma" och "period" där så är lämpligt. Detta låter ganska enkelt förutom att många ord låter exakt lika.
till exempel Know och no eller i och öga är fonetiskt oskiljbara. Word Sense Disambiguation hjälper till att översätta, "Jag borde veta vid nästa vecka"Genom att använda det som i princip är en uppsättning "om, då" regler som tar ordplacering och angränsande ord i beaktande som indikatorer på det avsedda ordet. Denna typ av orolighetskänsla är känd som den "grunda tillvägagångssättet" och är ganska korrekt, men kan inte alltid räknas med.
En annan strategi är att tillämpa "världskunskap" eller vilken datorspråkistik som kallar "Deep Approach." Detta tillvägagångssätt förlitar sig på lexikoner som ordböcker och tesaurus för att bestämma ett ords ordentliga känsla. Tyvärr är det inte en lätt uppgift att utforma en djup tillvägagångssätt som är tillräckligt omfattande för att ge bättre noggrannhet än den grunda tillvägagångssättet.
Programvara som läser text högt (text-till-tal) kräver också oambigering av ordkänsla. Ordet bas , till exempel, kan betyda ett musikinstrument, en anteckning eller en fisk. I det senare fallet uttalas det annorlunda och lämnar det till WSD till DEDuce som uttalar att använda. Om den typade meningen råkar vara "Basen är tung", kan bara en skanning av omgivande meningar avslöja ledtrådar, till exempel att hitta orden "fiske", "båt", "docka" eller omvänt, "band", "musik" eller "sång." Om programmets Word Sense -disambiguation inte är tillräckligt robust, eller om ytterligare ledtrådar är frånvarande, kan programmet göra fel i översättningen.
Förutom "om, då" regler för den grunda tillvägagångssättet används algoritmer också för att bestämma korrekta tolkningar. I exemplet ovan kan en algoritm hitta nyckelord i hela dokumentet som tydligt pekar på en musikalisk tolkning, eller visum versa. Andra tillvägagångssätt används också i WSD som i princip är förfiningar eller tillägg av dessa grundläggande tillvägagångssätt.
Word Sense Disambiguation är också avgörande i verbala kommandogränssnitt som är utformade för att ersätta tangentbordet - inte bara för att vidarebefordra enkla operativsystemkommandon, utan i sådana komplexa uppgifter som att undersöka webben. AndraOmråden där WSD spelar en roll inkluderar utveckling av den semantiska webben och förbättrade modeller för artificiell intelligens. Faktum är att alla vetenskapsområden som förlitar sig på en språklig bro mellan människa och maskin kommer att använda ordkänsla.