Hva er Word Sense Disambiguation?
Word Sense Disambiguation (WSD) ligger i kjernen av programmer designet for å tolke språk. Tvetydige ord eller setninger kan forstås på flere måter, selv om bare en betydning er ment. dis Embiguation søker å tyde den tiltenkte betydningen av ord og setninger. Dette området er ekstremt utfordrende for programmerere som har til oppgave å designe nøyaktige grensesnitt for å bygge bro mellom gapet mellom muntlige og skriftspråk, og datamaskingenererte oversettelser.
Programvare designet for å konvertere tale-til-tekst kan "lytte" til en bruker som snakker til en mikrofon og oversette talte ord til typede setninger. Brukeren dikterer tegnsetting, og interjiserer ord som "komma" og "periode" der det er aktuelt. Dette høres ganske greit ut, bortsett fra at mange ord høres nøyaktig like ut.
For eksempel Know og no eller i og eye er fonetisk ikke skillebare. Word Sense Disambiguation hjelper til med å oversette, "Jeg burde vite det neste uke," ordentlig, ved å bruke det som i utgangspunktet er et sett med "hvis, da" regler som tar ordplassering og tilstøtende ord i betraktning som indikatorer på det tiltenkte ordet. Denne typen ordfølelse disambiguation er kjent som den "grunne tilnærmingen" og er ganske nøyaktig, men kan ikke alltid stole på.
En annen tilnærming er å anvende "verdenskunnskap", eller hvilken datamaskinspråklig kaller den "dype tilnærmingen." Denne tilnærmingen er avhengig av leksikoner som ordbøker og tesaurus for å bestemme et ords rette sans. Dessverre er det ikke en enkel oppgave å utforme en dyp tilnærmingsdatabase som er omfattende nok til å gi bedre nøyaktighet enn den grunne tilnærmingen.
Programvare som leser tekst høyt (tekst-til-tale) krever også disambiguering av ord. Ordet bass , for eksempel, kan bety et musikkinstrument, en lapp eller en fisk. I sistnevnte tilfelle uttales det annerledes, og overlater det til WSD til DEDuce hvilken uttalen du skal bruke. Hvis den skrevne setningen tilfeldigvis er "Bassen er tung", kan bare en skanning av setninger omgivende avsløre ledetråder, for eksempel å finne ordene "fiske", "båt", "dock", eller omvendt, "band", "musikk" eller "sang." Hvis programmets ordfølelse disambiguation ikke er robust nok, eller hvis ytterligere ledetråder er fraværende, kan programmet gjøre feil i oversettelsen.
I tillegg til "hvis, da" regler for den grunne tilnærmingen, brukes algoritmer også for å bestemme riktige tolkninger. I eksemplet ovenfor kan en algoritme finne stikkord i hele dokumentet som tydelig peker på en musikalsk tolkning, eller Visa Versa. Andre tilnærminger brukes også i WSD som i utgangspunktet er forbedringer eller utvidelser av disse grunnleggende tilnærmingene.
Disambiguering av Word Sense er også viktig i verbale kommandogrensesnitt designet for å erstatte tastaturet - ikke bare ved å videresende enkle operativsystemkommandoer, men i så komplekse oppgaver som å undersøke nettet. AnnenOmråder der WSD spiller en rolle inkluderer utvikling av den semantiske nettet og forbedrede kunstige intelligensmodeller. Faktisk vil ethvert område av vitenskap som er avhengig av en språklig bro mellom menneske og maskin, bruke ordsans for ordensfølelse.