Che cos'è la disambiguazione del senso delle parole?
La disambiguazione del senso delle parole (WSD) è alla base dei programmi software progettati per interpretare il linguaggio. Parole o frasi ambigue possono essere comprese in molti modi, sebbene sia previsto un solo significato. Il disambiguo cerca di decifrare il significato voluto di parole e frasi. Quest'area è estremamente stimolante per i programmatori incaricati di progettare interfacce accurate per colmare il divario tra la lingua parlata e scritta e le traduzioni generate al computer.
Il software progettato per convertire il parlato in testo può "ascoltare" un utente che parla in un microfono e tradurre parole pronunciate in frasi dattiloscritte. L'utente detta la punteggiatura, interponendo parole come "virgola" e "punto" ove appropriato. Sembra abbastanza semplice, tranne per il fatto che molte parole suonano esattamente allo stesso modo.
Ad esempio, sapere e no o I e l' occhio sono foneticamente indistinguibili. La disambiguazione del senso delle parole aiuta a tradurre correttamente "dovrei saperlo entro la prossima settimana", usando ciò che è fondamentalmente un insieme di regole "se, quindi" che prendono in considerazione il posizionamento delle parole e le parole adiacenti come indicatori della parola desiderata. Questo tipo di chiarimento del senso delle parole è noto come "approccio superficiale", ed è abbastanza accurato, ma non si può sempre contare.
Un altro approccio è quello di applicare la "conoscenza del mondo" o quella che la linguistica informatica chiama "approccio profondo". Questo approccio si basa su lessici come dizionari e thesaurus per aiutare a determinare il senso proprio di una parola. Sfortunatamente, progettare un database di approccio profondo sufficientemente completo da fornire una migliore precisione rispetto all'approccio superficiale non è un compito facile.
Il software che legge ad alta voce il testo (sintesi vocale) richiede anche una chiara ambiguità del senso delle parole. La parola basso , ad esempio, potrebbe significare uno strumento musicale, una nota o un pesce. In quest'ultimo caso viene pronunciato in modo diverso, lasciando a WSD la possibilità di dedurre quale pronuncia utilizzare. Se la frase digitata dovesse essere "Il basso è pesante", solo una scansione delle frasi circostanti potrebbe rivelare indizi, come trovare le parole "pesca", "barca", "bacino" o, al contrario, "banda", " musica "o" canzone ". Se la parola senso di disambiguazione del programma non è abbastanza solida, o se mancano ulteriori indizi, il programma può commettere errori nella traduzione.
Oltre alle regole "if, then" dell'approccio superficiale, gli algoritmi vengono utilizzati anche per determinare interpretazioni corrette. Nell'esempio sopra, un algoritmo potrebbe trovare parole chiave in tutto il documento che indicano chiaramente un'interpretazione musicale o viceversa. Altri approcci sono anche usati in WSD che sono fondamentalmente perfezionamenti o estensioni di questi approcci di base.
La chiara ambiguità del senso delle parole è vitale anche nelle interfacce di comandi verbali progettate per sostituire la tastiera, non solo nel trasmettere semplici comandi del sistema operativo, ma in compiti così complessi come la ricerca sul Web. Altre aree in cui WSD ha un ruolo includono lo sviluppo del Web semantico e modelli di intelligenza artificiale migliorati. In effetti, qualsiasi area della scienza che si basa su un ponte linguistico tra uomo e macchina userà il chiarimento del senso delle parole.