Hvad er beregningssprogvidenskab?
Computational sprogvidenskab er et generelt felt, der omfatter mange aspekter af psykologi, lingvistik, logik og datalogi. Det handler om at hjælpe computere med at forstå sproglige problemer for at blive bedre til at automatisere aspekter af oversættelse, generation, tale og forståelse.
Computational lingvistik blev født efter en række mislykkede forsøg på automatisk oversættelse. I slutningen af 1940'erne så den amerikanske regering et behov for maskinhåndteret oversættelse af tekster, især russiske tekster. Man antog, i betragtning af, hvor let computere var blevet tilpasset til at håndtere matematiske problemer, at det ville være en enkel affære at lære dem at oversætte sprog. Det viste sig imidlertid hurtigt, at problemet var meget vanskeligere, og at computervingvistikens disciplin blev skabt.
I de tidlige dage af computervingvistik blev området domineret af computervidenskabsfolk. Siden 1970'erne er det imidlertid blevet tydeligt, hvor komplekst sprog faktisk er, og nutidig computing-sprogvidenskab bruger eksperter fra en række områder.
Maskinoversættelse har altid været et stort mål for beregningssprogetik, og et område, hvor feltet har gjort enorme fremskridt. Opgaven er meget kompliceret og kræver identifikation af dele af talen, forståelse af grammatik, et omfattende ordforråd og mekanismer til at håndtere kollokvialismer og slang. Maskinoversættelse er langt fra perfekt, men med hvert år bliver oversættelserne mere nøjagtige og mindre tvungne.
Talegenkendelse er et andet område inden for computing-sprogvidenskab, der har set stor offentlighedens interesse. Efter et par abortforsøg på mainstream talegenkendelsessoftware i midten af 1990'erne gik feltet stille for et stykke tid. I begyndelsen af det 21. århundrede ankom der imidlertid en række nye talegenkendelsessoftwarepakker på markedet med omfattende læringssystemer og høje nøjagtighed. Dette har ført til en fornyet interesse for talegenkendelsessoftware af offentligheden og en ledsagende stigning i finansiering og forskning.
Talegenerering er et beslægtet felt inden for computervingvistik, der har oplevet en jævn udvikling siden 1980'erne. At nå en naturlig lydende læsning af skrevet tekst er et meget vanskeligt problem, men det har enorme potentielle fordele. For ikke-seende brugere kan talegenereringssoftware være afgørende for at nyde frugterne af den digitale tidsalder.
Computational lingvistik spiller også en stor rolle i automatiserede grammatikorrektionssystemer, såsom dem, der er integreret i de mest populære tekstbehandlere. En nøjagtig grammatikontrol kræver en sofistikeret evne til at identificere dele af talen og en omfattende liste over grammatiske regler og undtagelser. Mens de fleste mainstream-grammatiske brikker stadig har mange problemer, bliver de allerede uundværlige for mange i den nye generation.
Computational lingvistik er en spændende felttegning fra en lang række discipliner. De problemer, den skal løse, er mange, og ingen af dem er enkle. De futuristiske visioner, den ser frem til, gør det imidlertid til en kamp, som er værd at være. Fra drømmen om en universel oversætter til ord-perfekt talegenkendelse, kan beregningssprogningens målsætninger ikke undgå at fremkalde en følelse af undring.