Hvad er beregningsprogvidenskab?
Computational Linguistics er et generelt felt, der omfatter mange aspekter af psykologi, sprogvidenskab, logik og datalogi. Det drejer sig om at hjælpe computere med at forstå sproglige problemer for at blive bedre til at automatisere aspekter af oversættelse, generation, tale og forståelse.
Computational Linguistics blev født efter en række mislykkede forsøg på automatiseret oversættelse. I slutningen af 1940'erne så den amerikanske regering et behov for maskinehåndteret oversættelse af tekster, især russiske tekster. Det blev antaget i betragtning af den lethed, som computere var blevet tilpasset til at håndtere matematiske problemer, at det at lære dem at oversætte sprog ville være en simpel affære. Det blev hurtigt tydeligt, at problemet var meget vanskeligere, og disciplinen i beregningsmæssig sprogvidenskab blev skabt.
I de tidlige dage af beregningsmæssig sprogvidenskab blev feltet domineret af computerforskere. Siden 1970'erne er det imidlertid blevet tydeligt, hvor kompleks LANGuage er faktisk, og nutidig beregningsmæssig sprogvidenskab gør brug af eksperter fra en række felter.
Maskinoversættelse har altid været et vigtigt mål for beregningsprogvidenskab, og et, hvor feltet har gjort enorme fremskridt. Opgaven er meget kompleks, hvilket kræver identifikation af dele af tale, en forståelse af grammatik, et omfattende ordforråd og mekanismer til håndtering af kollokvialismer og slang. Maskinoversættelse er langt fra perfekt, men med hvert år bliver oversættelserne mere nøjagtige og mindre tvunget.
Talegenkendelse er et andet område af beregningsmæssig sprogvidenskab, der har set meget almen interesse. Efter et par abortive forsøg på mainstream-talegenkendelsessoftware i midten af 1990'erne, blev feltet tavs i et stykke tid. I det tidlige 21. århundrede ankom imidlertid en række nye talegenkendelsessoftware -suiter på markedet med omfattende LeaRning -systemer og høje nøjagtighedshastigheder. Dette har ført til en fornyet interesse for talegenkendelsessoftware af offentligheden og en ledsagende stigning i finansiering og forskning.
Talegenerering er et relateret felt for beregningsmæssig sprogvidenskab, der har set en stabil udvikling siden 1980'erne. At nå en naturlig klingende læsning af skriftlig tekst er et meget vanskeligt problem, men en, der har enorme potentielle fordele. For ikke-synlige brugere kan talegenereringssoftware være kritisk for at nyde frugterne af den digitale tidsalder.
Beregningsprogvidenskab spiller også en stor rolle i automatiserede grammatiske korrektionssystemer, såsom dem, der er integreret i de mest populære tekstbehandlere. En nøjagtig grammatikchecker kræver en sofistikeret evne til at identificere dele af tale og en omfattende liste over grammatiske regler og undtagelser. Mens de fleste mainstream -grammatikkontrol stadig har mange problemer, bliver de allerede uundværlige for mange i den nye generation.
Computational Linguistics er en spændende felttegning fra en lang række discipliner. De problemer, det skal løse, er mange, og ingen er enkle. De futuristiske visioner, det ser frem til, men gør det til en kamp, der er værd at være værd. Fra drømmen om en universel oversætter til ord-perfekt talegenkendelse kan målene for beregningsmæssig sprogvidenskab ikke undgå at fremkalde en følelse af forundring.