Hva er beregningsspråklig?

Computational Linguistics er et generelt felt som omfatter mange aspekter ved psykologi, språkvitenskap, logikk og informatikk. Det er opptatt av å hjelpe datamaskiner med å forstå språklige spørsmål for å bli flinkere til å automatisere aspekter ved oversettelse, generasjon, tale og forståelse.

Beregningsspråklig lingvistikk ble født etter en rekke mislykkede forsøk på automatisert oversettelse. På slutten av 1940-tallet så den amerikanske regjeringen behov for maskinhåndtert oversettelse av tekster, særlig russiske tekster. Det ble antatt, gitt det enkle at datamaskiner hadde blitt tilpasset for å håndtere matematiske problemer, at det å lære dem å oversette språk ville være en enkel affære. Det viste seg raskt at problemet imidlertid var mye vanskeligere, og disiplinen for beregningsspråklig lingvistikk ble opprettet.

I de første dagene av beregningsspråklig lingvistikk ble feltet dominert av datavitere. Siden 1970 -tallet har det imidlertid vist seg hvor kompleks LANGuage er faktisk, og moderne beregningsspråklig nytte av eksperter fra en rekke felt.

Maskinoversettelse har alltid vært et hovedmål for beregningsspråklig, og et der feltet har gjort enorme fremskritt. Oppgaven er veldig kompleks, og krever identifisering av tale deler, en forståelse av grammatikk, et omfattende ordforråd og mekanismer for å håndtere kollokvialismer og slang. Maskinoversettelse er langt fra perfekt, men med hvert år blir oversettelsene mer nøyaktige og mindre tvungne.

Talegjenkjenning er et annet område av beregningsspråklig lingvistikk som har sett mye allmenne interesse. Etter noen få abortforsøk på mainstream talegjenkjenningsprogramvare på midten av 1990-tallet, gikk feltet stille en tid. På begynnelsen av det 21. århundre ankom imidlertid en rekke nye programvare -programvare -suiter på markedet med omfattende LEArning -systemer og høye nøyaktighetshastigheter. Dette har ført til en fornyet interesse for programvare for talegjenkjenning av allmennheten og en tilhørende økning i finansiering og forskning.

Talegenerering er et beslektet felt av beregningsspråklig lingvistikk som har sett jevn utvikling siden 1980 -tallet. Å nå en naturlig klingende lesing av skriftlig tekst er et veldig vanskelig problem, men en som har enorme potensielle fordeler. For ikke-synlige brukere kan taleproduksjonsprogramvare være avgjørende for å glede seg over fruktene i den digitale tidsalderen.

Computational Linguistics spiller også en stor rolle i automatiserte grammatikk -korreksjonssystemer, for eksempel de som er integrert i de fleste populære tekstbehandlere. En nøyaktig grammatikkkontroll krever en sofistikert evne til å identifisere deler av tale og en omfattende liste over grammatiske regler og unntak. Mens de fleste mainstream -grammatikkstår fortsatt har mange problemer, blir de allerede uunnværlige for mange i den nye generasjonen.

Computational Linguistics er en spennende felttegning fra et bredt spekter av fagområder. Problemene det må løse er mange, og ingen er enkle. De futuristiske visjonene den ser frem til, gjør det imidlertid til en kamp vel verdt. Fra drømmen om en universell oversetter til ord-perfekt talegjenkjenning, kan ikke målene for beregningsspråklig lingvistikk annet enn å fremkalle en følelse av undring.

ANDRE SPRÅK