Co to jest językoznawstwo obliczeniowe?
Językoznawstwo komputerowe to ogólna dziedzina, która obejmuje wiele aspektów psychologii, językoznawstwa, logiki i informatyki. Zajmuje się pomaganiem komputerom w zrozumieniu zagadnień językowych w celu lepszego automatyzacji aspektów tłumaczenia, generowania, mowy i rozumienia.
Lingwistyka komputerowa narodziła się po wielu nieudanych próbach automatycznego tłumaczenia. Pod koniec lat 40. XX w. Rząd USA zauważył potrzebę tłumaczenia maszynowego tekstów, zwłaszcza tekstów rosyjskich. Zakładano, biorąc pod uwagę łatwość, z jaką komputery zostały przystosowane do rozwiązywania problemów matematycznych, że nauczenie ich tłumaczenia języka byłoby prostą sprawą. Szybko stało się jednak jasne, że problem był znacznie trudniejszy i stworzono dyscyplinę lingwistyki komputerowej.
We wczesnych latach lingwistyki komputerowej w tej dziedzinie dominowali informatycy. Jednak od lat siedemdziesiątych stało się jasne, jak skomplikowany jest język, a współczesna lingwistyka komputerowa korzysta z ekspertów z wielu dziedzin.
Tłumaczenie maszynowe zawsze było głównym celem językoznawstwa komputerowego i jednym z nich był ogromny postęp w tej dziedzinie. Zadanie jest bardzo złożone, wymaga identyfikacji części mowy, zrozumienia gramatyki, obszernego słownictwa i mechanizmów radzenia sobie z kolokwializmami i slangiem. Tłumaczenie maszynowe jest dalekie od ideału, ale z każdym rokiem tłumaczenia stają się dokładniejsze i mniej wymuszone.
Rozpoznawanie mowy to kolejny obszar lingwistyki obliczeniowej, który cieszy się dużym zainteresowaniem opinii publicznej. Po kilku nieudanych próbach głównego oprogramowania do rozpoznawania mowy w połowie lat dziewięćdziesiątych, na chwilę zapadła cisza. Jednak na początku XXI wieku na rynku pojawiło się wiele nowych programów do rozpoznawania mowy, które oferują rozbudowane systemy uczenia się i wysoką dokładność. Doprowadziło to do ponownego zainteresowania ogółem oprogramowaniem do rozpoznawania mowy przez ogół społeczeństwa i towarzyszącego mu wzrostu finansowania i badań.
Generowanie mowy jest pokrewną dziedziną językoznawstwa komputerowego, która rozwija się od lat 80. XX wieku. Osiągnięcie naturalnie brzmiącego tekstu pisanego jest bardzo trudnym problemem, ale ma ogromne potencjalne korzyści. Dla użytkowników niedowidzących oprogramowanie do generowania mowy może mieć kluczowe znaczenie dla czerpania korzyści z epoki cyfrowej.
Lingwistyka obliczeniowa odgrywa również dużą rolę w automatycznych systemach korekcji gramatycznej, takich jak te zintegrowane z najpopularniejszymi edytorami tekstu. Dokładny moduł sprawdzania gramatyki wymaga wyrafinowanej umiejętności identyfikowania części mowy oraz wyczerpującej listy reguł gramatycznych i wyjątków. Podczas gdy większość głównych kontrolerów gramatyki nadal ma wiele problemów, już teraz stają się one niezbędne dla wielu osób w nowej generacji.
Językoznawstwo komputerowe to ekscytujące pole czerpiące z wielu dyscyplin. Problemy, z którymi musi się zmierzyć, są liczne i żadne nie jest proste. Futurystyczne wizje, na które czeka, sprawiają jednak, że jest to walka warta zachodu. Od marzeń o uniwersalnym tłumaczu po perfekcyjne rozpoznawanie mowy, cele lingwistyki komputerowej nie mogą nie wywoływać poczucia zdumienia.