Jakie są różne typy rozpoznawania mowy przez telefon?
Systemy rozpoznawania mowy zaczęto opracowywać w latach 50. i 60. XX wieku. Programy komputerowe, które potrafią rozpoznawać dźwięk głosu osoby i rozpoznawać słowa, zwykle wymagają dużej ilości pamięci. Rozpoznawanie mowy przez telefon w XXI wieku jest dostępne w wielu telefonach komórkowych, które mają wiele gigabajtów pamięci. Technologii tej można używać do rozpoznawania głosu użytkownika telefonu, dyktowania tekstu w notatce lub wiadomości e-mail lub do wyszukiwania w Internecie. Niektóre programy do rozpoznawania mowy umożliwiają także pisanie wiadomości tekstowych na podstawie poleceń ustnych.
Istnieje język komputerowy przeznaczony wyłącznie do rozpoznawania głosu w celu uzyskania dostępu do Internetu w telefonie komórkowym. Użytkownicy zazwyczaj nie muszą wykonywać poleceń na ekranie ani pisać na klawiaturze. Urządzenia, które mogą to zrobić, są na ogół droższe niż większość telefonów komórkowych. Przeglądarki głosowe umożliwiają także rozpoznawanie mowy przez telefon i pozwalają użytkownikom korzystać z telefonu za pośrednictwem Internetu. Mogą być one przydatne w przypadku internetowych centrów telefonicznych, zintegrowanych systemów telefonicznych w samochodach, a nawet aplikacji w konwencjonalnych przeglądarkach internetowych.
Tłumaczenie mowy to kolejny rodzaj rozpoznawania mowy przez telefon. Niezależne oprogramowanie i aplikacje internetowe są dostępne do tłumaczenia słów z jednego języka na inny podczas rozmowy. Oprócz programów obsługujących wysyłanie wiadomości tekstowych za pomocą poleceń ustnych istnieją aplikacje do rozpoznawania mowy do pisania i wysyłania wiadomości e-mail.
Telefoniczne rozpoznawanie mowy jest również często używane do wyszukiwania w Internecie. Może to być przydatne do sprawdzania list filmów lub pomagania osobom niedowidzącym w przeszukiwaniu Internetu na telefonie. Rozpoznawanie mowy w telefonach jest używane w wielu przypadkach do sterowania funkcjami urządzenia. Polecenia głosowe mogą być programowane przez użytkownika, poprzez nagranie jego głosu, gdy zostanie wyświetlony monit w fazie konfiguracji. Numery mogą być automatycznie wybierane, kiedy w telefonie zostanie wypowiedziane nazwisko odpowiedniej osoby.
Korzystanie z rozpoznawania mowy przez telefon jest możliwe nie tylko dzięki większej ilości pamięci, ale także dzięki połączeniu z serwerami przechowującymi dane głosowe. Serwery te można zaprogramować do uczenia się różnych tendencji w języku i gromadzenia danych, aby umożliwić względnie dokładne rozpoznawanie słów. Niektóre problemy z rozpoznawaniem mowy przez telefon obejmują zakłócenia powodowane przez szum tła. Przewidywalne wzorce mogą być jednak kompensowane przez niektóre programy używane wraz z oprogramowaniem do rozpoznawania. Głosowe interfejsy użytkownika oparte na sieci Web są korzystne, ponieważ często są dostępne z dowolnego miejsca, podobnie jak wiele funkcji i usług smartfonów.