Co to jest SAPI?
Speech Application Programming Interface (SAPI) to interfejs audio opracowany przez firmę Microsoft. Zaprojektowany do użytku w systemach operacyjnych Windows, idea SAPI polegała na umożliwieniu korzystania z syntezy i rozpoznawania mowy w funkcji różnych aplikacji Windows. Różne wersje interfejsu API mowy zostały wydane od czasu pojawienia się pierwszej wersji w 1995 r. Niektóre są standardowe dla wszystkich systemów operacyjnych Windows, a inne są dostosowane do użytku z określonymi programami.
Zastosowanie SAPI poszerza grono klientów, którzy mogą korzystać z programów opartych na systemie Windows. Ze względu na aspekt SAPI dotyczący rozpoznawania mowy, osoby, które mogą być fizycznie ograniczone tymczasowymi lub stałymi warunkami, mogą nadal pracować z programami do edycji tekstu i innymi podstawami. Jednocześnie SAPI ma możliwość tłumaczenia tekstu na mówione słowo. Ta funkcja może być szczególnie przydatna dla osób z zaburzeniami widzenia, ponieważ umożliwia interakcję z treściami na stronie internetowej lub po prostu czerpanie przyjemności z otrzymywania wiadomości e-mail od znajomych i krewnych.
W najwcześniejszych wersjach SAPI zdolność interfejsu była nieco niskiej jakości w porównaniu do obecnie używanych wersji. Programowanie pozwoliło na stworzenie reprodukcji dźwięku, która była z natury nieco robotyczna. Choć były skuteczne jak na swój czas, innowacje w późniejszych wersjach podniosły jakość reprodukcji głosu, obejmując słowa wypowiedziane przez ludzi i zarchiwizowane w celu użycia przez program, gdy zajdzie taka potrzeba. Gdy głos SAPI nie jest tworzony elektronicznie, do tworzenia tych archiwów często wykorzystywane są osoby przeszkolone w pracy głosowej. Na przykład wykonawca, który zarabia na życie, ogłaszając radio lub pracując nad reklamami w telewizji, byłby doskonałym kandydatem do tworzenia archiwów tekstu na mowę, z których mógłby korzystać SAPI.
Najnowsza wersja SAPI zawiera szereg ulepszonych funkcji. Wśród nich jest możliwość dostosowania prędkości, głośności i wysokości głosu, a także poprawienia wymowy. Interpretacje semantyczne pozwalają na uzyskanie definicji słów, które nie są łatwo zrozumiałe. Nowe wersje SAPI są wydawane co kilka lat, a każda z nich oferuje pewne ulepszenia lub udoskonalenia istniejących funkcji, dzięki czemu interfejs staje się coraz bardziej użyteczny w wielu aplikacjach.