Amazon Polly - łatwa konwersja tekstu na mowę

14 maja 2021

Amazon Polly to usługa typu Text-to-Speach (TTS), zmieniająca tekst w realistycznie brzmiącą, syntezowaną mowę, przy użyciu technologii głębokiego uczenia. W ramach Amazon Polly, mowa syntezowana jest w kilkudziesięciu językach (w tym polskim), najczęściej w kilku różnych wariantach głosu i modulacji.

Oprócz standardowych głosów TTS, Amazon Polly oferuje też Neutral Text-to-Speach, czyli głosy które zapewniają zaawansowaną poprawę jakości mowy, opartą na nowym podejściu do uczenia maszynowego. Technologia Neutral TTS obsługuje dwa style mówienia; czytanie – używany do prowadzenia narracji w wiadomości oraz konwersacja, służący do prowadzenia dwukierunkowej komunikacji np. przez aplikacje telefoniczne. Ponad to, dzięki wewnętrznej usłudze Brand Voice, możliwe jest stworzenie we współpracy z zespołem Amazon Polly, niestandardowego głosu „na zamówienie”.

Usługa dostępna jest w modelu PaaS (Platform-as-a-Service). Dostępny jest również free tier obejmujący odczytanie 5 mln znaków miesięcznie, przez rok za darmo, a dla użytkowników Wordpressa, przygotowana została dedykowana wtyczka umożliwiająca łatwą implementację Amazon Polly na stronie internetowej.

Listę dostępnych głosów, możesz sprawdzić klikając TUTAJ

Case Studies
Referencje

Firma Hostersi pozwoliła nam osadzić ogólne zagadnienia programu Well Architected Framework w kontekście naszej firmy. Oszczędziło nam to wiele czasu i pozwoliło znaleźć lepiej dopasowane rozwiązania do specyfiki naszego biznesu. WAF był świetnym katalizatorem do wprowadzenie szeregu zmian w obszarze niezawodności, szybkości i bezpieczeństwa edrone. 

Piotr Stachowicz
CTO
W skrócie o nas
Specjalizujemy się w dostarczaniu rozwiązań IT w obszarach projektowania infrastruktury serwerowej, wdrażania chmury obliczeniowej, opieki administracyjnej i bezpieczeństwa danych.