Rewolucja w świecie podcastów dzięki GenFM od ElevenLabs
W dynamicznie rozwijającym się świecie sztucznej inteligencji, ElevenLabs, startup specjalizujący się w zaawansowanej technologii audio, przedstawił nową funkcję, która może zrewolucjonizować sposób tworzenia podcastów. Funkcja ta, nazwana GenFM, oferuje możliwość generowania wielogłosowych podcastów na bazie różnych materiałów wejściowych – od wideo z YouTube, przez teksty, aż po dokumenty. Wszystko to za pomocą aplikacji ElevenLabs Reader dostępnej na iOS.
—
Podcasty w 32 językach – technologia bez granic
Jednym z największych atutów GenFM jest obsługa aż 32 różnych języków, w tym angielskiego, polskiego, hiszpańskiego, niemieckiego, chińskiego czy francuskiego. Rozwiązanie to ma potencjał, by przekraczać bariery językowe, umożliwiając tworzenie treści dostosowanych do globalnej publiczności. Dzięki temu, użytkownicy mogą szybko i łatwo tworzyć podcasty, które przemawiają do odbiorców na całym świecie, przy zachowaniu wysokiej jakości i naturalności rozmowy.
—
Jak działa GenFM?
Korzystanie z GenFM jest niezwykle proste. Wystarczy wgrać plik źródłowy – może to być wideo, tekst lub dokument. Następnie aplikacja automatycznie wybiera dwa głosy z szerokiej gamy dostępnych opcji, aby stworzyć wielogłosowy podcast. Co więcej, ElevenLabs wprowadza elementy, które nadają audycji bardziej ludzki charakter – takie jak kontrolowane „umm” i „ahh”, które symulują naturalne pauzy w rozmowie. Choć wiele narzędzi AI skupia się na eliminacji tego typu elementów, ElevenLabs postanowiło pójść w odwrotnym kierunku, dodając je w sposób przemyślany, aby zwiększyć realizm i zaangażowanie słuchaczy.
—
Balans między technologią a ludzkim brzmieniem
Według Jacka McDermotta, odpowiedzialnego za rozwój mobilny w ElevenLabs, celem jest znalezienie idealnej równowagi pomiędzy naturalnym prowadzeniem rozmowy a użytecznością treści. „Analizując najlepsze podcasty długiego formatu, zauważamy, że wyróżniają się one płynnym przepływem rozmowy bez zbędnych przerw. Taki właśnie efekt chcemy osiągnąć, jednocześnie czyniąc narracje audio bardziej dostępnymi zarówno pod względem językowym, jak i głosowym,” powiedział McDermott.
—
Nowe możliwości personalizacji
W przyszłości ElevenLabs planuje wprowadzenie jeszcze większych możliwości personalizacji. Użytkownicy będą mogli dodawać wiele różnych źródeł materiałów, co pozwoli na tworzenie bardziej zróżnicowanych i bogatych podcastów opartych na generatywnej sztucznej inteligencji. Te funkcje mają potencjał, by wprowadzić podcasty na zupełnie nowy poziom interaktywności i kreatywności.
—
Od Warszawy do Indii – globalny rozwój ElevenLabs
ElevenLabs nie spoczywa na laurach. Firma ogłosiła niedawno inwestycję w wysokości 11 milionów dolarów w polski ekosystem startupowy oraz otwarcie centrum badawczo-rozwojowego w Warszawie. Ma to na celu przyciągnięcie lokalnych talentów z zakresu AI i technologii audio. Dodatkowo, startup rozwija swoje operacje w Indiach, gdzie buduje nowy zespół zarządzany przez lokalnego lidera biznesu. Takie strategiczne kroki pokazują, że ElevenLabs ma na celu globalny rozwój swojej technologii i jej implementację na różnych rynkach.
—
Świat podcastów przyszłości
GenFM od ElevenLabs to krok milowy w rozwoju sztucznej inteligencji w kontekście audio. Dzięki tej technologii, tworzenie wielogłosowych podcastów stanie się nie tylko prostsze, ale również bardziej dostępne dla twórców na całym świecie, bez względu na ich umiejętności techniczne. To z kolei otwiera nowe możliwości zarówno dla profesjonalistów, jak i amatorów – każdy, kto marzył o stworzeniu własnego programu w formie audio, teraz może to zrobić z łatwością i w doskonałej jakości.
Czy GenFM stanie się standardem w tworzeniu podcastów? Patrząc na dotychczasowe osiągnięcia ElevenLabs, wydaje się, że przyszłość audio stoi przed nami otworem. Jakie jeszcze innowacje przygotuje dla nas ten ambitny startup? Czas pokaże, ale jedno jest pewne – warto trzymać rękę na pulsie.