Search icon

OpenAI Voice Engine wygeneruje Twój głos na podstawie krótkiej próbki

14.04.2024 |
| Clock Przeczytasz w 3 Minuty
OpenAI Voice Engine wygeneruje Twój głos na podstawie krótkiej próbki
Przeczytasz w 3 Minuty
Zwiększ rozmiar tekstu

Twórcy ChataGPT rozwijają kolejne narzędzia. Ostatnio informowaliśmy o planach wprowadzenia na rynek narzędzia do generowania realistycznych filmów wideo – Sora. OpenAI na tym jednak nie poprzestaje, kolejną nowością ma być Voice Engine. Jego działanie może jednak budzić spore obawy…

OpenAI Voice Engine – narzędzie do generowania głosu

Najnowszy produkt będzie się nazywał Voice Engine. OpenAI pracuje nad kolejnym narzędziem wykorzystującym silną sztuczną inteligencję. Tym razem chodzi jednak o generowanie ludzkiego głosu. Nie chodzi jednak o głos „jakiejś” osoby, zmyślonego lektora, co zresztą jest już możliwe w innych programach. Voice Engine ma klonować, czyli naśladować głos konkretnej osoby. Wystarczy użyć krótkiej próbki głosu, a także wprowadzić tekst, który chcemy odczytać głosem wskazanej osoby.

Gdy dowiedziałem się, jak ma działać Voice Engine, od razu wyobraziłem sobie mnóstwo możliwych nadużyć…

W ten sposób będziemy mogli „spreparować” niemal dowolne treści, które będą brzmiały, jak wypowiedziane przez istniejącą osobę. Może to być ktoś z naszej rodziny, pracy, polityk, czy dowolna, inna osoba. Możliwe będzie nawet wykorzystanie głosu nieżyjącej osoby, co w pewnych sytuacjach też może rodzić pewne obawy. Pamiętajmy też, że możliwości generowania obrazów i filmów również stale się powiększają. Wykreowanie klona postaci i podłożenie głosu może więc prowadzić do wielu manipulacji.

Voice Engine to generator rzeczywistego głosu na podstawie próbki

Oczywiście, sztuczna inteligencja klonująca głos może też się przydać do wielu zastosowań, które będą jak najbardziej pozytywne. Ostatecznie, już bez Voice Engine jest możliwe stworzenie nieprawdziwego głosu, do złudzenia przypominającego inną osobę. Wymaga to po prostu więcej pracy.

Voice Engine

OpenAI wskazuje na możliwe sposoby zastosowania Voice Engine. Generator mowy, naśladujący głos wskazanej za pomocą krótkiej próbki osoby, może między innymi:

  • stworzyć ścieżkę lektora do filmu
  • obsługa klienta w wielu językach
  • tłumaczyć treści na inne języki
  • lepsza dostępność – pomoc dla osób niepełnosprawnych i niedowidzących
  • pomoc osobom z zaburzeniami mowy

Pewną próbkę możliwości widzieliśmy już jakiś czas temu, gdy OpenAI przy współpracy ze Spotify przetłumaczyło podcasty na inne języki. Takie działanie mogłoby oznaczać, że w przyszłości baza dostępnej dla nas wiedzy, kultury i rozrywki znacznie się poszerzy. Chcąc posłuchać podcastu w języku polskim, nie będziemy musieli w końcu ograniczać się do twórców posługujących się naszym językiem.

OpenAI ma pomysł, jak zwiększyć bezpieczeństwo

Twórcy Voice Engine są jak najbardziej świadomi możliwych nadużyć. Z tego względu wprowadzą dodatkowe zasady i wymogi bezpieczeństwa dla osób korzystających z narzędzia klonującego głos. Do wykorzystania czyjegoś głosu niezbędne będzie uzyskanie zgody tej osoby. OpenAI chce również wprowadzić jakiś rodzaj oznakowania dla rozróżnienia ścieżki dźwiękowej stworzonej przez AI.

ChatGPT - jakie zawody zastąpi?

Znamy ceny Voice Engine

Chcąc skorzystać z możliwości Voice Engine, niezbędne będzie dokonanie płatności. Podstawowy pakiet ma kosztować 15$ za 1 000 000 odczytanych znaków. Chodzą już również słuchy, że za 30 dolarów otrzymamy tę samą ilość, ale w lepszej jakości dźwięku. Być może w przyszłości pojawią się również większe pakiety, gdzie jedna subskrypcja pozwoli na dostęp do płatnego ChatGPT, Voice Engine i OpenAI Sora.

Polecane laptopy

Może zainteresują Cię także inne artykuły

TEMATYKA:
Telefonami komórkowymi interesował się jeszcze w czasach, gdy przedrostek “smart”-” oznaczał możliwość wysłania SMS-a. Przed dokonaniem jakiegokolwiek zakupu zawsze ogląda wszystkie recenzje i testy. W wolnych chwilach lubi grać w szachy i na gitarze basowej.