Aktualizacja ChatGPT – będzie słyszeć, widzieć i mówić!

27.09.2023 |
| Clock Przeczytasz w 3 Minuty
Aktualizacja ChatGPT – będzie słyszeć, widzieć i mówić!
Przeczytasz w 3 Minuty
Zwiększ rozmiar tekstu

ChatGPT to chatbot, który zadebiutował niecały rok temu. Od razu okazał się naprawdę potężnym narzędziem, którego zadanie nie kończyło się na generowaniu tekstu. Mimo tego kolejne aktualizacje i dodatki sprawiały, że narzędzie stawało się jeszcze lepsze. Teraz przyszła kolej na kolejną zmianę. Ostatnie zmiany wpłynęły, że komunikacja z ChatGPT będzie jeszcze prostsza!

ChatGPT przemówił!

Dotychczas narzędzie wymagało wprowadzenia komendy tekstowo. Jedyna możliwość głosowego wprowadzenia polecenia pojawiła się w aplikacji mobilnej ChatGPT. W najnowszej wersji także w przeglądarce chatbot zrozumie obrazy i grafiki. Może to pozytywnie wpłynąć na wygodę korzystania z narzędzia.

Co więcej, możemy też komunikować się z inteligentnym botem przy pomocy mowy. ChatGPT zrozumie ją, a także udzieli odpowiedzi w ten sam sposób. Jeśli pogawędki z Asystentem Google były ciekawe, to już wyobrażam sobie wielogodzinne rozmowy z o wiele bardziej zaawansowanym narzędziem! Głosowe zapytanie do ChatGPT wygląda podobnie, jak nagranie krótkiej wiadomości na komunikatorze. Wciskamy przycisk mikrofonu, mówimy, puszczamy przycisk – tyle wystarczy, aby ChatGPT zaczął generować odpowiedź.

Wciąż mamy oczywiście także możliwość wpisywania zapytań i poleceń w postaci tekstu. Funkcjonalność znacznie rośnie, my natomiast mamy po prostu większy wybór.

ChatGPT

Jak działa obsługa komend głosowych w ChatGPT?

Obsługa poleceń głosowych i odpowiedzi głosowe działają w ChatGPT z wykorzystaniem dobrze znanych już mechanizmów. Nasz głos jest przetwarzany na tekst, który następnie trafia jako polecenie do algorytmów ChatGPT. Mowa o LLM, czyli dużym modelu językowym, w tym przypadku GPT. Tam narzędzie szuka rozwiązania problemu lub odpowiedzi na nasze pytanie. Gdy jest gotowe, znowu dochodzi do przetworzenia, tym razem tekstu na mowę.

Nie wiadomo, czy i kiedy opcja ta będzie dostępna w języku polskim. Dziś wiemy natomiast, że obsługa w języku angielskim może się odbywać przy pomocy jednego z pięciu głosów. Możemy więc dopasować „rozmówcę” do swoich preferencji.

ChatGPT zacznie „widzieć”, będzie jak Obiektyw Google

Obok wprowadzenia rozpoznawania mowy i generowania odpowiedzi w postaci głosowej, ChatGPT dostał też przydatną opcję rozpoznawania obrazów. Funkcję możemy porównać do znanego już Obiektywu Google. Robimy zdjęcie lub wrzucamy do programu jedno z posiadanych już w galerii, a ChatGPT je rozpozna. Oczywiście – rola chatbota nie skończy się na opisaniu, co widzi na obrazku. Możemy użyć grafiki do zadania bardziej złożonego pytania. Opis sytuacji, w której chatbot nam pomoże, zaprezentowali twórcy – OpenAI.

Użytkownik wysłał do ChatGPT zdjęcie roweru z informacją, że ma problem z rowerem – nie wie, jak obniżyć siodełko. ChatGPT wysłał instrukcję, jak to zrobić. Okazało się jednak, że użytkownik roweru nie ma elementu, o którym napisał chatbot. Zamiast prostego zacisku do regulacji wysokości siodełka, posiadał obejmę zamykaną na śrubę. Pokazał to na zdjęciu, a chatbot wysłał dodatkowe instrukcje. Użytkownik pokazał na zdjęciu, jakie ma narzędzia, wysłał też instrukcję obsługi roweru.

Chatbot podpowiedział, jakiego narzędzia trzeba użyć do zmiany wysokości siodełka. Możemy sobie tylko wyobrazić, jak jeszcze ChatGPT będzie pomocny dzięki swojej możliwości rozpoznawania obrazu. Propozycja przepisu na podstawie zdjęcia zawartości lodówki – nic trudnego! Instrukcja, jakich środków użyć do pozbycia się plamy – to nie problem.

Jak użyć nowych funkcji w ChatGPT?

Nowości w ChatGPT pojawiły się póki co tylko dla użytkowników ChatGPT Plus (płatnej wersji). Tam mamy też najlepszy dostępny obecnie model językowy – GPT-4. W przyszłości powinny trafić również do podstawowej wersji ChaGPT (za darmo) z modelem językowym GPT-3.5.

Dokładnych terminów jednak nie znamy.

Może zainteresują Cię także inne artykuły

Telefonami komórkowymi interesował się jeszcze w czasach, gdy przedrostek “smart”-” oznaczał możliwość wysłania SMS-a. Przed dokonaniem jakiegokolwiek zakupu zawsze ogląda wszystkie recenzje i testy. W wolnych chwilach lubi grać w szachy i na gitarze basowej.