Google Gemini – co warto wiedzieć o następcy Google Bard?

21.02.2024 |
| Clock Przeczytasz w 5 minut
Google Gemini – co warto wiedzieć o następcy Google Bard?
Przeczytasz w 5 minut
Zwiększ rozmiar tekstu

Pod koniec ubiegłego roku Google zaprezentowało swój najpotężniejszy do tej pory model sztucznej inteligencji. Gemini, czyli następca Barda, ma być odpowiedzią giganta na rosnącą konkurencję ze strony ChatGPT od OpenAI. Co warto wiedzieć o tym zaawansowanym dużym modelu językowym?

Co to jest Google Gemini?

Gemini to najnowszy duży model językowy, o którym Google wspominało już w ubiegłym roku w czerwcu. W grudniu 2023 r. został on wprowadzony do użytku publicznego, a wraz z nim pojawiła się dość intrygująca (acz nieco naciągana) oficjalna prezentacja.

Gemini, jak twierdzi Google, ma być najpotężniejszym ze wszystkich dostępnych modeli sztucznej inteligencji na rynku. Efekt pracy wielu zespołów giganta, w tym DeepMind oraz Google Research, wyróżnia się multimodalnością. Oznacza to, że Gemini wykorzystuje najróżniejsze dane oraz treści do pracy – może odczytywać nie tylko tekst, ale też obrazy, dźwięki oraz wideo, a następnie je przetwarzać, analizować i wyciągać wnioski.

Gemini występuje w kilku wersjach – Nano, Ultra oraz Pro.

  • Gemini Nano – lekki i wydajny model zaprojektowany do działania bezpośrednio na urządzeniach mobilnych. Trafił m.in. do smartfonów Pixel 8 Pro w ramach aktualizacji.
  • Gemini Pro – wszechstronny model zintegrowany z usługą Bard
  • Gemini Ultra – najbardziej zaawansowany i wydajny model będący podstawą Gemini Advanced i przeznaczony do skomplikowanych analiz i złożonych zadań.

Od 13 grudnia 2023 klienci biznesowi oraz deweloperzy mają dostęp do Google Gemini w usłudze Vertex AI w Google Cloud oraz Google Generative AI Studio. Docelowo model ma zostać zintegrowany z wyszukiwarką Google, produktami reklamowymi firmy, a także innymi usługami oraz aplikacjami (Gmail, Dokumenty Google, YouTube etc.).

Niedawno zaprezentowano Google Gemini 1.5 Pro które ma zapewniać zwiększoną wydajność niż poprzednik. Może przyjąć ok. 700 000 słów lub ok. 30 000 linii kodu, czyli 35 razy więcej niż Gemini 1.0 Pro.

Nieco wcześniej udostępniono Gemini Ultra 1.0 – wówczas nastąpił też rebranding chatbota Bard na Gemini.

Dlaczego Gemini zastąpiło Barda?

Bard niestety nie przyjął się zbyt dobrze z uwagi na mniejszą skuteczność od narzędzia oferowanego przez OpenAI. Google postanowiło nie zostawać w tyle i w pocie czoła pracowało nad jego ulepszeniem.

Jak stwierdziła Sissie Hsiao (wiceprezes Google i dyrektor generalny Google Assistant i Bard), komentując rebranding, misją Barda było dostarczanie najnowocześniejszych rozwiązań, a Gemini jest najbardziej zaawansowanym modelem AI od Google.

Gemini odnosi się aktualnie nie tylko do głównego modelu AI, ale też do wszystkich produktów AI od Google.

Zmiana nazwy zatem pozwoliła uzyskać firmie spójność w nazewnictwie i pokazać użytkownikom, z jakim produktem mają do czynienia.

Gemini vs Bard – różnice

Bard korzystał z lekkiej wersji modelu LaMDA, która wymagała mniejszej mocy obliczeniowej i mogła być skalowana do większej liczby użytkowników. Został on zbudowany w oparciu o Transformer, czyli architekturę sieci neuronowej Google, udostępnionej w 2017 roku.

Gemini został wyszkolony na znacznie większym oraz bardziej zróżnicowanym zbiorze danych niż Bard. Dzięki temu lepiej rozumie oraz generuje dokładniejsze odpowiedzi na zapytania użytkowników.

Model Ultra 1.0 sprawniej radzi sobie ponadto niż Bard ze złożonymi zadaniami, takimi jak logiczne rozumowanie, kodowanie, wykonywanie instrukcji czy kreatywne projekty. Lepiej rozumie też cały kontekst wypowiedzi. Jego architektura została tak wyszkolona, by wychwytywać wszelkie niuanse językowe.

Gemini Advanced – czym jest?

Gemini Advanced opiera się na modelu Gemini Ultra 1.0, czyli największym oraz najbardziej wydajnym modelu, który sprawdza się do złożonych zadań. Zgodnie z testami przeprowadzonymi przez firmę, wersja ta przewyższa zdolności ludzkich ekspertów. W testach MMLU uzyskała wynik 90%. By przetestować jej możliwości, należy jednak najpierw zapłacić za pakiet Google One AI Premium.

Gemini Ultra 1.0 lepiej poradzi sobie z kodowaniem, logicznym rozumowaniem czy wykonywaniem skomplikowanych instrukcji. Umożliwia prowadzenie bardziej szczegółowych rozmów i dłuższych, a także lepiej rozumie kontekst z wcześniejszych promptów. Na razie wersja ta jest dostępna w języku angielskim w ponad 150 krajach oraz regionach.

Darmowa i płatna wersja Gemini – co oferują?

Darmowa wersja korzysta z Gemini Pro, natomiast płatna – Gemini Ultra 1.0. Wersja przeglądarkowa udziela odpowiedzi w języku polskim, a ogólnie obsługuje ich ponad 40.

Gemini Pro można wykorzystać do:

  • podstawowe kodowanie
  • generowanie treści
  • analiza obrazów
  • tworzenie podsumowań długich tekstów, artykułów, wiadomości mailowych
  • transkrypcja treści mówionych
  • i wiele więcej.

Gemini Advanced:

  • bardziej logiczne rozumowanie
  • skomplikowane zadania programistyczne
  • kontekstowa analiza tekstu, zdjęć, wideo oraz dźwięku
  • kreatywna współpraca z chatbotem
  • wykonywanie trudniejszych zadań (bardziej złożone polecenia).

Czy Google Gemini zastąpi Asystenta Google?

Google Gemini jest dostępny od niedawna jako aplikacja na Androida i iOS. Po zainstalowaniu powinien zastąpić Asystenta Google – będzie uruchamiać się w analogiczny sposób, czyli poprzez skrót na pulpicie, przeciągnięciem palcem od dolnego rogu ekranu lub komendą “OK Google”.

Wśród funkcji oczywiście znajdują się te podstawowe – odpowiadanie na złożone pytania czy pomoc w tworzeniu tekstowych treści. Oprócz tego umie też działać kontekstowo, czyli wykonywać polecenia związane z tekstem, jaki aktualnie jest wyświetlany na ekranie, co daje jej przewagę nad Asystentem.

aplikacja Google Gemini
Źródło: Sklep

Gemini przejęło niektóre funkcje Asystenta i potrafi też wykonywać komendy w stylu “zadzwoń do X”. Do tego też przetłumaczy tekst czy przygotuje jego podsumowanie. Aktualnie jednak niektórych funkcji Asystenta brakuje, np. generowania przypomnień. Są to oczywiście początki, dlatego też z czasem Gemini będzie coraz lepsze, aż – zapewne – go w końcu całkiem zastąpi.

Aplikacja Gemini – czy jest dostępna w Polsce?

Aplikacja Google Gemini aktualnie nie jest oficjalnie dostępna w Polsce z uwagi na restrykcje wprowadzone przez Unię Europejską. Istnieje jednak możliwość zainstalowania jej poza oficjalnym sklepem Google Play i korzystania z możliwości, jakie daje.

Warto pamiętać, że z aplikacji w taki sposób korzysta się na własne ryzyko – kluczowe jest znalezienie zaufanego źródła z plikiem APK (w wersji minimum 1.0.605683889), jednak i tak należy zachować ostrożność. Po zainstalowaniu go na swoim telefonie, należy przejść do ustawień i zmienić język główny na angielski (amerykański), a polski ustawić jako dodatkowy. Aby komunikować się z nim w naszym rodzimym języku, należy poprosić chatbota, aby właśnie nim się posługiwał.

Ile kosztuje Gemini? Jak uzyskać dostęp?

Za darmo możesz uzyskać dostęp do Gemini Pro, czyli lżejszej wersji na oficjalnej stronie internetowej gemini.google.com. Dostęp do bardziej zaawansowanej wersji, która opiera się na Ultra 1.0, czyli Gemini Advanced, jest już płatny. Jego koszt to 20 dolarów miesięcznie (czyli ok. 100 zł) i jest częścią subskrypcji Google One AI Premium Plan. Można ją najpierw przetestować przed dwa miesiące za darmo.

Google Gemini w wersji przeglądarkowej
Źródło: Google Gemini

Płacąc za dostęp do Gemini Advanced zyskujesz nie tylko możliwość skorzystania z najnowszego modelu AI Google, ale też zyskujesz 2 TB miejsca na dane i pozostałe dodatki, w tym narzędzia do edycji zdjęć, aktualizacje Workspace czy dostęp do VPN.

Możliwości Gemini Pro/Gemini Advanced dostaniemy także wewnątrz popularnych aplikacji – Gmail, Dokumentów Google, a nawet YouTube.

Konkurenci Google Gemini

Najpoważniejszym konkurentem dla Google Gemini jest oczywiście ChatGPT od OpenAI. Aktualnie oferuje wersję darmową oraz płatną, opartą na GPT-4, która dodatkowo może m.in. generować zdjęcia (dzięki integracji z Dall-e) i analizować długie pliki np. w formacie PDF.

Drugim poważnym konkurentem jest Microsoft Copilot, czyli narzędzie GenAI, zintegrowane m.in. z produktami producenta, dzięki czemu zwiększa produktywność i automatyzuje część zadań. Można też z niego korzystać w przeglądarce, dzięki czemu działa jako osobisty asystent, odpowiadając na pytania czy tworząc kod.

Polecane laptopy

Grafiki otwierająca: Google

Może Cię zainteresować:

Filozof z wykształcenia, fanka nowych technologii i gier komputerowych. W wolnych chwilach uwielbia grać w Talisman, czytać fantastykę i biografie, piec ciasta i babeczki oraz jeździć na rowerze.