Nie tylko GPT-4 – Microsoft pracuje nad multimodalnym modelem językowym Kosmos-1
Co kryje się pod nazwą „Kosmos-1”? Jak się okazuje, nie jest to radziecki sprzęt związany z podróżami poza ziemską orbit. Kosmos-1 jest jak najbardziej rozwiązaniem przystającym do 2023 roku, a nawet wyprzedzającym nasze czasy. Ten multimodalny model językowy można porównać do GPT-3 i GPT-4 (znane z ChatGPT), choć prawdopodobnie przewyższa je możliwościami. Opracowane przez Microsoft narzędzie potrafi rozpoznawać obrazy, a także odczytywać zapisane na nich treści.
Microsoft opracował model językowy Kosmos-1
Szybko po tym, jak ChatGPT zdobył ogromną popularność, okazało się, że stoi za nim Microsoft. Amerykański gigant finansował prace nad rozwojem algorytmów sztucznej inteligencji, a dziś korzysta z modelu językowego GPT między innymi w wyszukiwarce Bing. Dotychczas poznaliśmy także inne narzędzia i aplikacje Microsoftu zintegrowane z ChatGPT. Dotychczasowe rozwiązania w dużej mierze opierały się jednak o komendy wprowadzane przez użytkownika tekstowo.
Kosmos-1 przenosi komunikację ze sztuczną inteligencją na wyższy poziom.
Kosmos-1 jest dużym, multimodalnym modelem językowym. Oznacza to, że algorytmy sztucznej inteligencji „zrozumieją” przekaz w formie dźwiękowej, a nawet odczytają go z obrazu.
Cel powstania nowego modelu językowego Microsoftu jest dość jasny i precyzyjnie określony. Kosmos-1 ma pozwolić na rozwój sztucznej inteligencji, działającej w porównywalny sposób do człowieka. Podobnie do ludzi, Kosmos-1 potrafi interpretować niemal dowolne źródła informacji.
Jeśli ChatGPT nie zabrał Ci pracy, może zrobić to Kosmos-1
Rynkowy sukces chatbota OpenAI – ChatGPT – szybko stał się powodem do obaw. Sporo osób obawiało się, że sztuczna inteligencja w takiej postaci może zabrać im pracę. Jesteśmy niecałe pół roku po premierze ChatGPT, w międzyczasie pojawił się jeszcze lepszy model językowy GPT-4. Wiemy już więc nieco więcej o tym, jak można używać inteligentnego chatbota. Raczej pełni rolę asystenta człowieka, niż zastępstwa dla ludzkiej pracy.
Choć dziś ChatGPT można połączyć z syntezatorem mowy, rozpoznawaniem i generowaniem obrazów i innymi narzędziami, wciąż wymaga to sporego udziału człowieka. Kosmos-1 może natomiast zmienić ten stan rzeczy. Ma być narzędziem znacznie lepszym od ChatGPT – bardziej zbliżonym w swoim działaniu do człowieka. Ma więc większe szanse na przejęcie ludzkich zajęć, niż dotychczas znane modele językowe.
Jak działa Kosmos-1?
Nowy multimodalny model językowy Microsoftu działa na podobnej zasadzie do znanych już rozwiązań, jak GPT-4, czy LLAMA. Potrafi zrozumieć kontekst wypowiedzi lub zapytania, jest też w stanie stale się uczyć. Największa różnica polega jednak właśnie na tym, że Kosmos-1 idzie o krok dalej i nie wymaga wprowadzania tekstowych zapytań. Przykłady użycia możemy zobaczyć na grafikach – niektóre odpowiedzi modelu językowego są zaskakująco trafne!
Microsoft samodzielnie pracuje nad nowym multimodalnym modelem językowym
Moglibyśmy się spodziewać, że w stworzeniu Kosmos-1 swój udział ma OpenAI – twórcy ChatGPT i modeli językowych GPT-x.x. Jak się jednak okazuje, Microsoft samodzielnie opracował Kosmos-1. Do treningu autorskiego rozwiązania wykorzystano paczkę zawierającą informacje z Internetu. Łącznie było ich aż 800 GB.
Zalety narzędzia ujawniły się już podczas pierwszych testów Kosmos-1. Wtedy inżynierowie Microsoftu mogli przekonać się, że ich model językowy jest o wiele lepszy od dotychczas znanych (np. GPT). Sztucznej inteligencji udało się m.in. zdać test na inteligencję Mathycah Ravaha, gdzie w teście wielokrotnego wyboru odpowiedzi zostały zaznaczone w losowy sposób. Kosmos-1 miał wskazać prawidłowe z nich. Udało się to w 22 procentach, co jest niezłym wynikiem jak na takie narzędzie.
Pozostaje nam więc tylko czekać na to, aż Microsoft Kosmos-1 trafi na rynek. Wtedy, zapewne w jeszcze lepszej wersji, może stać się bardzo mocną konkurencją dla ChatGPT, czy alternatyw od Google, Facebooka i Apple.
Może zainteresują Cię także inne artykuły