Gemini czyli Google staje w szranki z Microsoftem na rynku SI

Gdy mówimy o rynku sztucznej inteligencji, na myśl przychodzi nam przede wszystkich ChatGPT, ewentualnie Copilot od Microsoftu. Choć Google ma Barda, nie cieszy się on dużą popularnością. Ale Gemini ma zmienić układ sił na wciąż kształtującym się rynku SI.
Gemini
Gemini

Może się wydawać, że obecnie istniejące modele sztucznej inteligencji już sporo potrafią, jednak nie można zapominać, że jesteśmy dopiero u progu wielkich zmian, a kto wskaże ich kierunek – to wciąż jeszcze otwarta sprawa. Google postanowiło mocniej zaangażować się w tę tematykę, a choć pierwszy krok – czyli Bard – nie zdobył dużego uznania, ma teraz nie jedną, a kilka propozycji dla rynku.

Gemini razy trzy

Jak zapowiada szef konglomeratu Alphabet, czyli Sundar Pichai: “sztuczna inteligencja to szansa na to, aby pomagać każdemu niezależnie od tego, gdzie przebywa na świecie. Przyniesie innowacje, progres ekonomiczny i wiedzę oraz edukację w bezprecedensowej skali”. Nie powiem – nie miałbym nic przeciwko, ale w jaki sposób Google zamierza w tym pomóc? Odpowiedź brzmi: za pomocą nowego modelu językowego Gemini, którego wersja 1.0 została właśnie oficjalnie ogłoszona.

Model ten będzie dostępny w trzech edycjach: Gemini Ultra dla bardzo zaawansowanych zadań, Gemini Pro dla mniej wymagających oraz Gemini Nano przeznaczone do wykonywania działań bezpośrednio na urządzeniach. Jak chwali się producent, edycja Ultra jest bardziej wydajna od ChatGPT 4.0, a na dowód zaprezentowano poniższe porównanie. Na jednym polu Gemini przegrywa z konkurentem od OpenAI (za którym stoi Microsoft), lecz ogólnie wygląda to bardzo porządnie.

Gemini Ultra

Czytaj też: Nvidia dostarcza arsenał na nadchodzącą wojnę SI. I sama ją napędza

Gemini powstało jako model natywny, multimodalny i wytrenowany do obsługi różnych zadań. Następnie zoptymalizowano go pod kątem klasyfikowania zadań, aby podnieść efektywność. Dzięki temu ma solidną podstawę do zrozumienia, czego się od niego oczekuje i sprawdza w praktyce na wielu obszarach. W chwili obecnej potrafi m.in. generować “wysokiej jakości” kody w językach Java, Python, C++ oraz Go, doskonale rozumie tekst, rozpoznaje grafiki, a także nagrania audio i wideo. Więcej można dowiedzieć się z poniższego nagrania.

Gemini 1.0 było trenowane na zoptymalizowanej pod kątem SI infrastrukturze Google, w tym przy użyciu specjalnie do tego celu stworzonych procesorów Tensor (TPU) v4 i v5e. Dzięki temu model ten ma różnić się od konkurencyjnych zarówno pod względem wydajności, jak i szybkości działania. Internetowy gigant już zapowiada, że z możliwości tego modelu skorzystają użytkownicy dosłownie wszystkich usług Google’a – od Wyszukiwarki, Gmaila i Map zaczynając, na YouTube oraz systemie Android kończąc.

Oczywiście z nowych możliwości skorzysta także Bard, który używać będzie edycji Gemini Pro. Jest to jego największa aktualizacja od czasu wprowadzenia na rynek na początku bieżącego roku. Z kolei wersja Nano pojawi się w telefonach Pixel 8 Pro. A to dopiero początek…