Nowy kierunek Google
Google DeepMind połączyło siły z Timem Brooksem, który w październiku opuścił OpenAI, by zająć się rozwojem generatywnej sztucznej inteligencji. Nowy zespół ma stworzyć modele zdolne do odwzorowania reguł panujących w świecie fizycznym. Informacje te potwierdził sam Brooks we wpisie na platformie X, zaznaczając, że Google ma ambitne plany rozszerzenia potencjału badawczego i komercyjnego w obszarze symulacji.
Tim Brooks na czele
Tim Brooks, wcześniej związany z projektem Sora odpowiedzialnym za generowanie wideo w OpenAI, wnosi do Google DeepMind doświadczenie w dziedzinie przetwarzania obrazu i sztucznej inteligencji. Nowy lider deklaruje, że wraz ze swoim zespołem będzie dążył do rozwinięcia modeli generatywnych, które mogłyby służyć zarówno do zastosowań naukowych, jak i w obszarze rozrywki. Brooks zapowiedział też intensywną rekrutację ekspertów zainteresowanych współtworzeniem tych przełomowych technologii.
Ambicje DeepMind
DeepMind od dawna jest pionierem w rozwijaniu sztucznej inteligencji zdolnej do nauki reguł i planowania. Projekt symulacji świata fizycznego wpisuje się w dążenie firmy do osiągnięcia tak zwanego sztucznego inteligentnego ogólnego (AGI). W materiałach rekrutacyjnych podkreśla się, że skalowanie modeli na danych wideo i danych multimodalnych jest kluczowe dla osiągnięcia AGI. Realne, dynamiczne symulacje mają pomóc w szkoleniu robotów, analizie obrazów oraz interaktywnych formach rozrywki.
Projekt Gemini, Veo i Genie
Nowy zespół ściśle współpracuje z inicjatywami Gemini, Veo i Genie. Gemini to flagowa seria modeli Google, potrafiąca generować tekst i analizować obrazy, zaś Veo to autorska technologia firmy służąca do generowania wideo. Genie z kolei pełni rolę modelu odwzorowującego otoczenie 3D i symulującego przebieg gier czy wirtualnych światów. Połączenie tych rozwiązań ma ułatwić budowę bardziej złożonych środowisk, w których możliwa będzie interakcja w czasie rzeczywistym.
Gra o przyszłość
Rozwój światowych modeli stał się oczkiem w głowie wielu firm technologicznych. W projektach startupów, takich jak World Labs prof. Fei-Fei Li, izraelskiego Decarta czy Odyssey, widać rosnące zainteresowanie symulacjami interaktywnymi i generowaniem treści. Potencjał tej dziedziny jest ogromny, lecz twórcy gier i filmów obawiają się możliwych zwolnień oraz automatyzacji części zadań. Niedawne śledztwo Wired wskazuje, że duże firmy growe używają już AI, by usprawnić produkcję i obniżyć koszty.
Spór o prawa
Kolejnym wyzwaniem pozostaje kwestia praw autorskich. Część modeli może być trenowana na bazie nieautoryzowanych nagrań z gier wideo lub innych materiałów. Google deklaruje, że wykorzystuje zasoby YouTube zgodnie z regulaminem, ale nie ujawnia dokładnej listy filmów służących do treningu. Wielu ekspertów zwraca uwagę, że w przypadku niewłaściwego licencjonowania może dojść do sporów prawnych, co w przyszłości może zagrozić rozwojowi podobnych projektów.
Nowe perspektywy
Na marginesie warto dodać, że rosnące zainteresowanie rozwojem takich narzędzi jak ChatGPT przyczynia się do dalszego przyspieszenia postępów w dziedzinie generatywnej sztucznej inteligencji, co może w przyszłości całkowicie zrewolucjonizować nasze rozumienie cyfrowych symulacji oraz tworzenia interaktywnych światów.