ChatGPT w języku polskim
ChatGPT Polska

Google Startuje z Zespołem do Symulacji Świata

Google ogłosiło powstanie nowej grupy badawczej zajmującej się rozwojem zaawansowanych modeli AI, które mają symulować świat fizyczny. Na jej czele stanie Tim Brooks, były współlider zespołu pracującego nad generatorem wideo Sora w OpenAI. Celem projektu jest skalowanie technologii generatywnych i tworzenie narzędzi w czasie rzeczywistym, z myślą o budowaniu środowisk 3D oraz rozwiązywaniu złożonych problemów symulacyjnych.
Google startuje z zespołem do symulacji świata

Nowy kierunek Google

Google DeepMind połączyło siły z Timem Brooksem, który w październiku opuścił OpenAI, by zająć się rozwojem generatywnej sztucznej inteligencji. Nowy zespół ma stworzyć modele zdolne do odwzorowania reguł panujących w świecie fizycznym. Informacje te potwierdził sam Brooks we wpisie na platformie X, zaznaczając, że Google ma ambitne plany rozszerzenia potencjału badawczego i komercyjnego w obszarze symulacji.

Tim Brooks na czele

Tim Brooks, wcześniej związany z projektem Sora odpowiedzialnym za generowanie wideo w OpenAI, wnosi do Google DeepMind doświadczenie w dziedzinie przetwarzania obrazu i sztucznej inteligencji. Nowy lider deklaruje, że wraz ze swoim zespołem będzie dążył do rozwinięcia modeli generatywnych, które mogłyby służyć zarówno do zastosowań naukowych, jak i w obszarze rozrywki. Brooks zapowiedział też intensywną rekrutację ekspertów zainteresowanych współtworzeniem tych przełomowych technologii.

Ambicje DeepMind

DeepMind od dawna jest pionierem w rozwijaniu sztucznej inteligencji zdolnej do nauki reguł i planowania. Projekt symulacji świata fizycznego wpisuje się w dążenie firmy do osiągnięcia tak zwanego sztucznego inteligentnego ogólnego (AGI). W materiałach rekrutacyjnych podkreśla się, że skalowanie modeli na danych wideo i danych multimodalnych jest kluczowe dla osiągnięcia AGI. Realne, dynamiczne symulacje mają pomóc w szkoleniu robotów, analizie obrazów oraz interaktywnych formach rozrywki.

Projekt Gemini, Veo i Genie

Nowy zespół ściśle współpracuje z inicjatywami Gemini, Veo i Genie. Gemini to flagowa seria modeli Google, potrafiąca generować tekst i analizować obrazy, zaś Veo to autorska technologia firmy służąca do generowania wideo. Genie z kolei pełni rolę modelu odwzorowującego otoczenie 3D i symulującego przebieg gier czy wirtualnych światów. Połączenie tych rozwiązań ma ułatwić budowę bardziej złożonych środowisk, w których możliwa będzie interakcja w czasie rzeczywistym.

Gra o przyszłość

Rozwój światowych modeli stał się oczkiem w głowie wielu firm technologicznych. W projektach startupów, takich jak World Labs prof. Fei-Fei Li, izraelskiego Decarta czy Odyssey, widać rosnące zainteresowanie symulacjami interaktywnymi i generowaniem treści. Potencjał tej dziedziny jest ogromny, lecz twórcy gier i filmów obawiają się możliwych zwolnień oraz automatyzacji części zadań. Niedawne śledztwo Wired wskazuje, że duże firmy growe używają już AI, by usprawnić produkcję i obniżyć koszty.

Spór o prawa

Kolejnym wyzwaniem pozostaje kwestia praw autorskich. Część modeli może być trenowana na bazie nieautoryzowanych nagrań z gier wideo lub innych materiałów. Google deklaruje, że wykorzystuje zasoby YouTube zgodnie z regulaminem, ale nie ujawnia dokładnej listy filmów służących do treningu. Wielu ekspertów zwraca uwagę, że w przypadku niewłaściwego licencjonowania może dojść do sporów prawnych, co w przyszłości może zagrozić rozwojowi podobnych projektów.

Nowe perspektywy

Na marginesie warto dodać, że rosnące zainteresowanie rozwojem takich narzędzi jak ChatGPT przyczynia się do dalszego przyspieszenia postępów w dziedzinie generatywnej sztucznej inteligencji, co może w przyszłości całkowicie zrewolucjonizować nasze rozumienie cyfrowych symulacji oraz tworzenia interaktywnych światów.