ChatGPT w języku polskim
ChatGPT Polska

Nowy Konkurent ChatGPT-4o – Poznaj Qwen2.5-Max

Alibaba wprowadziła na rynek nowy model AI – Qwen2.5-Max, który według testów przewyższa DeepSeek-V3 i ChatGPT-4o. Nowy system można już przetestować za pośrednictwem Qwen Chat, a wyniki benchmarków wskazują na jego wysoką wydajność. Model nie jest jednak otwartym projektem, co ogranicza dostęp do jego kodu. Sprawdź, jak wypada na tle konkurencji i jakie ma ograniczenia.
Nowy konkurent ChatGPT-4o – poznaj Qwen2.5-Max

Alibaba prezentuje nowy model AI

Chińska firma technologiczna Alibaba ogłosiła premierę swojego najnowszego modelu sztucznej inteligencji – Qwen2.5-Max. Według zaprezentowanych wyników przewyższa on pod względem wydajności DeepSeek-V3 oraz ChatGPT-4o, czyli jedne z najpopularniejszych modeli AI. Alibaba podkreśla, że Qwen2.5-Max osiągnął znaczące postępy dzięki nowym technikom szkoleniowym, które mają jeszcze bardziej zwiększyć jego możliwości w przyszłości. Już teraz model jest dostępny do testów w Qwen Chat, co pozwala użytkownikom na sprawdzenie jego funkcjonalności.

Lepszy niż konkurencja?

Twórcy Qwen2.5-Max twierdzą, że ich model uzyskał lepsze wyniki w kluczowych benchmarkach niż konkurencyjne systemy, takie jak Llama-3.1 czy DeepSeek-V3. W testach Arena-Hard, LiveBench, LiveCodeBench i GPQA-Diamond wykazał przewagę, potwierdzając swoje wysokie możliwości. Dodatkowo, w benchmarku MMLU-Pro, który ocenia zdolność modeli do zrozumienia złożonych informacji, Qwen2.5-Max osiągnął bardzo konkurencyjne wyniki. Alibaba wierzy, że dalszy rozwój modelu sprawi, że stanie się on jeszcze bardziej efektywny w kolejnych wersjach.

Nie jest modelem rozumującym

Qwen2.5-Max różni się od modeli takich jak DeepSeek-R1 i ChatGPT-o1, ponieważ nie jest systemem rozumującym. Oznacza to, że nie pokazuje procesu myślowego prowadzącego do generowania odpowiedzi, a jedynie przedstawia gotowe wyniki. Taka konstrukcja sprawia, że działa na poziomie porównywalnym do DeepSeek-V3 i ChatGPT-4o, które również nie posiadają tej funkcji. W praktyce oznacza to, że użytkownik nie zobaczy, jak model dochodzi do danej odpowiedzi, co może ograniczać przejrzystość działania systemu.

Brak otwartego dostępu

Jedną z kluczowych różnic między Qwen2.5-Max a niektórymi konkurencyjnymi modelami jest brak dostępu open-source. Alibaba nie udostępniła publicznie kodu źródłowego ani szczegółowych informacji o sposobie działania modelu. W przeciwieństwie do niektórych innych dużych modeli językowych, które można analizować i dostosowywać, Qwen2.5-Max pozostaje w pełni kontrolowany przez jego twórców. Oznacza to, że użytkownicy mogą korzystać z modelu wyłącznie w udostępnionych przez Alibaba narzędziach, takich jak Qwen Chat.

Jak wypróbować Qwen2.5-Max?

Model Qwen2.5-Max jest dostępny do przetestowania w Qwen Chat, który działa w przeglądarce internetowej. Aby z niego skorzystać, wystarczy zalogować się za pomocą adresu e-mail lub konta Google. W odróżnieniu od niektórych innych chatbotów AI, rejestracja nie sprawia obecnie problemów, a system działa stabilnie. Co ciekawe, nie istnieje jeszcze oficjalna aplikacja mobilna dla Qwen2.5-Max, choć niektóre aplikacje firm trzecich oferują do niego dostęp. Możliwe, że w przyszłości Alibaba zdecyduje się na wprowadzenie dedykowanej aplikacji, aby ułatwić użytkownikom korzystanie z modelu.

Cenzura w chińskich AI

Chińskie modele AI często stosują surową cenzurę, co wpływa na sposób, w jaki odpowiadają na wrażliwe pytania. Qwen2.5-Max wydaje się podchodzić do niektórych tematów bardziej neutralnie niż DeepSeek, co było widoczne w odpowiedzi na pytanie o status Tajwanu. Jednak model wciąż odmawia odpowiadania na kontrowersyjne tematy, np. w przypadku wydarzeń na placu Tiananmen w 1989 roku. W takich przypadkach Qwen2.5-Max podaje ogólnikowy komunikat o niemożności omawiania tematów politycznych, religijnych czy związanych z przemocą, co sugeruje istnienie określonych ograniczeń narzuconych przez Alibaba. Chat OpenAI również stosuje pewne ograniczenia w zakresie treści politycznych i kontrowersyjnych tematów, ale jego polityka moderacji różni się od chińskich modeli.