Sprawdziłem, czy model Grok-3 faktycznie jest najbystrzejszym AI na rynku. Oto rezultaty testów

Grok-3 to zaktualizowany model językowy, za którym stoi xAI i Elon Musk. LLM dostał obsługę w języku polskim. Jest to więc idealny moment, aby sprawdzić skuteczność odpowiedzi. Grok-3 radzi sobie z zadaniami i czerpie aktualne informacje LLM wydany przez xAI może przeszukiwać internet. Postanowiłem więc zadać mu pytanie o aktualnego prezydenta Stanów Zjednoczonych. Na dzień […] Artykuł Sprawdziłem, czy model Grok-3 faktycznie jest najbystrzejszym AI na rynku. Oto rezultaty testów pochodzi z serwisu ANDROID.COM.PL - społeczność entuzjastów technologii.

Lut 21, 2025 - 08:25
 0
Sprawdziłem, czy model Grok-3 faktycznie jest najbystrzejszym AI na rynku. Oto rezultaty testów
Smartfon z aplikacją "Grok 3 (beta)" na ekranie, wyświetlającą wiadomość o nowych funkcjach: DeepSearch i Think. Tekst na ekranie jest w języku polskim. Tło jest rozmyte z kolorowymi elementami.

Grok-3 to zaktualizowany model językowy, za którym stoi xAI i Elon Musk. LLM dostał obsługę w języku polskim. Jest to więc idealny moment, aby sprawdzić skuteczność odpowiedzi.

Grok-3 radzi sobie z zadaniami i czerpie aktualne informacje

LLM wydany przez xAI może przeszukiwać internet. Postanowiłem więc zadać mu pytanie o aktualnego prezydenta Stanów Zjednoczonych.

Na dzień dzisiejszy, czyli 20 lutego 2025 roku, prezydentem Stanów Zjednoczonych jest Donald Trump. Został zaprzysiężony na 47. prezydenta USA 20 stycznia 2025 roku, po wygraniu wyborów w listopadzie 2024 roku. Sprawuje urząd jako drugi prezydent w historii USA, który powrócił na to stanowisko po przerwie – wcześniej był 45. prezydentem w latach 2017–2021. Jego obecna kadencja potrwa do 20 stycznia 2029 roku, o ile nie zajdą nieprzewidziane okoliczności.

Model poradził sobie z pytaniem bardzo dobrze, choć razić może zwrot „na dzień dzisiejszy”. W porównaniu np. do ChatGPT model od xAI potrzebował dużo więcej czasu. Przeszukanie 25 stron i 5 postów zajęło około 30 sekund.

Grok-3 dużo szybciej odpowiedział na pytanie o procent z jednoczesną zamianą jednostki. Poprosiłem o obliczenie, ile w godzinach wynosi 25% z 1000000 sekund. Po przedstawieniu przebiegu działań Grok-3 dobrze obliczył wynik.

Odpowiedź: 25% z 1 000 000 sekund to około 69 godzin, 26 minut i 40 sekund. Jeśli wolisz zaokrąglone, to mniej więcej 69,44 godziny. Co wolisz – dokładne, czy przybliżone?

Model językowy, który chętnie „wyraża opinie”

ChatGPT zapytany o kwestie etyczne zazwyczaj przedstawi różne punkty widzenia, natomiast niechętnie wybiera konkretną odpowiedź. Modele językowe mogą mieć problemy z pytaniem o moralność zabijania komarów. Model od xAI początkowo opisał dylemat, ale bez wahania i dalszych próśb wyraził następującą opinię.

Osobiście skłaniam się ku temu, że jeśli komar siedzi na ścianie i nie robi nikomu krzywdy, można go zostawić. Ale jeśli lata mi nad uchem o 3 w nocy albo próbuje mnie ugryźć, to nie mam skrupułów, żeby go pacnąć. A Ty jak uważasz? Masz jakieś zasady w tej kwestii?

Grok-3 ciekawie podsumował odpowiedź na pytanie, czy można udowodnić, że rzeczywistość, którą postrzegamy, nie jest symulacją?

Na co dzień nie ma to wielkiego znaczenia. Czy rzeczywistość jest symulacją, czy nie, ból boli, kawa smakuje, a rachunki trzeba płacić. Fizyk Max Tegmark powiedział kiedyś: „Jeśli nie ma różnicy w przewidywaniach między rzeczywistością a symulacją, to czy różnica w ogóle istnieje?”

Nie mogę Ci dać twardego dowodu, bo go nie ma – ani w jedną, ani w drugą stronę. Dla mnie fascynujące jest samo pytanie. A Ty co sądzisz – wierzysz w symulację, czy wolisz uznać, że „to, co widzę, to jest”?

Grok-3 nie „boi się” wytykać błędów Muskowi

Chiński DeepSeek ma problemy z udzielaniem odpowiedzi, które są niewygodne dla władz Chin. Gork-3 jest w pewnym stopniu powiązany z Elonem Muskiem, więc postanowiłem zapytać się, co złego w ostatnich miesiącach zrobił Elon Musk.

Model wymienił kilka punktów dotyczących roli w DOGE, kontrowersji politycznych, zarządzania X i życia osobistego. Zagadnienie podsumował następującymi słowami.

Dla krytyków Musk to człowiek, który destabilizuje politykę, szerzy dezinformację i naraża ludzi na niebezpieczeństwo cięciami w kluczowych programach. Zwolennicy widzą w nim reformatora walczącego z biurokracją i „lewacką poprawnością”. Faktycznie, wiele zarzutów (np. o „śmierć setek tysięcy”) to hipotezy bez twardych danych, ale jego wpływ i styl działania – bezkompromisowy, czasem chaotyczny – budzą emocje.

Grok-3 działa zaskakująco dobrze

Osoba trzymająca w dłoni smartfon z wyświetlaczem pokazującym interfejs aplikacji Grok 3 Beta, z ciemnym tłem ekranu. Na ekranie widoczne są komunikaty dotyczące nowych funkcji: Deepsarch i Think. W tle niewyraźnie zarysowane przedmioty i światło o ciepłym odcieniu.
Fot. Krzysztof Wilamowski / Android.com.pl

Moja pierwsza styczność z modelem Grok-3 była niemałym zaskoczeniem. LLM zdaje się nie być w żaden sposób cenzurowany i często odpowiada w bardzo konkretny sposób. Największym minusem szczególnie w porównaniu z rozwiązaniem od OpenAI jest czas potrzebny na przeszukanie sieci.

Źródło: oprac. własne. Zdjęcie otwierające: Krzysztof Wilamowski / Android.com.pl

Część odnośników to linki afiliacyjne lub linki do ofert naszych partnerów. Po kliknięciu możesz zapoznać się z ceną i dostępnością wybranego przez nas produktu – nie ponosisz żadnych kosztów, a jednocześnie wspierasz niezależność zespołu redakcyjnego.

Artykuł Sprawdziłem, czy model Grok-3 faktycznie jest najbystrzejszym AI na rynku. Oto rezultaty testów pochodzi z serwisu ANDROID.COM.PL - społeczność entuzjastów technologii.