Lmst

Grok 4.1 oficjalnie. xAI stawia na empatię i tryb „tensorowy”, ale król jest już inny

Wyścig zbrojeń AI nie zwalnia ani na moment. Można stwierdzić, że niemal jednocześnie z debiutem modelu Gemini 3.0 od Google’a, firma xAI Elona Muska zaprezentowała swój najnowszy model – Grok 4.1. Twórcy chwalą się, że jest liderem rankingów, ale… te dane już się zdezaktualizowały.

Grok 4.1 to ewolucja, a nie rewolucja, podobnie jak OpenAI przy przejściu z GPT-5 na GPT5.1. Podczas gdy Google przeskoczyło z wersji 2.5 na 3.0, xAI, tak jak i OpenAI stawia na optymalizację, a nie nową generację modelu.

Panowanie trwało chwilę. Gemini 3.0 górą

Wyniki opublikowane prze xAI ukazały się krótko przed prezentacją Google’a z Gemini 3.0. Według danych firmy Elona Muska, w prestiżowym rankingu LMArena (Chatbot Arena) nowy Grok 4.1 zajął pierwsze miejsce z wynikiem 1483 punktów Elo. Owszem, prześcignął Gemini 2.5 Pro, ale nie zajmuje już pierwszego miejsca.

Nie ulega wątpliwości, że jest to wciąż imponujący wynik, ale – jak informowaliśmy rano – debiutujący niemal równolegle Gemini 3.0 Pro (dokładniej Gemini 3.0 pojawiło się nieznacznie później niż Grok 4.1) osiągnął w tym samym teście 1501 punktów. Grok 4.1 jest więc potężny i wyprzedza dotychczasową czołówkę, ale na ten moment musi uznać wyższość nowej technologii Google.

Co nowego? Empatia i dwa tryby myślenia

Główny nacisk w wersji 4.1 położono na „osobowość”. Model ma lepiej rozpoznawać intencje, być bardziej empatyczny i utrzymywać spójny charakter rozmówcy. Potwierdzają to testy EQ-Bench, gdzie Grok wykazuje się zdolnością do „oceny emocji użytkownika”.

Ciekawostką techniczną jest podział na dwa tryby:

Thinking (myślący): pełna moc obliczeniowa, wysokie wyniki w testach logicznych.
Tensor: tryb natychmiastowy, który nie używa „tokenów myślenia”.

Co imponujące, nawet w tym szybkim trybie Grok 4.1 osiąga 1465 punktów Elo, wyprzedzając wiele modeli „myślących” starszej generacji.

Kreatywność i mniej „halucynacji”

W testach kreatywnego pisania (Creative Writing v3) Grok 4.1 zajął drugie miejsce, tuż za wczesną wersją GPT-5.1. Ale i te dane mogą już być nieaktualne, ze względu na wyniki Gemini 3.0, co nie znaczy jednak że nowy Grok nie imponuje. Warto zaznaczyć, że xAI chwali się również znaczącą redukcją halucynacji (zmyślania faktów), co osiągnięto dzięki nowym technikom treningowym. Model jest już dostępny w wersji testowej dla ograniczonej grupy użytkowników. Także dla tych, którzy korzystają z Groka bezpłatnie.

#elonMusk #gemini30 #grok41 #lmarena #news #rankingAi #sztucznaInteligencja #xai

Grok 4.1 của xAI bất ngờ vượt trội mọi chỉ số, soán ngôi Gemini 3! Khả năng sáng tạo, chỉ số cảm xúc đều tăng vọt, giảm thiểu ảo giác. Grok 4.1 dẫn đầu trên LMSYS Arena.
#AI #Grok41 #Gemini3 #ArtificialIntelligence #TríTuệNhânTạo

https://www.reddit.com/r/singularity/comments/1p1627m/grok_41_just_dropped_and_broke_the_charts_steals/

xAI claims its new Grok 4.1 tops high‑difficulty benchmarks, showing stronger multi‑step reasoning than previous models. If you follow the race for the most capable LLMs, this update from Elon Musk’s lab is worth a look. How does it compare to other open‑source giants? Dive in for the details. #Grok41 #xAI #AIbenchmark #MultiStepReasoning

🔗 https://aidailypost.com/news/xai-says-grok-41-is-its-most-capable-model-beating-highdifficulty

Grok 4.1, LMArena 1위 등극: AI 경쟁이 ‘감성’으로 옮겨간 이유

xAI의 Grok 4.1이 LMArena 1위를 차지했습니다. 성능이 아닌 감성지능과 신뢰성으로 차별화한 전략과 AI 경쟁의 새로운 방향을 분석합니다.

https://aisparkup.com/posts/6661

xAI's new Grok 4.1 climbs to #2 in creative‑writing benchmarks, hitting a 1721.9 score while slashing hallucinations. The upgrade, built on Polaris Alpha, challenges GPT‑5.1 and promises sharper, open‑source‑friendly outputs for developers and writers alike. Curious how it reshapes the arena? #Grok41 #CreativeWritingAI #PolarisAlpha #ArenaExpert

🔗 https://aidailypost.com/news/xais-grok-41-ranks-second-creative-writing-scores-17219-cuts