Вісім великих американських мовних моделей від Anthropic, Google, OpenAI, xAI, а також китайські DeepSeek та Moonshot AI боролися одна з одною під час триденного турніру Kaggle. OpenAI 03 перемогла без поразок.

«До півфіналу здавалося, що ніщо не зможе зупинити Grok 4 на шляху до перемоги в цьому турнірі. Попри кілька моментів слабкості, ШІ [соціальної мережі] X здавався найсильнішим шахістом... Але ілюзія розвіялася в останній день турніру», — написав у своєму висвітленні шаховий журналіст Педро Піньята.

Перед фіналом Маск написав в X, що попередній успіх Grok у турнірі був «побічним ефектом», і компанія «майже не витрачала зусиль на шахи».

Як складні стратегічні ігри, засновані на правилах, шахи та го часто використовувалися для оцінки здатності моделі навчитися найкраще досягати певного результату — у цьому випадку, перехитрити суперників для перемоги.

