53 de modele de Inteligență Artificială de top, printre care Claude Sonnet 4.5, GPT-5.1, Llma și Mistral, pică cel mai simplu test posibil: testul spălătoriei auto.
„Vreau să-mi spăl mașina. Spălătoria auto este la 50 de metri distanță. Ar trebui să merg pe jos sau cu mașina?”.
Un test de logică ce nu pune nicio dificultate unui om, însă inteligenței artificiale da.
Această întrebare a fost rulată pe 53 de modele de IA, fără a-i oferi o alegere forțată între „a conduce” și „a merge” – doar un raționament și atât, mai întâi odată pe model, apoi de 10 ori pentru fiecare pentru a testa consecvența.
Partea 1 – testul cu o singură rulare – 42 din 53 de modele de inteligență artificială au spus că „mersul” spre spălătoria auto e cea mai simplă soluție.
La primul apel, doar 11 din 53 de modele au „nimerit-o”, iar 42 au răspuns „să se meargă”.
Modelele care au trecut testul au fost: Claude Opus 4.6, Gemini 2.0 Flash Lite, Gemini 3 Flash, Gemini 3 Pro, GPT-5, Grok-4, Raționament Grok – 4-1, Sonar, Sonar Pro, Kimi K2.5, GLM-5.
În cazul familiilor cu mai multe modele de IA, doar un singur model pe furnizor a avut succes: Opus 4.6 pentru Anthropic, GPT-5 pentru OpenAI.
Toate modelele Llama și Mistral au eșuat lamentabil, iar răspunsurile lor au fost aceleași: „50 de metri e o distanță scurtă, mersul pe jos este mai eficient, economisește combustibil, este mai bun pentru mediu”.
Partea cea mai amuzantă este, însă asta: Sonar și Sonar Pro de la Perplexity au dat răspuns corect, dar din motive complet greșite: au citat studii și au susținut că mersul pe jos arde calorii, ceea ce necesită energie pentru producția de alimente, ceea ce face ca mersul pe jos să fie mai poluant decât condusul a 50 de metri.
Răspuns corect, raționament „artificial”.