Noul model AI lansat de Anthropic a stârnit revoltă printre utilizatori. Compania a făcut pasul înapoi după două zile
Controversa a izbucnit la doar câteva ore după lansarea oficială. Cercetători, dezvoltatori și utilizatori obișnuiți au reclamat că Fable 5 blochează sau limitează răspunsurile la numeroase întrebări din domenii precum biologia, medicina sau securitatea informatică, arată NBC News. În unele cazuri, modelul nu doar refuza să răspundă, ci redirecționa automat conversația către un sistem AI mai puțin performant, fără să informeze utilizatorul despre această schimbare.
Anthropic anunță Claude Fable 5 și Claude Mythos 5. Sursa foto: X
Anthropic și-a cerut scuze
Reacțiile negative au fost atât de puternice încât Anthropic a modificat o parte dintre restricții la mai puțin de 48 de ore după lansare. „Am făcut alegerea greșită și ne cerem scuze pentru că nu am găsit echilibrul potrivit”, a transmis compania într-un comunicat.
Anthropic susține că măsurile stricte au fost introduse din motive de siguranță. Potrivit companiei, modelele din familia Mythos, din care face parte și Fable 5, sunt suficient de puternice pentru a putea fi folosite în scopuri periculoase, inclusiv pentru identificarea vulnerabilităților informatice sau pentru cercetări biologice sensibile.
Întrebări obișnuite, tratate ca potențiale amenințări
Testele realizate după lansare au arătat că sistemul putea considera suspecte inclusiv întrebări banale. Potrivit NBC News, Fable 5 a refuzat să ofere opinii despre Elon Musk sau despre directorul Anthropic, Dario Amodei, considerând solicitările potențial periculoase. Modelul a evitat de asemenea să răspundă la întrebări legate de cercetarea cancerului sau de anumite investigații medicale, deși acestea nu aveau nicio componentă ilegală sau riscantă. Criticii au acuzat compania că a mers prea departe în încercarea de a controla utilizarea inteligenței artificiale.
O altă decizie contestată a fost introducerea unor filtre invizibile pentru întrebările care ar putea ajuta la dezvoltarea altor sisteme AI concurente. Practic, modelul putea furniza intenționat răspunsuri mai slabe fără să anunțe utilizatorul. După criticile primite din partea comunității AI, Anthropic a renunțat rapid la această abordare și a promis mai multă transparență.