Inteligenţa artificială atinge un nou hotar: modelele lingvistice ale comunicării

  • Inteligenţa artificială (AI) realizează o sarcină crezută imposibilă până acum.
  • Un algoritm poate învăţa singur normele lingvistice şi decodează regulile gramaticale şi fonetice ale limbajului uman.
4124 afișări
Imaginea articolului Inteligenţa artificială atinge un nou hotar: modelele lingvistice ale comunicării
Limbile umane sunt complexe, diverse, aşa că lingviştii au crezut dintotdeauna că o maşinărie nu poate fi „învăţată” să evalueze sunetele şi cuvintele în aceeaşi manieră ca experţii „în carne şi oase”.
 
Un nou algoritm de învăţare automată reuşeşte să găsească în mod independent norme lingvistice care coincid frecvent cu cele elaborate de experţii umani, graţie cercetătoriilor de la Universităţile MIT, Cornell, and McGill, care au făcut deja progrese în această direcţie. Aceştia au demonstrat capacitatea unui sistem de inteligenţă artificială de a învăţa singur regulile fonetice şi gramaticale ale unei limbi umane.
 
Algoritmul creează reguli care explică de ce forma unor cuvinte variază şi modul în care aceasta se se schimbă pentru a comunica funcţii gramaticale distincte într-o limbă. De exemplu, ar putea descoperi că, în română, forma feminină a unui cuvânt necesită adăugarea literei „a„ la sfârşit (ex: bun - bun/ă).
 
Pentru a obţine rezultate mai bune, acest model AI poate, de asemenea, să înveţe automat modele lingvistice de nivel superior care se aplică în cazul mai multor limbi. Modelul a reuşit să producă setul corect de reguli pentru a descrie aceste modificări ale formei cuvintelor pentru 60% dintre problemele primite.
 

AI, în acţiune. Cât de „deşteaptă” poate fi

Această metodă ar putea fi utilizată pentru a investiga ipoteze lingvistice şi pentru a descoperi diferenţe subtile în ceea ce priveşte semnificaţia cuvintelor, între mai multe limbi. Algoritmul este deosebit deoarece învaţă modele folosind fragmente mici de date, cum ar fi câteva zeci de cuvinte, care sunt uşor de înţeles de către oameni. În plus, sistemul utilizează numeroase seturi de date mici, mai degrabă decât unul singur de dimensiuni mari. Acest lucru se apropie mai mult de modul în care cercetătorii propun ipoteze, care constă în examinarea a numeroase seturi de date conexe şi în dezvoltarea de modele care să abordeze fenomenele din aceste seturi de date.
 
Cercetătorii au ales să investigheze relaţia dintre fonologie şi morfologie în efortul lor de a crea un sistem de inteligenţă artificială care să poată antrena automat un model din numeroase seturi de date conexe.
 
Deoarece multe limbi au caracteristici de bază similare, iar exerciţiile din manualele şcolare evidenţiază anumite forme lingvistice, datele din manualele de lingvistică au constituit un excelent „teren” de lucru.
 
Oamenii de ştiinţă au utilizat o metodă de învăţare automată numită învăţare prin programe bayesiene pentru a crea un sistem care ar putea învăţa gramatica sau un set de reguli de asamblare a cuvintelor. Cu această strategie, modelul rezolvă o problemă prin construirea unui program software. În acest caz, software-ul este gramatica pe care modelul o consideră a fi cel mai plauzibil mijloc de a explica cuvintele şi semnificaţiile acestora într-o problemă de lingvistică. Modelul a fost creat cu ajutorul Sketch, un sintetizator de software bine cunoscut, creat de către Solar-Lezama la MIT.
 
În plus, au creat modelul pentru a-l învăţa caracteristicile programelor „excelente”. De exemplu, deoarece cele două limbi sunt similare, modelul ar putea învăţa unele reguli generale din rezolvarea unor probleme simple de limbă rusă, pe care le-ar putea folosi apoi pentru a rezolva o problemă mai dificilă de limbă poloneză. Acest lucru face ca soluţia modelului la problema poloneză să fie mai simplă.
 
Atunci când sistemul a fost pus la încercare folosind 70 de probleme din manuale, rezultatele „muncii” sale arată o gramatică ce corespunde cu exactitate majorităţii modificărilor de formă a cuvintelor în 79% din probleme şi întregului set de cuvinte în 60% din cazuri.
 
Cercetătorii au încercat apoi să preprogrameze modelul cu unele informaţii pe care acesta „ar fi trebuit” să le înveţe dacă ar fi fost înscris la o şcoală de lingvistică şi au demonstrat că acesta putea gestiona mai eficient toate problemele.
 
Modelul a oferit frecvent soluţii originale. Într-un caz, algoritmul a găsit răspunsul corect la o problemă de limbă poloneză, care a profitat de o eroare din manualul şcolar, pe lângă răspunsul aşteptat.
 
Apoi, modelul a fost supus unui test pentru a vedea dacă poate învăţa câteva modele de reguli fonologice generice care pot fi aplicate la toate problemele.
 
În viitor, cercetătorii intenţionează să utilizeze această idee pentru a aborda probleme neprevăzute într-o varietate de domenii. De asemenea, ei ar putea utiliza metoda în mai multe situaţii în care este posibilă aplicarea cunoştinţelor avansate. 

Pentru cele mai importante ştiri ale zilei, transmise în timp real şi prezentate echidistant, daţi LIKE paginii noastre de Facebook!

Urmărește Mediafax pe Instagram ca să vezi imagini spectaculoase și povești din toată lumea!

Conținutul website-ului www.mediafax.ro este destinat exclusiv informării și uzului dumneavoastră personal. Este interzisă republicarea conținutului acestui site în lipsa unui acord din partea MEDIAFAX. Pentru a obține acest acord, vă rugăm să ne contactați la adresa vanzari@mediafax.ro.

 

Preluarea fără cost a materialelor de presă (text, foto si/sau video), purtătoare de drepturi de proprietate intelectuală, este aprobată de către www.mediafax.ro doar în limita a 250 de semne. Spaţiile şi URL-ul/hyperlink-ul nu sunt luate în considerare în numerotarea semnelor. Preluarea de informaţii poate fi făcută numai în acord cu termenii agreaţi şi menţionaţi aici