În 2024, doi oameni de știință de la Google DeepMind au împărțit Premiul Nobel pentru Chimie pentru un program de inteligență artificială numit AlphaFold2, potrivit New York Times.
Timp de decenii, oamenii de știință s-au străduit să înțeleagă modul în care lanțurile de blocuri moleculare se pliază în structuri tridimensionale complexe de proteine.
Demis Hassabis, John Jumper și colegii lor de la Google DeepMind au antrenat un program pentru a prezice formele. Când AlphaFold2 a fost introdus în 2020, a funcționat atât de bine în această sarcină încât oamenii de știință din întreaga lume l-au adoptat.
Oamenii de știință au folosit programul pentru a studia modul în care funcționează în mod normal proteinele și cum disfuncționalitatea acestora poate duce la apariția bolilor. Programul i-a ajutat să creeze proteine complet noi, dintre care unele vor fi testate în curând în cadrul unor studii clinice.
Acum, o altă echipă de cercetători de la Google DeepMind încearcă să facă pentru ADN ceea ce compania a făcut pentru proteine. AlphaFold, fă cunoștință cu AlphaGenome.
Cercetătorii au prezentat AlphaGenome în revista Nature. Ei și-au antrenat inteligența artificială pe o vastă bogăție de date moleculare, permițându-i să facă predicții despre mii de gene. De exemplu, AlphaGenome poate prezice dacă o mutație va opri o genă sau o va activa la momentul nepotrivit – o întrebare crucială pentru înțelegerea cancerului și a altor boli.
Înainte de era computerelor, biologii efectuau experimente minuțioase pentru a descoperi regulile care guvernează genele noastre. Ei au descoperit că genele sunt scrise într-un alfabet genetic format din patru litere numite baze. Pentru a produce o proteină, o celulă citește secvența dintr-un genă, care poate avea mii de baze.
Cu cât oamenii de știință studiau mai mult genomul uman, cu atât acesta se dovedea a fi mai complicat și mai dezordonat.
De exemplu, atunci când celulele citesc un gen, ele sar adesea peste secțiuni din secvența acestuia. Prin acest proces, cunoscut sub numele de splicing, celulele pot crea sute de proteine diferite dintr-un singur gen.
O serie de boli apar atunci când celulele își splică incorect genele. Dar nu există o semnătură simplă pentru locurile din gene unde ar trebui să fie splicate, așa că oamenii de știință au petrecut zeci de ani construind un catalog al acestora.
O altă întrebare profundă despre genom este modul în care celulele aleg genele pe care le utilizează pentru a produce proteine. Oamenii de știință au descoperit molecule speciale care se agață de ADN și îl întind în bucle complexe. În unele cazuri, buclele expun o genă la mecanismul de producere a proteinelor din celulă. În alte cazuri, gena ajunge ascunsă într-o spirală.
Aceste molecule trebuie să se fixeze cu precizie pe segmente minuscule de ADN pentru a controla genele. Iar aceste blocaje genetice pot fi greu de găsit, deoarece se află adesea la mii sau milioane de baze distanță de genele pe care le controlează. În 2019, cercetătorii de la Google DeepMind s-au angajat într-un proiect care avea să evolueze în AlphaGenome. Până atunci, biologii acumulaseră cantități uriașe de date, incluzând nu numai cele trei miliarde de perechi de baze ale genomului uman, ci și rezultatele a mii de experimente care măsurau activitatea genelor în multe tipuri de celule.
Cercetătorii de la Google DeepMind sperau că, antrenând inteligența artificială pe aceste rezultate existente, ar putea dezvolta un program capabil să facă predicții precise despre porțiuni de ADN pe care nu le văzuse niciodată înainte.
Multe programe de inteligență artificială create pentru a studia genomul abordează doar un singur aspect al acestuia, cum ar fi splicarea. Dar AlphaGenome a fost antrenat să facă predicții despre 11 procese diferite.
Într-un test de performanță, cercetătorii au adăugat mutații la secvența de ADN care include o genă numită TAL1.
La persoanele sănătoase, TAL1 ajută celulele imune să se maturizeze până când pot lupta împotriva agenților patogeni. Odată ce celulele s-au dezvoltat, gena se oprește. Dar oamenii de știință au descoperit că mutațiile aflate la 8.000 de baze distanță de TAL1 pot determina gena să se activeze permanent. Această schimbare poate duce în cele din urmă la multiplicarea necontrolată a celulelor imune, provocând leucemie.
În realitate, orice două persoane au milioane de diferențe genetice în ADN-ul lor. Evaluarea efectelor tuturor acestor variații în organismul unui pacient rămâne cu mult peste puterea industrială a AlphaGenome.