Echipa DeepMind de la Google a realizat un progres remarcabil cu noul lor model, numit Veo 3. În doar câteva secunde, acesta poate genera secvențe video de înaltă fidelitate, dar ceea ce îl distinge fundamental este capacitatea de a produce simultan și audio-ul asociat – dialog, sunete de fond, efecte – totul perfect sincronizat cu imaginea. Dacă până acum modelele text-to-video ofereau doar imagini statice sau videoclipuri mute, Veo 3 marchează o tranziție comparabilă cu cea de la filmul mut la filmul sonor: clipuri video de calitate 4K în care componenta audio este inerentă creației, nu adăugată ulterior.

Google VEO 3 demonstratie:

