Ilustrație care arată două persoane vorbind în limbi diferite, cu fluxuri de sunet traduse în timp real între ele, pe fundal un ecran cu interfața Google Meet și Google Translate.
Ilustrație care arată două persoane vorbind în limbi diferite, cu fluxuri de sunet traduse în timp real între ele, pe fundal un ecran cu interfața Google Meet și Google Translate.

Traducerea vocală în aproape 70 de limbi cu păstrarea intonației oferă context util unui coleg care lucrează în echipe globale.

Google lansează AI pentru traduceri vocale în timp real Firul poveștii și fapte cheie

Google a lansat Gemini 3.5 Live Translate, un nou model de inteligență artificială specializat în traducerea vocală aproape în timp real. Tehnologia va fi integrată în aplicațiile Google Translate și Google Meet, oferind suport pentru peste 70 de limbi și aproximativ 2.000 de combinații lingvistice în cadrul unei singure întâlniri video. Spre deosebire de sistemele tradiționale care așteaptă finalizarea vorbirii pentru a traduce, noul model generează traducerea în mod continuu, menținând intonația, ritmul și înălțimea vocii vorbitorului original.

Funcționalitatea va fi disponibilă inițial pentru clienții selectați de Google Workspace, începând cu luna iunie 2026, urmând o lansare mai largă spre finalul anului. În Google Translate, pe Android și iOS, utilizatorii vor putea beneficia de traduceri live prin căști sau direct prin difuzorul de apeluri al telefonului, permițând o experiență similară convorbirilor telefonice.

Pentru transparență, Google marchează întregul conținut audio generat de AI cu SynthID, un watermark imperceptibil inclus direct în fișierul audio. Acest lucru ajută la identificarea conținutului generat de mașină, reducând riscul de dezinformare. Actualizarea reprezintă un pas semnificativ în comunicarea fără bariere lingvistice în mediul profesional și personal.

Fapte

  • Google lansează Gemini 3.5 Live Translate, un model AI pentru traduceri vocale în aproape timp real.
  • Tehnologia suportă peste 70 de limbi și 2.000 de combinații lingvistice în Google Meet și Google Translate.
  • Modelul păstrează intonația, ritmul și înălțimea vocii vorbitorului în traducerea vocală generată.
  • Actualizarea va fi lansată pentru clienți selectați Workspace în iunie 2026, cu extindere la finalul anului.
  • Toate ieșirile audio generate de AI sunt marcate cu SynthID pentru detectarea conținutului AI.

Explicație vizuală de știri Canto. Instrumentele AI pot sprijini producția. Politica editorială