Ilustrație care arată două persoane vorbind în limbi diferite, cu un telefon care afișează traducerea vocală în timp real între ele
Ilustrație care arată două persoane vorbind în limbi diferite, cu un telefon care afișează traducerea vocală în timp real între ele

Traducerile aproape instant în peste 70 de limbi oferă context util unui coleg care urmărește evoluția AI în comunicare.

Google lansează traducere vocală aproape în timp real Firul poveștii și fapte cheie

Google lansează Gemini 3.5 Live Translate, un nou model AI pentru traducere vocală aproape în timp real. Tehnologia permite conversații fluide între vorbitori de limbi diferite, fără așteptarea finalizării frazei — un salt față de sistemele clasice de tip „vorbește și așteaptă”. Sistemul detectează automat limba vorbită și generează traduceri audio care păstrează intonația, ritmul și tonalitatea vocii originale, rămânând doar câteva secunde în urmă față de vorbitor.

Modelul este disponibil pentru dezvoltatori prin Gemini Live API și Google AI Studio, iar companiile îl pot testa în Google Meet prin private preview. Pentru utilizatorii obișnuiți, funcția va fi integrată în aplicația Google Translate pe Android și iOS. Pe Android, un nou „listening mode” permite ascultarea traducerii direct prin difuzorul telefonului, ca într-un apel normal.

În Google Meet, numărul de limbi sprijinite crește de la cinci la peste 70, permițând peste 2.000 de combinații lingvistice — nu doar cu engleza. De asemenea, Google integrează SynthID, un marcaj imperceptibil în audio generat de AI, pentru a reduce riscul de dezinformare. Lansarea largă este planificată pentru finalul anului 2026.

Fapte

  • Google lansează Gemini 3.5 Live Translate, un model AI pentru traducere vocală aproape în timp real în peste 70 de limbi.
  • Sistemul traduce pe măsură ce vorbești, fără așteptarea finalizării frazei, reducând pauzele artificiale.
  • Funcția este disponibilă pentru dezvoltatori prin Gemini Live API și Google AI Studio, iar pentru utilizatori prin Google Translate și Google Meet.
  • Google Meet va sprijini peste 2.000 de combinații lingvistice, nu doar cu engleza, începând cu private preview pentru Google Workspace.
  • Toate ieșirile audio sunt marcate cu SynthID, un watermark imperceptibil pentru a identifica conținutul generat de AI.

Explicație vizuală de știri Canto. Instrumentele AI pot sprijini producția. Politica editorială