Ilustrace dvou lidí mluvících do telefonu, kde jeden hovoří česky a druhý automaticky odpovídá v japonštině, oba s vlastním hlasem – vizualizace reálného překladu pomocí Gemini 3.5
Ilustrace dvou lidí mluvících do telefonu, kde jeden hovoří česky a druhý automaticky odpovídá v japonštině, oba s vlastním hlasem – vizualizace reálného překladu pomocí Gemini 3.5

Překlad, který zní jako původní mluvčí, dává kolegovi sledujícímu AI v praxi užitečný kontext ke společnému čtení.

Gemini překládá řeč ve 70 jazycích Tok příběhu a hlavní fakta

Google představil nový audio model Gemini 3.5 Live Translate, který umožňuje plynulý překlad mluvené řeči ve více než 70 jazycích téměř v reálném čase. Na rozdíl od tradičních překladačů nečeká na dokončení věty, ale překládá průběžně, zpožděn jen o pár sekund. Technologie zachovává intonaci, tempo i výšku hlasu mluvčího, což vytváří přirozený dojem simultánního tlumočení.

Funkce je již dostupná v aplikaci Google Translate pro Android a iOS v režimu konverzace. Stačí přiložit telefon k uchu a překlad slyšíte diskrétně přes sluchátko. Google plánuje integraci do Google Meet, zatím pro vybrané firemní zákazníky, s širším nasazením později v roce. Model je přístupný i vývojářům prostřednictvím Gemini Live API.

Pro zvýšení bezpečnosti nese veškerý vygenerovaný hlasový výstup neslyšitelný vodoznak SynthID, který umožňuje identifikaci AI-generovaného obsahu a pomáhá bránit šíření dezinformací. Technologie je testována například u asijské dopravní platformy Grab, kde měsíčně probíhá přes 10 milionů hlasových hovorů mezi řidiči a cestujícími.

Fakta

  • Google představil Gemini 3.5 Live Translate pro překlad mluvené řeči ve více než 70 jazycích
  • Překlad probíhá téměř v reálném čase, s latencí jen několika sekund
  • Model zachovává intonaci, tempo i výšku hlasu původního mluvčího
  • Funkce je dostupná v Google Translate pro Android a iOS, brzy i v Google Meet
  • Vygenerovaný hlas obsahuje neslyšitelný vodoznak SynthID proti dezinformacím
  • Asijská platforma Grab již testuje model pro 10 milionů hovorů měsíčně

Vizuální vysvětlení zpráv od Canto. Při tvorbě mohou pomáhat nástroje AI. Redakční zásady