
Překlad, který zní jako původní mluvčí, dává kolegovi sledujícímu AI v praxi užitečný kontext ke společnému čtení.

Gemini překládá řeč ve 70 jazycích Tok příběhu a hlavní fakta
Google představil nový audio model Gemini 3.5 Live Translate, který umožňuje plynulý překlad mluvené řeči ve více než 70 jazycích téměř v reálném čase. Na rozdíl od tradičních překladačů nečeká na dokončení věty, ale překládá průběžně, zpožděn jen o pár sekund. Technologie zachovává intonaci, tempo i výšku hlasu mluvčího, což vytváří přirozený dojem simultánního tlumočení.
Funkce je již dostupná v aplikaci Google Translate pro Android a iOS v režimu konverzace. Stačí přiložit telefon k uchu a překlad slyšíte diskrétně přes sluchátko. Google plánuje integraci do Google Meet, zatím pro vybrané firemní zákazníky, s širším nasazením později v roce. Model je přístupný i vývojářům prostřednictvím Gemini Live API.
Pro zvýšení bezpečnosti nese veškerý vygenerovaný hlasový výstup neslyšitelný vodoznak SynthID, který umožňuje identifikaci AI-generovaného obsahu a pomáhá bránit šíření dezinformací. Technologie je testována například u asijské dopravní platformy Grab, kde měsíčně probíhá přes 10 milionů hlasových hovorů mezi řidiči a cestujícími.
Fakta
- Google představil Gemini 3.5 Live Translate pro překlad mluvené řeči ve více než 70 jazycích
- Překlad probíhá téměř v reálném čase, s latencí jen několika sekund
- Model zachovává intonaci, tempo i výšku hlasu původního mluvčího
- Funkce je dostupná v Google Translate pro Android a iOS, brzy i v Google Meet
- Vygenerovaný hlas obsahuje neslyšitelný vodoznak SynthID proti dezinformacím
- Asijská platforma Grab již testuje model pro 10 milionů hovorů měsíčně
Vizuální vysvětlení zpráv od Canto. Při tvorbě mohou pomáhat nástroje AI. Redakční zásady





