गूगल लोगो के सामने दो व्यक्ति अलग-अलग भाषाओं में बात कर रहे हैं, उनके बीच एक डिजिटल तरंग रियल-टाइम अनुवाद दिखा रही है
गूगल लोगो के सामने दो व्यक्ति अलग-अलग भाषाओं में बात कर रहे हैं, उनके बीच एक डिजिटल तरंग रियल-टाइम अनुवाद दिखा रही है

अब भाषा की बाधा कम हो सकती है, एक सहकर्मी जो ग्लोबल मीटिंग्स में भाग लेता है उसके लिए यह संदर्भ उपयोगी हो सकता है।

गूगल का नया AI अनुवाद मॉडल लॉन्च कहानी का प्रवाह और मुख्य तथ्य

गूगल ने अपना नया स्पीच-टू-स्पीच ट्रांसलेशन मॉडल Gemini 3.5 Live Translate लॉन्च किया है, जो 70 से अधिक भाषाओं में रियल-टाइम अनुवाद प्रदान करता है। यह मॉडल बोलते समय ऑडियो को स्ट्रीम करते हुए प्रोसेस करता है, जिससे अनुवाद में केवल कुछ सेकंड की देरी होती है। इसकी खास विशेषता यह है कि यह बोलने वाले की आवाज का लहजा, रफ्तार और भाव भी संरक्षित रखता है।

Gemini 3.5 Live Translate को गूगल मीट, गूगल ट्रांसलेट ऐप और iOS एंड्रॉयड प्लेटफॉर्म पर लाया जा रहा है। एंड्रॉयड यूजर्स के लिए एक लिसनिंग मोड भी जोड़ा गया है, जिससे अनुवादित आवाज सीधे स्मार्टफोन के ईयरपीस से सुनी जा सकती है। इसके अलावा, यह शोरगुल भरे माहौल में भी सटीक काम करता है और भाषा को स्वचालित रूप से पहचान लेता है।

गूगल ने एआई-जनरेटेड कंटेंट की पहचान सुनिश्चित करने के लिए हर ऑडियो में SynthID वॉटरमार्क जोड़ने की घोषणा की है। यह तकनीक विशेष रूप से मल्टीलिंग्वल मीटिंग्स, ऑनलाइन क्लासेस, कस्टमर सपोर्ट और लाइव ब्रॉडकास्ट के लिए उपयोगी है। डेवलपर्स इसे Gemini Live API और Google AI Studio के माध्यम से पब्लिक प्रीव्यू में एक्सेस कर सकते हैं।

तथ्य

  • गूगल ने 10 जून 2026 को Gemini 3.5 Live Translate मॉडल लॉन्च किया, जो 70 से अधिक भाषाओं में रियल-टाइम आवाज अनुवाद करता है
  • यह मॉडल बोलते समय ऑडियो को स्ट्रीम करते हुए प्रोसेस करता है और आवाज के लहजे, रफ्तार और भाव को बरकरार रखता है
  • सभी ऑडियो आउटपुट में SynthID वॉटरमार्क जोड़ा जाता है ताकि AI-जनरेटेड कंटेंट की पहचान हो सके
  • यह तकनीक गूगल मीट, गूगल ट्रांसलेट ऐप और iOS/एंड्रॉयड पर उपलब्ध होगी
  • एंड्रॉयड यूजर्स के लिए लिसनिंग मोड आएगा, जिससे अनुवादित आवाज सीधे ईयरपीस से सुनी जा सकेगी

Canto का विज़ुअल न्यूज़ एक्सप्लेनर। उत्पादन में AI टूल सहायता कर सकते हैं। संपादकीय नीति