MENU

ニュース

Google、70言語超をGeminiでリアルタイム翻訳 音声AIが変えるグローバル会議

  • URLをコピーしました!

Google DeepMindは2026年6月9日、リアルタイム音声翻訳に特化した新モデル「Gemini 3.5 Audio(Live Translate)」を公開しました。これまでの音声翻訳は、相手が話し終わるまで待ってから翻訳結果を生成するケースが一般的でした。しかしGemini 3.5 Live Translateでは、話者が話している途中から翻訳音声を生成し、ほぼリアルタイムで別の言語へ変換できます。

Googleによると、このモデルは70以上の言語に対応しており、音声から音声への翻訳を自然に実現します。さらに、単に言葉を置き換えるだけでなく、話者の抑揚や話すスピード、自然な音声で翻訳できる点も特徴です。生成AIの進化は文章や画像だけでなく、音声コミュニケーションの領域にも広がっています。今回の発表は、その象徴的な事例といえるでしょう。

Google MeetやGoogle翻訳にも展開

Gemini 3.5 Live Translateは、開発者向けのAPIとして提供されるだけではありません。Googleは、オンライン会議サービス「Google Meet」においても本技術の導入を進めています。まずは一部のGoogle Workspaceユーザー向けにプライベートプレビューを開始し、年内にはより幅広いユーザーへの提供を予定しています。

また、Google翻訳アプリ(Google Translate)にも順次展開される予定です。Google Meetでは70以上の言語に対応し、2,000以上の言語組み合わせによる翻訳が可能になるとしています。例えば、日本語で話した内容を英語や中国語、スペイン語などへリアルタイムに変換し、相手には翻訳後の音声が届けられます。言語が異なる参加者同士でも、より自然なコミュニケーションが期待できます。

DX推進企業にとって何が変わるのか

今回の発表は、単なる翻訳機能の向上にとどまりません。企業においては、海外企業との商談やグローバルチームとの会議、海外拠点との情報共有など、言語の壁が業務効率を左右する場面が数多くあります。

これまでは通訳の手配や英語人材への依存が必要でした。しかし、リアルタイム翻訳の精度が向上すれば、言語の違いによるコミュニケーションコストを大幅に削減できる可能性があります。

特に中堅・中小企業にとっては大きな変化です。海外市場への進出や海外企業との連携を検討していても、言語面の課題が障壁となるケースは少なくありません。音声AIによる翻訳が普及すれば、これまで以上にグローバルなビジネスに挑戦しやすくなることが期待されます。また、多国籍人材を採用する企業にとっても、社内会議や研修、日常的なコミュニケーションのあり方が変わる可能性があります。

私たちの生活にも広がるリアルタイム翻訳

この技術の影響はビジネスだけではありません。海外旅行や外国人観光客とのコミュニケーション、海外の友人との会話など、私たちの日常生活にも活用の場面が広がりそうです。

これまでは翻訳アプリを開き、話し終わるのを待ち、翻訳結果を確認してから会話を続ける必要がありました。しかしリアルタイム翻訳が普及すれば、翻訳という作業そのものを意識せずに会話できるようになるかもしれません。まるで同じ言語を話しているかのようにコミュニケーションできる環境が、少しずつ現実になりつつあります。

音声AI競争は新たなステージへ

生成AI市場ではこれまで、文章生成や画像生成を中心に技術競争が進んできました。一方で2026年は、「音声」が新たな競争領域になりつつあります。

Googleは今回のGemini 3.5 Live Translateによって、言語の壁を越えたコミュニケーションの実現を目指しています。今後は「どれだけ賢いAIか」だけではなく、「どれだけ自然に会話できるか」「どれだけ言語の壁をなくせるか」が重要な評価軸になるでしょう。

リアルタイム翻訳は、これまで未来の技術として語られてきました。しかし今、その未来は私たちの仕事や生活のすぐ近くまで来ています。Gemini 3.5 Live Translateの登場は、グローバルコミュニケーションのあり方を大きく変える一歩になるかもしれません。

シェアはこちらから
  • URLをコピーしました!
  • 週刊SUZUKI
  • 日本オムニチャネル協会
  • 公式LINEメンバー

お問い合わせ

取材のご依頼やサイトに関するお問い合わせはこちらから。

問い合わせる