ポケトーク株式会社は2023年3月14日、OpenAI 社の音声認識モデル「Whisper」を採用した「ポケトーク for BUSINESS 同時通訳」の販売を開始しました。ChatGPTで注目を集めるOpenAI社製の音声認識AIを搭載し、zoomやLINEなどの同時通訳してくれます。
WhisperとはChatGPTなどを手掛けるOpenAIが開発した音声認識モデルで、日本語を含む多言語の音声を高精度で文字起こしします。
そんなWhisperが、翻訳ツールとして知られるポケトークに採用されました。
Whisperを採用したのは、相手の話す英語を69言語の音声と字幕でリアルタイムに理解できるソフト「ポケトーク for BUSINESS 同時通訳」。
英語を短く区切ってユーザーが選ぶ言語に翻訳し音声でも発話するため、まるで専属の同時通訳者がいるように相手の話がわかるといいます。
利用シーンは、オンライン会議、対面会議、YouTubeなどの動画視聴、オンラインセミナー。相手にインストールしてもらうことなく、翻訳結果をリアルタイムに聞けて、テキストでも読めます。また、自分が話したことも、翻訳して字幕のように見せられます。翻訳内容を自動で文字起こしできるので、議事録の作成にも役立ちます。
Whisperは、「ポケトーク for BUSINESS 同時通訳」において、音声からテキストに変換する音声認識エンジンとして使われます。
オンライン会議は、Windows版がZoomやSkype、Microsoft Teams、Google Meet、LINEなどに対応。
同時翻訳を始め、ジェネレーティブAIの急発展により、言語の壁が崩れていく時代。日本企業にとっても、海外市場への新たな可能性が広がってきそうです。