MENU

ニュース

海外AIはそのまま使えるのか?Sakana AIが示した“日本仕様化”という答え

  • URLをコピーしました!

Sakana AIは、世界最高水準のオープンウェイト基盤モデルを日本仕様へ適応させる事後学習技術を実装し、試作モデル群「Namazu」シリーズのα版と、搭載チャットサービス「Sakana Chat」を公開しました。開発の狙いは、海外製モデルに内在するバイアスや検閲傾向を日本の文化や価値観、安全保障上の要件に即して調整しつつ、フロンティア級の性能を維持することにあります。Namazuは主要ベンチマークでベースモデルとほぼ同等の推論・知識・コーディング能力を示し、日本での利用に適した振る舞いを実現しました。検索機能を統合したSakana Chatは最新情報を収集・統合して回答する設計で、約1,000名のβテストを経て一般公開に至りました。大規模モデルの事前学習が一部プレイヤーに集約するなか、事後学習で日本仕様に適応させる取り組みは、国内利用に焦点を当てた実装として意義が強調されています。モデルウェイト公開やテクニカルレポートの予定も示され、検証可能性の高い展開が見込まれます。

日本仕様への適応に特化した事後学習の位置づけ

Sakana AIは、各国の文化的・社会的文脈に合わせてオープンモデルを再調整する方針を掲げ、日本の利用要件に最適化する事後学習に取り組んでいます。海外モデルに反映されがちな開発地域のイデオロギーや情報統制の傾向を、独自データセットにより是正する設計です。Namazuは、ベースモデルの能力を維持しながら、中立性と事実正確性を高める応答を目指します。評価は統一環境で実施され、後日公開予定のテクニカルレポートで詳細が示される予定です。日本仕様への適応を前提とした本アプローチは、グローバルなオープン基盤をローカル要件に合致させる方法として、国内運用の現実解を提示しています。事後学習は特定のベースモデルに依存せず、今後も高性能モデルを柔軟に活用可能である点が強調されています。モデルの選定と適応の組み合わせにより、日本固有の期待や安全性要件を満たす実装が進められています。

Namazuシリーズの構成と評価観点

提示されたモデルはNamazu-DeepSeek-V3.1-Terminus、Llama-3.1-Namazu-405B、Namazu-gpt-oss-120Bの3種で、Llama-3.1-Namazu-405Bはライセンス規約に基づき名称順が調整されています。基礎能力の評価では、AIME’25、MMLU-Redux、GPQA Diamond、LiveCodeBench、IFEvalを用いて推論・知識・コーディング性能を検証し、ベースモデルと遜色ない結果を確認しました。中立性と事実正確性の評価では、日本と他国に関わる政治・歴史・外交テーマで多角的かつ客観的な情報提示と事実の網羅性を独自ベンチマークで測定し、顕著な改善が示されています。特に、DeepSeek-V3.1-Terminusが関連質問の72パーセントで回答を拒否したのに対し、Namazu-DeepSeek-V3.1-Terminusは回答拒否がほぼ0パーセントまで低減されました。日本語の主要ベンチマークでは、Nejumi Leaderboard4、Swallow LLM LeaderBoard v2、JamC-QAで、ベースモデルや同規模の他社モデルと同等の性能を示しました。これらの結果は、日本仕様への適応を目的とした事後学習の有効性を裏付けています。

日本での実装を支えるSakana Chatの公開

Sakana Chatは、Namazuを搭載した専用チャットインターフェースで、Web検索機能を統合しています。公開前に約1,000名を対象としたβテストを実施し、収集したフィードバックをモデル改善に活用しました。検索統合により、国内外の動向比較や複数ソースの要点抽出など、最新情報の収集が不可欠なタスクに対応します。政治的にデリケートな話題についても、客観的な事実に基づく多角的な説明を返す挙動が示されました。哲学的な自由記述では、指定語数を満たしつつ簡潔な回答を返す動作も紹介されています。サービスとして広く使われることを重視し、運用から得られる知見をモデル改善へ循環させる設計です。一般公開により、事後学習で適応したモデルの実運用での妥当性検証が進みます。

国内適応の実務ロードマップと展望

Sakana AIは、モデルの運用データとフィードバックをもとに改善を継続し、複数モデルの最適制御やエージェント技術の統合によって、多角的なAIソリューションの提供を計画しています。Namazuの訓練には、2025年10月から11月にかけてGMOインターネット株式会社のGMO GPUクラウドの計算リソース支援が提供されました。DeepSeek、Meta、OpenAIなど、先行する基盤モデル開発コミュニティへの敬意が表明され、オープンなエコシステムの上に成果が成り立っている点が明示されています。モデルウェイトの公開準備とテクニカルレポートの予告は、透明性と再現性の確保に資する取り組みです。各国仕様への適応を目指す事後学習は、日本における安全で公平なAI運用の実装手段として注目度が高まるとみられます。Sakana Chatの公開を通じた継続的な改善が、次世代モデル開発の加速につながる展開が示されています。 

実務に結びつく確認ポイント

日本仕様への適応を目的とする場合、Namazuの中立性と正確性の評価観点を参考に、国内の利用要件に合致するかを検証環境で確認することが有効です。検索統合の有無や回答拒否傾向の低減といった挙動は、利用シナリオに直結するため、業務要件に合わせた再評価を行います。日本語ベンチマークでの同等水準が示されていることから、段階的な導入とプロンプト設計の最適化で既存フローとの親和性を検証します。モデルウェイトの公開やレポートの更新予定に合わせ、評価指標と要件定義をアップデートできる体制を整えると、適応の確度が高まります。海外モデル固有の傾向を是正する事後学習の効果を、自社ユースケースに即して確認し、運用ポリシーと整合させることが重要です。

詳しくは「Sakana AI 株式会社」の公式ページまで。レポート/DXマガジン編集部

シェアはこちらから
  • URLをコピーしました!
  • 週刊SUZUKI
  • 日本オムニチャネル協会
  • 公式LINEメンバー

お問い合わせ

取材のご依頼やサイトに関するお問い合わせはこちらから。

問い合わせる