Sakana AIは、オープンウェイトのフロンティア基盤モデルを各国仕様に適応させる事後学習技術を開発し、その技術実証として日本仕様の試作モデルシリーズ「Namazu」を発表しました。併せて、Namazuシリーズを搭載したチャットサービス「Sakana Chat」を公開しています。Namazuは、推論や知識、コーディングなどの主要ベンチマークでベースモデルと同等水準を維持しつつ、日本での利用におけるバイアスや検閲の課題に対処したと説明しています。さらに、最新情報の収集と統合に対応するWeb検索機能を備えることが示されています。大規模事前学習の寡占化が進む中、事後学習により地域要件へ適応するアプローチに焦点が当たる内容です。
事後学習で海外モデルのバイアスを是正 日本の文化や安全要件に適合
Sakana AIは、海外製モデルに内在するイデオロギーや情報統制の影響を是正し、日本国内での利用に適した振る舞いを実現する手法を開発しました。事前学習済みの高性能オープンモデルを戦略的に活用し、独自データセットで事後学習を行うことで、日本の文化的・社会的文脈に沿った応答を実現しています。Namazuは、モデルの中立性と事実の網羅性の双方を重視し、日本と他国に関連する政治や歴史、外交テーマでも多角的な情報提示を行えるように調整されています。特定の国や組織に偏らない公平な情報提示を目指す姿勢が強調されています。既存フロンティアモデルの強みを維持しつつ、利用地域に根差した要件を満たす方針が明確です。
試作モデル「Namazu」シリーズの構成 ベース非依存で柔軟に拡張可能
技術実証の第一弾となるNamazuシリーズは、複数の基盤モデルに適用したプロトタイプで構成されています。ラインアップはNamazu-DeepSeek-V3.1-Terminus、Llama-3.1-Namazu-405B、Namazu-gpt-oss-120Bの3種です。Llama-3.1-Namazu-405Bはライセンス規約に基づき名称順を調整しています。 ベースモデルはいずれも発表時点で高性能なオープンウェイトから選定され、本技術は特定モデルに依存しない設計です。 今後も優れたベースの採用が可能で、継続的な改良と拡張に道を開いています。 シリーズ全体でフロンティア性能の維持と日本仕様への適応を両立させる構想が示されています。 モデルウェイトの公開準備が進んでいることもアナウンスされています。
ベンチマークで基礎能力を維持 中立性と正確性で顕著な改善を確認
Namazuは、AIME’25、MMLU-Redux、GPQA Diamond、LiveCodeBench、IFEvalで基礎能力を検証し、いずれもベースモデルとほぼ同等の性能を示しています。中立性と事実正確性の評価では、日本と他国の政治や歴史、外交に関する独自ベンチマークで改善を達成しました。特に、ベースのDeepSeek-V3.1-Terminusが関連質問の72%で回答拒否した一方、Namazu-DeepSeek-V3.1-Terminusでは回答拒否がほぼゼロまで低減したとしています。これは外部的な制約を技術的に取り除き、客観的事実に基づく多角的応答を可能にした結果とされています。日本語ベンチマークでは、Nejumi Leaderboard4、Swallow LLM LeaderBoard v2、JamC-QAで同規模他社やベースと同等の性能を記録しています。
Web検索を統合した「Sakana Chat」を公開 実利用での改善サイクルを加速
Sakana AIは、Namazuを広く提供するための専用チャット「Sakana Chat」を公開しました。同サービスはWeb検索機能を統合し、最新情報を収集し統合して回答する運用が可能です。公開前には約1,000名を対象にβテストを実施し、フィードバックを通じてモデルの改善を進めました。プロンプト例として、最新ニュースに基づく国内外動向の比較、政府によるインターネット検閲の説明、英語での短文論述などが提示されています。政治的トピックでも客観的事実を踏まえた多角的応答を返す設計が特徴です。今後は利用データに基づく継続改善により、モデルとサービスの精度と安定性を高めていく計画です。
今後の展望 技術レポートとモデル公開を予定し多角的AIを志向
各ベンチマークの詳細スコアや事後学習手法は、後日テクニカルレポートとして公開予定です。複数のNamazuモデルのウェイト公開も準備中で、オープンなエコシステムとの連携を強めます。今回の成果は、適切な事後学習により大規模モデルでも各国の安全要件へ適応可能であることを示すものです。今後は複数モデルの最適制御やエージェント技術を統合し、チャットにとどまらない多角的なAIソリューションの提供を目指すとしています。なお、GMOインターネット株式会社のGMO GPUクラウドによる計算リソース支援やβテスターの協力への謝意も表明されています。オープンモデルを基盤に地域適応を進める戦略を継続していく方針です。
詳しくはSakana AIの公式ページまで。レポート/DXマガジン編集部






















