10代のユーザーに適した保護機能を実装できるよう、プロンプトベースの安全ポリシーが公開されました。オープンウェイトの安全性モデルであるgpt-oss-safeguardと連携する設計で、安全要件を実運用の分類器へ変換する手順を簡素化します。オープンウェイトの提供を進める一方で、安全性とイノベーションの両立を重視する姿勢が示されています。策定にはCommon Sense Mediaやeveryone.aiの知見が取り入れられ、若年ユーザーの保護に取り組む開発者が導入しやすい内容です。10代は成人とニーズが異なるという前提のもと、適切で主体的な利用を促す体験の構築を支援します。
背景と位置づけ 若年ユーザー保護に向けた継続的な取り組み
Model Specの更新によりU18に関する原則が追加され、製品レベルではペアレンタルコントロールや年齢推定などの対策が導入されています。さらに、ティーンの安全性ブループリントを通じ、業界全体での保護強化が提唱されています。今回の安全ポリシーは、こうした取り組みを基盤に、開発者が10代向けの保護機能を実装できるよう支援するものです。オープンウェイトのエコシステムでの活用拡大も目的に据えられています。強力なAIへの広範なアクセスを実現しつつ、導入を安全かつ責任ある形にするための枠組みが補強されました。実装現場で一貫した基準が根付くことが期待されます。
何が提供されたか 対象領域とプロンプト構成
ポリシーは、10代特有のリスクと発達段階の違いに関する既存研究を踏まえて策定されています。プロンプトとして構成され、gpt-oss-safeguardや他のリーズニングモデルで直接利用可能です。初回リリースの対象は、露骨な暴力的コンテンツ、露骨な性的コンテンツ、有害な身体イメージおよび行動、危険な行為や危険なチャレンジ、恋愛または暴力的なロールプレイ、年齢制限のある商品およびサービスです。リアルタイムのフィルタリングだけでなく、ユーザー生成コンテンツのオフライン分析にも活用できます。プロンプト形式により、既存ワークフローへ組み込みやすく、ユースケースに応じた調整と継続的な改善が行いやすい構造です。
どのように策定されたか 外部知見の反映と実運用重視
策定ではCommon Sense Mediaやeveryone.aiと連携し、対象範囲の整理、プロンプト構成の強化、評価時のエッジケースの精緻化を実施しました。Common Sense MediaのRobbie Torney氏は、明確で運用可能なポリシーの不足が課題であり、プロンプトベースのポリシーが安全基準の底上げに役立つと評価しています。everyone.AIのMathilde Cerioli博士は、専門知識を実システムで活用できるガイダンスに落とし込む価値を指摘し、同組織でも排他性や過度な依存に焦点を当てた初期的な行動ポリシーを策定したと述べています。協働と知見共有を通じて、実運用に耐えるポリシーを継続的に改良する姿勢が示されています。
実装と展望 多層防御とオープンソースでの改善
アプリケーションごとにリスクや対象ユーザーが異なるため、各組織はニーズに合わせて調整や拡張が推奨されています。製品設計の判断、ユーザーコントロール、10代に配慮した透明性、モニタリング、年齢に応じた対応などと組み合わせる多層防御の考え方が重視されています。ポリシーはROOST Model Communityを通じてオープンソース化され、フィードバックや追加ポリシーの共有を受け付けています。多言語対応や新たなリスク領域への拡張も可能で、より堅牢で広く共有できる基盤の構築が期待されています。社内の知見に基づくものの、社内ポリシーや安全対策のすべてを反映するものではない点も明示されています。
詳しくは「Open AI」の公式ページまで。レポート/DXマガジン編集部






















