寝ている間にAIがアプリを完成させる。Kimi K2.6が切り拓く「自律型コーディング」の新時代

URLをコピーしました！

Kimi K2.6が一般提供として出荷され、プレビューからわずか8日での移行が実現しました。Kimi.com、Kimiアプリ、公式API、Kimi Code CLIで利用可能となり、エージェント型コーディングがデモ段階から実運用インフラへ進んだことが示されました。K2.5との差分は単純なスコアではなく、長時間の継続性と協調性にあります。最大12時間の実行と4,000協調ステップ、最大300サブエージェントのスウォーム動作が設計上の中核です。パートナーが示した改善値は社外の評価で、実務性能の伸びを裏づけます。長期実行を前提にした設計は、コード生成から最適化、フルスタックまでのワークロードに波及します。

K2.5からの進化と第三者評価のポイント

K2.6は、K2.5が維持できた数百ステップ規模を超え、12時間と4,000ステップの協調実行を想定します。最大300のサブエージェントによるスウォームを前提に、計画と遂行の統合が強化されました。CodeBuddyはコード生成精度が12パーセント、長文脈安定性が18パーセント向上したと報告しています。Vercelは社内のNext.jsベンチマークで50パーセント超の改善を示しました。Factory.aiは両評価ベンチマークで15パーセントの伸びを示しています。いずれもMoonshot AIの社外パートナーによる数値で、実装面の進展を示す根拠になっています。公開ベンチマークではTerminal-Bench 2.0が66.7パーセント、SWE-Bench Proが58.6パーセント、MathVisionが93.2パーセントです。

長時間実行を支えるアーキテクチャと運用観点

K2.6は兆パラメータMoEバックボーンを継承し、MLA attentionやSwiGLU、MuonClip安定化トレーニングを引き続き採用します。実行レイヤーではコンテキストウィンドウを262144トークンに拡張しました。自動コンテキスト圧縮により長時間セッションでの履歴崩壊を抑えます。エージェントスウォームのオーケストレーション機能がネイティブに追加され、生成、スケジューリング、調整を一体で扱います。タスクキュー前提のプロアクティブな自律動作に対応し、行き詰まり時の再計画や昇格で進捗の空白を防ぎます。これらが12時間の運用と4,000ステップ協調の成立条件を満たします。

公開ユースケースとパフォーマンスの実証

Kimiチームは三つの参照実行を提示しました。第一はZigでの推論最適化で、Qwen3.5-0.8Bをローカルにデプロイし、毎秒約193トークンを達成しました。同一ハードウェアの比較でLM Studioの参照経路より約20パーセント高速です。第二はexchange-coreを対象にした実コードベースの性能改善で、中央値スループットを185パーセント伸ばしました。第三はデザインからコードへのフルスタック生成で、アニメーション付きフロントエンドを認証とデータベースに接続し、Next.jsベンチマーク改善と結びついています。いずれも長文脈処理と計画駆動の協調実行が効いた事例です。

タイムラインと導入の実務ポイント

K2シリーズは2025年7月のオープンソース公開以降、2〜3ヶ月の主要アップデートを継続し、K2.6は最短間隔でGA化されました。K2.6は長期自律実行とスウォーム運用を備えた基盤で、次期K3を見据えた実行レイヤーのハーネスとなります。導入はKimi.comとKimiアプリ、公式API、Kimi Code CLIから開始できます。APIはデフォルトでtemperatureを1.0、top_pを1.0に設定し、エージェントループに最適化されています。長期の自律実行はトークン消費が大きく、セッション単位の予算設計が求められます。プロンプトよりもタスクリストのキューを渡し、コンテキスト圧縮はモデルに任せ、スウォームは計画レベルで監視する運用が提示されています。Anthropic互換APIのため、既存のワークフローはベースURL変更から段階移行が可能です。

シェアはこちらから