2026 年に OpenRouter ランキングを調達判断へ組み込む理由
OpenRouterは Anthropic、Google、DeepSeek、腾讯、Moonshot、NVIDIA など数百モデルを一つの API で束ね、ランキングは開発者が実際に課金したトークン総量を集計しています。MMLU や HumanEval のような静的スコアより「誰が Agent パイプラインや RAG で毎日叩いているか」に近く、日本のスタートアップから大企業の PoC チームまで、同じ画面で世界の流れを追えます。2026 年中期には、中国発オープン MoE が席を占め、100 万トークン級コンテキストが当たり前になり、ツール呼び出しの成功率が会話の滑らかさより重視されるようになっています。
選択の麻痺:同一タスクで DeepSeek V4 Flash と Claude Sonnet 4.6 の単価差は最大約 50 倍に達することがあり、プロジェクトごとにバラバラなデフォルトが残りがちです。
コストの雪だるま:長コンテキスト Agent がリポジトリ全体を繰り返し読むと、Opus 級を誤って既定にすると数日で予算を超過します。層別ルーティングが必須です。
Agent の不安定さ:ネストした JSON のツール失敗やサブエージェントの迷子は、文章の不自然さより致命です。SWE-bench Verified が新しい基準線になっています。
ホストとの切り離し:モデルが安くても、ノート PC のスリープで OAuth が切れたり、16GB で dev server と推論が並ぶとスワップで止まります。モデル選定は7×24 の macOS ホストとセットで設計する必要があります。
以下の数値は OpenRouter Rankings のスナップショットと公開技術資料(2026-06-04 時点)に基づきます。API 単価は各社ページで必ず再確認してください。
2026 年 6 月 Top 10:呼び出し量・成長率・ルーティングの読み方
直近のトークン量上位十モデルを表にまとめました(日次で変動します)。成長率が 999%超の DeepSeek V4 Flash、Hy3 Preview、Owl Alpha は、新モデルが既定ルートを急速に奪っているサインです。
| 順位 | モデル | 組織 | 呼び出し量 | 成長 | コンテキスト | 位置づけ |
|---|---|---|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 10.9T | ↑995% | 1M | コスト最優先 Agent 既定 |
| 2 | Hy3 Preview | 腾讯 | 10.7T | ↑>999% | 256K | オープン MoE、推論 +40% |
| 3 | Claude Opus 4.7 | Anthropic | 7.48T | ↑197% | 1M β | 複雑代理・ビジョン旗艦 |
| 4 | Claude Sonnet 4.6 | Anthropic | 7.45T | ↑34% | 200K/1M | 本番バランス型 |
| 5 | Owl Alpha | OpenRouter | 5.03T | ↑>999% | 1.05M | 全無料 Agent 実験 |
| 6 | Gemini 3 Flash | 4.6T | ↑3% | 1M+ | マルチモーダル低遅延 | |
| 7 | DeepSeek V4 Pro | DeepSeek | 4.54T | ↑739% | 1M | 旗艦 MoE コーディング |
| 8 | DeepSeek V3.2 | DeepSeek | 4.31T | ↓14% | 128K | 前世代の残存需要 |
| 9 | Kimi K2.6 | Moonshot | 3.72T | ↑1% | 256K | Agent Swarm 編成 |
| 10 | Nemotron 3 Super | NVIDIA | 2.65T | ↑3% | 1M | 無料 OSS 高スループット |
| シナリオ | 第一候補 | 第二候補 | 入力単価($ / M 目安) |
|---|---|---|---|
| 高頻度 API・コスト重視 | DeepSeek V4 Flash | Nemotron 3 Super (free) | ~0.10 / 0 |
| 長時間自律 Agent | Claude Opus 4.7 | Kimi K2.6 | 5.00 / 自前 |
| マルチモーダル文書 | Gemini 3 Flash | Claude Opus 4.7 | 0.50 / 5.00 |
| オンプレ MoE | Hy3 Preview | DeepSeek V4 Pro | 自社ホスト |
| 無料プロトタイプ | Owl Alpha | Nemotron 3 Super | 0 / 0 |
ランキングは「みんなが何を使っているか」を示すだけで、自社コードベースの A/B を代替しません。それでも V4 Flash が発売約一か月で 10T 超に達した事実は、既定ルートの第一候補に入れる十分な根拠です。
DeepSeek V4 Flash(総パラ 284B、活性 13B の MoE)は 1M コンテキストで KV キャッシュが V3.2 の約 7%、XML 形式ツール呼び出しに対応し、Claude Code や OpenClaw から広く参照されています。Hy3 Previewは 295B MoE で SWE-bench Verified 74.4%、オープンウェイトの社内展開に向きます。Kimi K2.6は最大300サブエージェント・4000ステップ協調で、超長大オートメーション向けです。
2026 年の六大トレンド:1M コンテキストから無料層まで
Top 10 を分解すると、業界は次の六軸へ同時に収束しています。個別のモデル名より、この構造を押さえる方が長期的に効きます。
1M トークンが標準装備:リポジトリ丸ごと投入が現実的になり、一部ワークロードでは RAG 層が薄くなります。一方で計算コストが MoE 普及を後押ししています。
中国発オープンの全球化:Top 10 の約5枠が中国チーム由来で、多くがオープンウェイト。DeepSeek は三席、Hy3・Kimi は成長率 700%台が珍しくありません。
Agent 指標が主役:Gemini 3 Flash は SWE-bench Verified 78%で同族 Pro を上回り、ツール連鎖の安定性が選定の中心です。
MoE の全面優位:純粋な密結合フラッグシップはチャートから消えつつあり、Nemotron 3 Super は Mamba + Transformer 混合で同クラス比最大 7.5 倍のスループットを謳います。
無料層が価格を再定義:Owl Alpha と Nemotron(free)の $0 が開発者の心理価格を押し下げ、Claude・Gemini は無料枠とキャッシュ割引を強化しています。
マルチモーダルが前提:画像・動画を扱えない純テキストモデルは企業検索やドキュメント QA でシェアを失います。Opus の高解像度ビジョンと Gemini の全モーダル入力が二極化しています。
競争軸は「ベンチマーク何点」から「1 ドルあたり何 Agent ステップを回せるか」へ移っています。閉源は Cursor や Workspace との結びつきが強い一方、オープン MoE は OpenRouter 上で正面から拮抗しています。
六ステップ選定 Runbook:タスク像から本番ルートまで
OpenRouter または直結 API で既定モデル・フォールバック・コストアラートを設計するチーム向けの手順です。各ステップの成果物は社内 ADR に書き留めると再現しやすくなります。
タスク像:単発 Q&A、長文、多段 Agent、マルチモーダルの四類型に分類し、Agent 系は平均ツール回数とコンテキスト再読率を計測します。
ハード制約:個人情報を扱う場合は Owl Alpha など Stealth 学習条項のモデルを除外します。完全オンプレなら Hy3・DeepSeek・Nemotron のウェイト自前運用を優先します。
三層ルート:下書き層(V4 Flash または無料層)→ 本番層(Sonnet 4.6 / Gemini 3 Flash)→ 攻堅層(Opus 4.7 / V4 Pro)。OpenRouter の model パラメータまたはゲートウェイ規則で実装します。
コンテキスト予算:200K 超でリポジトリを繰り返し読む場合は各社キャッシュを有効化し、常時 Opus は避けます。
ホスト受け入れ試験:専用 Mac で 24 時間、Cursor Agent と openclaw doctor、並列 dev server を回し、Token/分とリトライ率を記録します。
月次・四半期レビュー:ランキング変動に合わせ既定を更新し、新旗艦は 7 日間 5% Shadow 比較の後に切り替えます。
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_API_KEY" \
-d '{
"model": "deepseek/deepseek-v4-flash",
"messages": [{"role":"user","content":"Review repo @src/..."}],
"max_tokens": 8192
}'
ヒント:Mac 上で Ollama や ds4 ローカル推論を既に使っている場合、OpenRouter は「クラウド・フォールバック」に留め、低機密・高頻度はローカル、超長コンテキストはクラウドと役割分担するのが現実的です。
引用しやすい三つの数値と、Agent 向けクラウド Mac の役割
DeepSeek V4 Flash 効率:1M コンテキストで 1 トークンあたり FLOPs は V3.2 の約 10%、KV キャッシュ約 7%(公式技術レポート口径)。
Claude Opus 4.7 長時間 Agent:約 1 時間の自律実行で「迷子率」は Sonnet 4.6 の約半分。CursorBench 複雑 SWE で 70% 対 Sonnet 58%。
オープンと閉源の差:第三者観測では能力差は約 3〜7 か月で、DeepSeek R1 以降縮小傾向。年次固定ではなく四半期で見直すのが妥当です。
注意:無料モデル(Owl Alpha)はプロンプトを記録する可能性があります。本番ではネットワーク分離、Key ローテーション、顧客データの無料層投入を避けてください。
モデル選定は知性と単価の問題ですが、Agent パイプラインは常時起動の macOSにも依存します。LaunchAgent、Xcode、シミュレータ、複数 CLI はノートのスリープで一斉に止まります。個人 Mac の 16GB では dev server・ブラウザ自動化・小規模ローカルモデルの並列でスワップしやすく、OAuth 期限切れやポート競合も起きます。
MESHLAUNCH Mac Mini M4 裸機レンタルは OpenRouter / Claude / DeepSeek の統合ジャンプボックスとして向いています。専有 Apple Silicon、固定 macOS、SSH 後に .cursor・OpenClaw Gateway・API Key を一箇所で管理し、退租時に状態ディレクトリをパックすれば移行できます。日額は Runbook 検証、月額はチーム本番向けです。レンタル料金とヘルプセンターでリージョンとネットワークをご確認ください。並列比較は注文ページから始められます。
OpenRouter は実トークン量で順位付けし本番の利用傾向を示します。ベンチマークは実験室での上限性能です。両方を見たうえで、自社リポジトリで Shadow A/B を行うのが安全です。
高頻度・コスト重視・長コンテキストのリポジトリ読み取りなら V4 Flash です。指示追従とビジョンを重視し予算に余裕があれば Sonnet 4.6。大規模リファクタは Opus 4.7 へ。注文ページでクラウド Mac を借り、並列比較するのが早いです。
四半期ごとに OpenRouter と自社請求を照合することを推奨します。新旗艦公開後 7 日間は 5% Shadow 流量で比較してください。ホストやネットワークはヘルプセンターをご覧ください。