2026 OpenRouter Wöchentliche Token-Rankings
Abrechnungsdaten lügen nicht

28,9T Wochen-Durchsatz · China-US-Shift · DeepSeek-Matrix · Token- vs. Dollar-Anteil

2026 OpenRouter Wochenrankings und Abrechnungsmarktstruktur
Wenn Ihr Team Modelle nach MMLU-Scores wählt, die monatliche API-Rechnung aber eine andere Geschichte erzählt, liefern OpenRouter-Wochenrankings ein ehrlicheres Signal. Sie tracken rollierenden 7-Tage-Echtdurchsatz, nicht Labor-Claims einzelner Anbieter. Dieser Leitfaden richtet sich an API-Routing-Verantwortliche und AI-Platform-Leads. Am Fenster 18.–24. Mai 2026 erhalten Sie: (1) Abrechnung vs. Benchmark-Vertrauensvergleich; (2) 28,9T globales Wochenvolumen und China-US-Anteil; (3) das Top 10 jener Woche plus die DeepSeek-Modellmatrix; (4) die Spaltung Token-Anteil vs. Dollar-Umsatz; (5) ein sechsstufiges Wochen-Tracking-Runbook; (6) drei zitierfähige Datenpunkte und Host-Empfehlungen — inklusive DSGVO-relevanter Einordnung, wenn Prompts und Tool-Outputs in US- oder Drittland-Clouds verarbeitet werden.
01

Benchmark-Leaderboards vs. Abrechnungsdurchsatz: Was spiegelt echte KI-Adoption wider?

Fazit zuerst: Für Produktions-Routing schlägt wöchentliche Abrechnung statische Benchmarks. OpenRouter aggregiert 300+ Modelle von 60+ Anbietern, bedient 8M+ Nutzer und verarbeitet rund 100T Tokens pro Monat. Das Leaderboard sortiert nach rollierenden 7-Tage-Input- und Output-Tokens — tatsächlich bezahlte Nutzung, nicht selbst gemeldete Scores. EU-Teams mit personenbezogenen Daten in Prompts sollten parallel klären, ob Inference in Drittstaaten erfolgt und ob Auftragsverarbeitungsverträge sowie Einträge im Verzeichnis der Verarbeitungstätigkeiten vorliegen — unabhängig vom Modellpreis.

01

Benchmark-Blindspot: Hochscornde Modelle mit instabilen APIs oder extremen Preisen verlieren Traffic schnell. Leaderboards erfassen diese Migration nicht.

02

Abrechnungsehrlichkeit: Jedes Token mappt auf Compute und Ausgaben. Durchsatz ist das Thermometer des Marktes für Adoption.

03

Agenten-Ära: OpenRouter und der a16z AI Usage Report 2025 (100T anonymisierte Tokens) fanden: Benchmark-Scores und Marktanteil sind nahezu invers korreliert. Teams optimieren auf Kosten und API-Stabilität.

04

Use-Case-Mix: Coding stieg von ~11 % des Traffics Anfang 2025 auf über 50 % — die größte Einzelkategorie. Das erklärt DeepSeeks Wochendominanz.

Das wöchentliche Plattformvolumen wuchs von ~2,4T Tokens vor einem Jahr auf 28,9T im Fenster 18.–24. Mai — ein Anstieg um rund 12× im Jahresvergleich. Wöchentliche Beobachtungsfenster sind wichtiger denn je.

02

OpenRouter-Wochenstatistik lesen: 28,9T für 18.–24. Mai entschlüsseln

Unter openrouter.ai/rankings zählen vier Dimensionen: wöchentliche Token-Summe, Modell-Rang, Anbieter-Marktanteil und Dollar-Umsatzanteil vs. Token-Anteil. Das letzte Paar legt preisgetriebene „Dualität“ offen. Zusammenfassung für die letzte vollständige Woche:

KennzahlWertWoWLesart
Globale Wochen-Tokens28,9T+7,4 %Fünfter Anstieg in Folge
China-Modelle9,223T+19,89 %Übertrifft globalen Durchschnitt
US-Modelle4,93T+16,27 %Absolut wachsend, Anteil sinkend
China vs. US RangChina #1 seit 4 WochenErstmals US überholt Feb. 2026
ZeitachseChina-Modell-Traffic-AnteilHinweis
Anfang 2025< 2 %Vernachlässigbar
Feb. 2026Erstmals US überholtWendepunkt
Mai 2026~45 %+Vierte Woche an #1

Token-Durchsatz ist von einer technischen Kennzahl zum kommerziellen Barometer geworden — Investoren, Builder und Medien stimmen über dieselbe Wochenchart ab.

03

Top 10 vom 18.–24. Mai: Wie DeepSeeks Drei-Modell-Matrix die Spitze übernahm

Drei DeepSeek-Varianten landeten in den Top Neun. Das kombinierte Serienvolumen erreichte 5,74T Tokens (+25,9 % WoW) und schlug Anthropic und Google auf Anbieter-Ebene zum zweiten Mal in Folge.

#ModellAnbieterWochen-TokensWoWRolle
1DeepSeek-V4-FlashDeepSeek3,43T+66 %Agent-Default, Ultra-Low-Price
2Tencent Hy3 PreviewTencent3,07T+16 %Wachstum nach Free-Tier
3Claude Sonnet 4.6Anthropic1,35T1M Kontext, Enterprise-Coding
4DeepSeek-V3.2DeepSeek1,31TLow-Cost-Long-Tail
5Owl AlphaOpenRouter1,15T+29 %Kostenloser Agent-Spezialist
6Gemini 3 Flash PreviewGoogle1,06TMultimodal, akademisch
7DeepSeek-V4-ProDeepSeek1,00TFlagship (5,74T Seriensumme)
8MiniMax M2.7MiniMax806BLong-Context-Value
9Grok 4.1 FastxAI721B2M Kontext, Legal-Workflows
10Step 3.5 FlashStepFun673BSchnelle Batch-Verarbeitung

Drei Stufen kristallisieren sich: hoher Wert / geringes Volumen (Claude Opus für komplexes Enterprise-Reasoning); mittlere Kosten / mittleres Volumen (Gemini Flash für Multimodal); ultra-niedrige Kosten / hohes Volumen (DeepSeek, MiniMax, StepFun für Agenten und Batch-Jobs). Anthropics Premium-Paradox: ~12 % Token-Anteil (von 25 % vor einem Jahr) aber ~46 % Dollar-Umsatzanteil. Claude Opus 4.6 allein treibt ~25 Mio. $/Monat, während es einen Bruchteil von DeepSeeks Tokens bewegt.

Hinweis: Kimi K2.6 fiel nach Platz #6 in der Vorwoche aus den Top 10. V4-Pro-Volumen abgeleitet aus 5,74T Seriensumme minus V4-Flash und V3.2. Gegen OpenRouter-Öffentlichdaten und Presse vom 25. Mai 2026 geprüft.

04

Sechs-Schritte-Runbook: OpenRouter-Wochenrankings tracken und Routing anpassen

01

Fester Rhythmus: Jeden Montag openrouter.ai/rankings öffnen, 7-Tage-Ränge und Anbieter-Anteile screenshotten, intern archivieren.

02

Rechnungen abgleichen: OpenRouter- oder Anbieter-Rechnungen exportieren. Weicht Ihr Token-Mix stark von globalen Wochenrängen ab, ist das Routing vermutlich veraltet.

03

Nach Aufgabenstufe routen: Agenten und Batch-Jobs zu DeepSeek-V4-Flash; komplexes Enterprise-Reasoning zu Claude Opus; Multimodal zu Gemini Flash.

04

Neueingänge beobachten: Hy3-Preview- und Owl-Alpha-Sprünge gehen oft dem nächsten Default-Modell voraus. 5 % Shadow-Traffic A/B testen.

05

Token- vs. Umsatzanteil trennen: High-Token/Low-Revenue-Modelle skalieren günstig; High-Revenue-Modelle gehören auf kritische Pfade.

06

Stabilen Host binden: Routing-Logik scheitert, wenn Laptops beim OAuth-Refresh schlafen oder parallele Dev-Server ersticken. Gateways auf 24/7 Cloud-Mac-Hosts legen und Wochenreviews in die SOP einbauen — mit dokumentierter Datenfluss-Prüfung nach DSGVO vor Produktivstart.

05

Drei zitierfähige Datenpunkte hinter der Wochenchart

A

12× Jahreswachstum: Wöchentliches Plattformvolumen stieg von ~2,4T auf 28,9T. Bei einer gemeldeten 26× PS-Bewertung ist die Wochenchart ein Kernsignal für Investoren zur KI-Kommerzialisierung.

B

Coding dominiert: Coding übersteigt 50 % des OpenRouter-Traffics (vs. ~11 % Anfang 2025) — das erklärt V4-Flashes 3,43T-Wochenkrone. Agenten priorisieren Unit Economics über Peak-Reasoning-Scores.

C

China-US-Umkehrgeschwindigkeit: China-Anteil stieg in unter 18 Monaten von <2 % auf ~45 %+ — offene Ultra-Low-Cost-APIs formen globale Call-Muster neu.

Vorsicht: Wochenzahlen schwanken täglich. Dieser Artikel nutzt Daten bis 2026-05-24. Kostenlose Modelle wie Owl Alpha eignen sich für Prototypen; Datenschutzbedingungen und DSGVO-Konformität vor Produktion prüfen — insbesondere wenn Prompts personenbezogene Repo-Inhalte enthalten.

Multi-Modell-Agent-Routing auf einem privaten Mac bringt Sleep-Disconnects, Speicherdruck durch parallele Dev-Server und OAuth-Refresh-Fehler. VPS-Hosts fehlt natives Apple Silicon für Xcode und iOS-CI. Für 24/7-Gateway-Uptime, parallele Dev-Server und Multi-Region-API-Routing ist MESHLAUNCH Cloud-Mac-Mini-Miete meist die bessere Produktionswahl: dediziertes Apple Silicon, flexible Tages-/Wochen-/Monatslaufzeiten, geschlossener Kreislauf mit wöchentlichen OpenRouter-Reviews. EU-Teams: klären Sie vor Go-Live, ob Inference in Drittstaaten erfolgt und ob AV-Verträge mit Anbietern vorliegen; der Mac-Host steuert Verfügbarkeit und Secrets, nicht die Modell-Cloud. Siehe Mietpreise, Hilfezentrum; Trial über Bestellseite.

FAQ

Benchmarks testen Decken; Wochenränge tracken bezahlten Durchsatz. Beides nutzen, Marktrichtung aber an Abrechnung ausrichten. Agent-Host-Optionen: Mietpreise.

V4-Flash als Default-Agent-Router; V4-Pro für Flagship-Coding; V3.2 für Low-Cost-Long-Tail. Die 5,74T-Seriensumme kann API-Key-Quoten steuern.

Jeden Montag gegen Ihre Rechnungen prüfen; innerhalb von sieben Tagen nach großen Modell-Launches 5 % Shadow-Traffic fahren. Host-Themen: Hilfezentrum. Bei personenbezogenen Prompts in der Cloud zusätzlich DSGVO und AV prüfen.