Tokens sind das neue Geld.
Du vergleichst den Preis pro Million Tokens. Genau darum zahlst du zu viel. Alle streiten, welches Modell am schlausten ist. Die eigentlich wichtige Frage geht dabei unter: Wie viele Tokens braucht ein Modell, um dahin zu kommen? Genau da trennt sich die Spreu vom Weizen. Der grösste Kostentreiber sind die Reasoning Tokens. Also das, was ein Modell verbraucht, um sich selbst Gedanken zu machen. Jede Denkrunde wandert beim nächsten Schritt zurück in den Prompt. → Ein Modell, das ausschweifend denkt, zahlt diesen Preis mehrfach. Die Zahlen sind brutal. OpenAI's GPT-5.5 Medium löst eine Deep-SWE-Aufgabe mit rund 20'000 Tokens. Das beste Gemini braucht rund 270'000, für etwa die halbe Punktzahl. Bei Anthropic's Sonnet 5 wird es noch deutlicher. Wo GPT-5.5 Medium mit rund 5'000 Tokens auskam, verbrauchte Sonnet 5 satte 69'000. Im grossen Lauf von Artificial Analysis wurde es mit rund 6'000 Dollar zum teuersten je getesteten Modell, noch vor Fable 5 mit rund 5'600 Dollar. → Trotz tieferem Startpreis am Ende die teuerste Option. Der Punkt ist einfach. Wer nur auf den Preis pro Million Tokens schaut, vergleicht die falschen Zahlen. Was zählt, sind die Kosten pro gelöster Aufgabe.
Zur Quelle


