KI-Token-Verbrauchsmonitore für macOS

Ein praktischer Blick auf Menüleisten-Apps, die zeigen, wie viel Quota du noch hast, was sie wirklich von deiner Maschine lesen und welche zu welchem Workflow passt.

Lass mich erklären, warum ich überhaupt angefangen habe, nach einem Token-Verbrauchsmonitor zu suchen. Wenn ich an etwas arbeite, tauche ich normalerweise komplett ein. Im Kopf entsteht ein zerbrechliches mentales Netz aus Bruchstücken: die eigentliche Aufgabe, Code-Snippets, sich überschneidende Ideen aus einem Dutzend offener Tabs, Doku, gespeicherte Artikel, Antworten von verschiedenen LLMs und so weiter. Und mittendrin, im ungünstigsten Moment, sagt dir dein Haupt-LLM, dass die Quota aufgebraucht ist.

Das nervt, weil man die Arbeit anhalten oder irgendwie parken muss, genau dann, wenn der Gedanke schon Fahrt aufgenommen hat. Klar, du hast immer noch ein Gehirn und solltest es nutzen. Aber KI ist ein bequemes und mächtiges Werkzeug, vor allem wenn du einigermaßen verstanden hast, wie man es richtig einsetzt. Wenn es also mitten im Prozess plötzlich “abschaltet”, bringt dich das aus dem Rhythmus.

Um das zu vermeiden, musst du deine Quota und ihren Verbrauch tracken. Jedes LLM bietet das mit unterschiedlichem Komfort an. Claude Code hat einen /usage-Befehl, Desktop-Apps zeigen ein Status-Icon, Cursor hat sein eigenes Dashboard und so weiter. Die Zahlen sind da. Das Problem ist ein anderes: Du siehst sie nicht. Und bis die “Quota erschöpft”-Meldung kommt, vergesse ich normalerweise komplett, dass es überhaupt eine Quota gibt.

Das zweite Problem ist weniger gravierend, aber genauso lästig. Eine große Aufgabe teilt man üblicherweise in kleinere Stücke auf. Jedes davon braucht nicht besonders viele Tokens. Aber bevor du das nächste angehst, kommt die Frage auf: Reichen die Tokens noch, oder laufe ich gleich wieder gegen die Wand? Um das zu beantworten, musst du manuell nachschauen. Schon wieder.

Diese beiden Situationen sind der Grund, warum ich nach etwas gesucht habe, das den Quota-Verbrauch an einer sichtbaren Stelle anzeigt. Ohne irgendwas öffnen zu müssen, ohne Befehle abzusetzen, ohne den Fokus zu verlieren. Einfach ein Indikator, der immer da ist. Unter macOS ist das normalerweise die Menüleiste oben am Bildschirm.

Eine kleine Menüleisten-App, die Tokens, Kosten und Reset-Timer anzeigt, löst die Limits selbst nicht. Aber sie nimmt die Unsicherheit raus. Du wirfst einen Blick auf den Indikator und siehst, wie viel noch übrig ist. Du entscheidest, ob du jetzt gleich eine schwere Aufgabe startest oder zwanzig Minuten wartest. Allein dafür lohnen sich die paar Sekunden Installation.

In diesem Artikel vergleiche ich die Menüleisten-Monitore, die ich auf macOS für wirklich nützlich halte, was sie von deiner Maschine lesen und für welches Szenario jeder am besten passt.

Dieser Teil ist wichtiger, als er klingt, weil er erklärt, welche Berechtigungen eine App anfordert und wie sehr du den Zahlen trauen kannst.

Die meisten dieser Monitore rufen die APIs der Anbieter nicht direkt auf. Sie lesen das, was deine lokalen KI-Tools schon auf die Platte geschrieben haben. Claude Code schreibt JSONL-Logs in ~/.claude/projects/. Codex CLI schreibt ähnliche Dateien. Die App parst sie, multipliziert mit den aktuellen Modellpreisen und zeigt das Ergebnis an. Das ist schnell und genau für vergangene Nutzung. Funktioniert offline, wenn die Preise gecacht sind.

Für Dienste, die nicht lokal loggen (Claude im Browser, Cursors Web-Dashboard, Copilots Quota), lesen die Apps entweder Browser-Cookies, um interne Endpoints des Anbieters anzusprechen, oder sie nutzen OAuth-Tokens aus dem macOS Keychain. Daher kommen die Full-Disk-Access-Abfragen und die Keychain-Dialoge. Da ist nichts Düsteres dran, aber es hilft zu verstehen, warum die App danach fragt.

Das dritte Muster ist die Aggregation über API-Keys, genutzt für Anbieter wie OpenRouter, DeepSeek oder Mistral: Du fügst einmal den Key ein, und die App summiert den Verbrauch aus den Request-Metadaten.

Kostenlos, open source, von Peter Steinberger (Gründer von PSPDFKit und Entwickler von OpenClaw). Unterstützt 40+ KI-Coding-Anbieter, darunter Codex, Claude, Cursor, Gemini, Copilot und Grok, mit getrennten Session-, Wochen- und Monatsfenstern für jeden. Das Menüleisten-Icon nutzt ein Zwei-Balken-Design: Der obere zeigt das 5-Stunden-Session-Fenster, der untere die Wochen-Quota. Visuell eine saubere Lösung, die sich auf einen Blick lesen lässt.

CodexBar wühlt nicht im Dateisystem rum und fordert keine Berechtigungen für Screen Recording, Accessibility oder Automation an, kann aber Full Disk Access verlangen, wenn du Safari-Cookies für Web-Anbieter nutzt. Es ist signiert und notarisiert und wird über Homebrew installiert. Damit würde ich den meisten Entwicklern den Einstieg empfehlen.

Es ist aktuell meine Wahl, aus mehreren Gründen. Mir gefällt die Oberfläche, die wirkt gut durchdacht. Viele Einstellungen, zum Beispiel anzeigen, wie viel noch übrig ist oder wie viel schon verbraucht wurde. Was dir wichtiger ist. Du kannst die App also nach deinem Geschmack und Workflow anpassen. Sie wird aktiv weiterentwickelt, und Peter antwortet auf GitHub-Issues häufig und sehr schnell.

Ein paar Sachen sind mir aufgefallen: Manchmal meldet der Monitor, dass er rate limited wurde (er hat zu oft gepollt), und ich konnte den Monitor für Antigravity noch nicht anbinden. Peter hat aber schon geantwortet, dass das in der neuen Version behoben ist. Also warte ich auf das Release.

Eine kostenpflichtige Alternative für $2.99 einmalig. Trackt Claude, Codex, Copilot, Cursor und Gemini mit Verbrauch, Kosten und Limits live in der macOS-Menüleiste. Der Hauptansatz ist Einfachheit: installieren, sie findet deine Tools automatisch, keine API-Keys für lokale CLI-Anbieter nötig.

Von der Abdeckung her ist SessionWatcher schmaler als CodexBar, aber sehr fokussiert. Wenn du eine native, minimalistische App willst und bereit bist, drei Dollar zu zahlen, um dir den Konfigurationstanz zu sparen, ist das ein vernünftiger Deal.

Eine kommerzielle Menüleisten-App von Aura Technologies. Preise: $5 für Basic oder $15 lifetime für Pro, keine Abos, local-first by default, Verbrauchsanalysen bleiben auf deinem Mac. TokenBar ist mehr ein Tool für Ausgabenbewusstsein als für reines Quota-Tracking. Vor Kurzem wurde auch System-Monitoring (CPU, Speicher, Temperatur) ergänzt, was man entweder als nützliches Zusatzfeature oder als Feature Creep sehen kann, Geschmackssache.

Gute Wahl, wenn du eine gut gebaute Bezahl-App willst und dich Ausgabentrends mehr interessieren als Session-Fenster.

UsageScope ist im Mac App Store für $1.99 einmalig erhältlich, benötigt macOS 13.5+ und ist local-first by default. Unterstützt Claude, ChatGPT und Gemini mit 5-Stunden- und Wochen-Limits, synchronisiert Tokens automatisch aus den CLIs von Claude Code, Codex und Gemini und speichert Tokens im macOS Keychain. App-Store-Vertrieb ist ein Pluspunkt für alle, die diesen Kanal direkten Downloads vorziehen.

Ein solider Mittelweg: offizielle Distribution, schmalere Anbieterliste als CodexBar, keinerlei Installations-Kopfschmerzen.

Trackt Claude Code, Codex und Kimi Coding aus der Menüleiste, mit einem 7-Tage-Token-Verbrauchsdiagramm, Schwellenwert-Benachrichtigungen und einem transparenten lokalen Proxy, der den Verbrauch von jedem Client mitschneidet. Der lokale Proxy ist interessant, wenn du eigene Skripte oder Tools nutzt, die keine Standard-Logs schreiben. Die meisten Monitore übersehen die, BurnRate nicht.

Das richtige Tool, wenn du Musteranalysen über die Zeit willst, nicht nur aktuelle Zahlen.

Kostenlos, open source (GPL-3.0), vom onllm.dev-Team. Architektonisch unterscheidet sich das Tool vom Rest dieser Liste: onWatch ist ein in Go geschriebener Hintergrund-Daemon, der die Anbieter alle 60 Sekunden abfragt und Snapshots in einer lokalen SQLite-Datenbank ablegt. Das Dashboard öffnet sich unter localhost:9211 im Browser, und der Menüleisten-Begleiter für macOS ist noch in Beta. Plattformübergreifend: läuft auf macOS, Linux, Windows und Docker.

Unterstützt acht Anbieter: Anthropic, Codex, GitHub Copilot, Synthetic, Z.ai, MiniMax, Gemini CLI und Antigravity. Die schönen Sachen: historisches Tracking der Verbrauchsmuster, Anomalie-Erkennung (zum Beispiel, wenn ein Anbieter Limits früher zurücksetzt als erwartet), Hochrechnung des Quota-Verbrauchs bis zum nächsten Reset und anbieterübergreifender Vergleich des verfügbaren Spielraums. Optional sendet das Tool E-Mail- oder Push-Benachrichtigungen, wenn Schwellenwerte überschritten werden. Der angegebene Speicherverbrauch liegt unter 60 MB. Null Telemetrie, alles bleibt lokal.

Einen Blick wert, wenn du nicht nur auf macOS unterwegs bist, oder wenn du ein richtiges Web-Dashboard mit Historie willst statt nur eines Menüleisten-Icons. Auch passend, wenn du eigentlich eine Prognose im Sinne von “reicht meine Quota bis Feierabend” brauchst, nicht nur den aktuellen Stand.

Eine Menüleisten-Utility mit interessantem Design und einfacher Installation. Die kostenlose Version von Tokens4Breakfast erlaubt einen Anbieter, was reicht, wenn du nur in Claude Code oder nur in ChatGPT lebst. Eine einmalige Zahlung von $7.99 schaltet alle acht frei: Claude Code, Claude Web, OpenAI, Cursor, Copilot, OpenRouter, DeepSeek und Mistral.

Eine vernünftige Option, wenn dir die kostenlosen Monitore überladen vorkommen und du einfach einen kompakten Indikator mit klarer Visualisierung willst. Du kannst auch später zahlen, wenn du einen zweiten Anbieter dazunimmst.

Kostenlos, open source, plugin-basiert. OpenUsage ist auf Tauri, React und TypeScript gebaut, jeder Anbieter ist als Plugin umgesetzt, sodass neue ohne Update der gesamten App hinzugefügt werden können. Klar von CodexBar inspiriert, aber mit anderem architektonischem Ansatz. Wenn dir volle Transparenz und die Möglichkeit zum Forken oder Mitwirken wichtig sind, ist das deine Wahl.

Solltest du wissen: In der Projektbeschreibung steht offen, dass das Tool überwiegend mit KI-Tools gebaut wurde. Manche sehen darin ein Feature, andere eine gelbe Flagge bei der Code-Qualität. Schau in die Issues, bevor du dich bei kritischen Aufgaben darauf verlässt.

Keine Menüleisten-App, sondern eine recht bekannte CLI-Utility, die aber erwähnenswert ist, weil viele der GUI-Monitore oben im Grunde Wrapper um denselben Ansatz sind, den ccusage populär gemacht hat. Läuft ohne Installation über bunx ccusage oder npx ccusage@latest und analysiert den Token-Verbrauch aus lokalen CLI-Agent-Daten, darunter Claude Code, Codex, OpenCode, Amp und andere.

Du bekommst tägliche, wöchentliche, monatliche und sessionbasierte Aufschlüsselungen als Tabelle direkt im Terminal. In Kombination mit der anpassbaren Status Line in Claude Code kannst du Live-Zahlen direkt in Claude Code selbst anzeigen, indem du den statusLine-Befehl in ~/.claude/settings.json setzt.

Wenn du im Terminal lebst und Menüleisten nicht magst, ist das deine Wahl.

ToolPreisOpen SourceAm besten für
CodexBarKostenlosJaGrößte Anbieterabdeckung
SessionWatcher$2.99 einmaligNeinMinimalismus, Fokus auf Coding-Sessions
TokenBar$5 oder $15 lifetimeNeinAusgabentrends, polierte UI
UsageScope$1.99 einmalig, App StoreNeinApp-Store-Vertrieb
BurnRateKostenlosNeinBurn-Rate-Analyse, Unterstützung für eigene Tools
onWatchKostenlosJaPlattformübergreifender Daemon mit Web-Dashboard und Prognosen
Tokens 4 BreakfastKostenlos für einen Anbieter, $7.99 für alle 8NeinEinfache Installation, interessantes Design
OpenUsageKostenlosJaOpen-Source-Alternative zu CodexBar
ccusageKostenlosJaTerminal-Nutzer, statusline-Integration

Eine Anmerkung zur Tabelle: Preisseiten ändern sich. Schau vor dem Kauf auf der Projektseite selbst nach den aktuellen Zahlen.

Erste Frage: Trackst du Abos oder Pay-as-you-go-API-Nutzung? Diese beiden Fälle verlangen etwas unterschiedliche Tools.

Wenn du auf Claude Pro, Max, Cursor Pro, Copilot oder einem anderen Festpreis-Tarif lebst, sind die Limits und Reset-Fenster der Hauptschmerzpunkt. Du brauchst ein Tool, das Session- und Wochen-Quotas klar anzeigt. CodexBar, SessionWatcher und UsageScope machen das gut. Den meisten würde ich vorschlagen, mit CodexBar zu starten, weil es kostenlos, open source ist und ohne Bezahlung die meisten Anbieter abdeckt.

Wenn du hauptsächlich mit Pay-as-you-go-API-Zugang arbeitest (OpenAI API, Anthropic API, OpenRouter), zählt nicht das Session-Fenster, sondern die tatsächlichen Ausgaben. TokenBar und BurnRate sind genau darum herum gebaut. Tokens 4 Breakfast ist eine weitere Option in dieser Kategorie, wenn du Ausgabenprognosen willst. onWatch passt, wenn du mehr als nur aktuelle Zahlen willst, konkret eine Prognose, ob die Quota vor dem nächsten Reset reicht, plus Anomalie-Erkennung, falls Anbieter Limits früher zurücksetzen als erwartet.

Wenn du nur ein KI-Tool nutzt und das Claude Code ist, dann reicht ccusage im Terminal wahrscheinlich völlig. Kombiniert mit der Status Line von Claude Code bekommst du Live-Zahlen, ohne irgendetwas in die Menüleiste zu installieren.

Wenn du auf etwas anderem als macOS arbeitest, schmilzt die Auswahl schnell zusammen: Die meisten Utilities auf dieser Liste sind Mac-only. onWatch sticht hier heraus, weil es sich auf Linux, Windows und Docker installieren lässt und das Dashboard im Browser läuft.

Für Datenschutz-Bewusste ist Open Source wichtig, weil du nachprüfen kannst, was die App liest und wohin sie was schickt. Die stärksten Kandidaten hier sind CodexBar, OpenUsage und onWatch. Alle drei sind local-first by default, und onWatch wirbt explizit mit Null Telemetrie.

Drei schnelle Checks ersparen dir später viel Ärger.

Erstens, schau, welche Berechtigungen die App tatsächlich anfordert. Full Disk Access ist gerechtfertigt, um Browser-Cookies zu lesen, aber unnötig, wenn du nur CLI-Anbieter nutzt. Keychain-Zugriff ist erwartbar, wenn die App OAuth-Tokens liest. Anfragen für Screen Recording oder Accessibility hingegen sollten in dieser Kategorie eine rote Flagge sein, keiner dieser Monitore braucht sie.

Zweitens, prüf, wo API-Keys gespeichert werden, falls die App danach fragt. Die richtige Antwort ist der macOS Keychain. Keys als Klartext in Config-Dateien zu speichern ist keine gute Praxis.

Drittens, schau, wie die App mit Änderungen bei den Anbietern umgeht. Anthropic und OpenAI ändern hin und wieder interne Endpoints oder Cookie-Formate, und jedes Tool, das Dashboards statt CLI-Logs liest, geht in solchen Momenten kurz kaputt. Aktive Projekte fixen das innerhalb weniger Tage. Schau dir das Datum des letzten Commits auf GitHub an, bevor du dich bei der täglichen Arbeit auf eines davon verlässt.

Keine dieser Apps wird dich weniger Tokens verbrauchen lassen und auch nicht die Limits deines Anbieters ändern. Aber sie können den Überraschungsfaktor wegnehmen. So kannst du deinen Aufwand besser planen und sinnvoller verteilen.

Mir gefällt CodexBar: kostenlos, open source, breite Anbieterabdeckung, vernünftiges Berechtigungsmodell. Wenn du es aus dem App Store willst, UsageScope. Wenn du nur im Terminal lebst, ccusage. Wenn du außerhalb von macOS arbeitest oder ein Web-Dashboard mit Historie und Prognosen willst, onWatch. Die anderen sind gute Optionen, wenn deine konkreten Anforderungen mit dem zusammenpassen, was sie besser machen als die Standardlösungen.

Such dir deins aus. Ich bin sicher, mit einem solchen Monitor wird die Arbeit angenehmer.

Viel Erfolg!

🤓