AI-Token-Monitore für macOS

Ein praktischer Blick auf Menüleisten-Apps, die zeigen, wie viel Quota dir noch bleibt, was sie tatsächlich von deinem Rechner lesen und welche zu wem passt.

Lass mich erklären, warum ich überhaupt angefangen habe, nach einem Token-Monitor zu suchen. Wenn ich an etwas arbeite, steige ich meistens voll ins Thema ein. In meinem Kopf bildet sich dabei ein fragiles Gedankennetz aus lauter Informationsbruchstücken: die Aufgabe selbst, Code-Fragmente, sich überschneidende Ideen aus einem Stapel offener Tabs, Dokumentation, gespeicherte Artikel, Antworten von verschiedenen LLMs und so weiter. Und dann, mitten in diesem ganzen Konstrukt, meistens im denkbar schlechtesten Moment, sagt dir dein Haupt-LLM, dass deine Quota aufgebraucht ist.

Das nervt, weil du die Arbeit genau dann anhalten oder parken musst, wenn dein Denken gerade in Fahrt gekommen ist. Klar, dein Gehirn ist immer noch da und du solltest es nutzen. Aber KI ist ein bequemes und mächtiges Werkzeug, vor allem wenn du einmal raus hast, wie du es einsetzt. Wenn es dann mittendrin plötzlich “abschaltet”, wirft es dich aus dem Rhythmus.

Um das zu vermeiden, musst du deine Quota und deinen Verbrauch im Blick behalten. Jedes LLM lässt dich das mit unterschiedlichem Komfort machen. Claude Code hat den /usage-Befehl, die Desktop-Apps haben ein Status-Icon, Cursor hat sein eigenes Dashboard und so weiter. Die Zahlen sind da. Das Problem ist ein anderes: du siehst sie nicht. Und bis zum Moment “Quota leer” vergesse ich meistens, dass ich überhaupt eine habe.

Das zweite Thema rund um Quotas ist weniger gravierend, aber genauso ärgerlich. Normalerweise zerlegst du eine große Aufgabe in mehrere kleinere. Jede für sich verbraucht nicht so viele Tokens. Aber bevor du die nächste Teilaufgabe startest, kommt die Frage auf: habe ich noch genug Tokens übrig, oder renne ich gleich wieder gegen die Wand? Um das zu beantworten, musst du es einmal mehr von Hand prüfen.

Aus diesen beiden Situationen ist der Wunsch entstanden, etwas zu finden, das die Quota-Nutzung direkt sichtbar macht. Ohne irgendwas zu öffnen, ohne Kommandos auszuführen, ohne den Fokus zu wechseln. Einfach eine Anzeige, die immer sichtbar ist. Auf macOS heißt das in der Regel die Menüleiste am oberen Bildschirmrand.

Eine kleine Menüleisten-App, die Tokens, Kosten und Reset-Timer zeigt, löst die Limits selbst nicht. Aber sie nimmt dir die Unsicherheit. Du wirfst einen Blick auf die Anzeige und siehst, wie viel dir noch bleibt. Dann entscheidest du, ob du die schwere Aufgabe jetzt gleich startest oder zwanzig Minuten wartest. Allein das ist die paar Sekunden Installation wert.

In diesem Artikel vergleiche ich die Menüleisten-Monitore, die ich auf macOS für wirklich brauchbar halte, was sie von deinem Rechner lesen und für welches Szenario sich welcher am besten eignet.

Dieser Teil ist wichtiger, als er aussieht, weil er erklärt, warum und welche Berechtigungen eine App anfragt und wie weit du den Zahlen vertrauen kannst.

Die meisten dieser Monitore sprechen nicht direkt mit den APIs der Anbieter. Sie lesen das, was deine lokalen KI-Tools ohnehin schon auf die Festplatte geschrieben haben. Claude Code schreibt zum Beispiel JSONL-Logs nach ~/.claude/projects/. Codex CLI legt ähnliche Dateien an. Die App parst diese, multipliziert mit den aktuellen Modellpreisen und zeigt das Ergebnis an. Das ist schnell und genau für den vergangenen Verbrauch. Es funktioniert offline, wenn die Preise gecached sind.

Für Dienste, die keine lokalen Logs schreiben (Claude im Browser, Cursors Web-Dashboard, Copilot-Quota), lesen die Apps entweder Browser-Cookies, um die internen Endpunkte des Anbieters anzusprechen, oder sie verwenden OAuth-Tokens aus dem macOS-Keychain. Daher kommen die Anfragen für Full Disk Access und die Keychain-Dialoge. Nichts Beunruhigendes, aber es ist hilfreich zu verstehen, warum die App das fragt.

Das dritte Muster ist die Aggregation per API-Key, die für Anbieter wie OpenRouter, DeepSeek oder Mistral genutzt wird: du fügst deinen Key einmal ein, und die App summiert den Verbrauch aus den Request-Metadaten.

Kostenlos, Open Source, von Peter Steinberger (Gründer von PSPDFKit und Entwickler von OpenClaw). Unterstützt 40+ KI-Coding-Anbieter, darunter Codex, Claude, Cursor, Gemini, Copilot und Grok, mit getrennten Session-, Wochen- und Monatsfenstern pro Anbieter. Das Menüleisten-Icon nutzt ein Zwei-Balken-Design: der obere zeigt das 5-Stunden-Session-Fenster, der untere die Wochen-Quota. Das Ergebnis ist optisch aufgeräumt und auf einen Blick lesbar.

CodexBar stochert nicht im Dateisystem herum und fragt keine Berechtigungen für Screen Recording, Accessibility oder Automation an, kann aber Full Disk Access verlangen, wenn du Safari-Cookies für Web-Anbieter nutzt. Die App ist signiert und notarisiert und lässt sich per Homebrew installieren. Damit würde ich den meisten Entwicklern den Einstieg empfehlen.

Es ist heute mein Favorit aus mehreren Gründen. Mir gefällt die Oberfläche, die ziemlich durchdacht ist. Viele Einstellungen, zum Beispiel, ob angezeigt wird, wie viel dir noch bleibt oder wie viel du schon verbraucht hast. Je nachdem, was für dich wichtiger ist. So kannst du sie nach deinem Geschmack und Workflow konfigurieren. Das Projekt wird aktiv weiterentwickelt, und Peter reagiert auf GitHub-Issues häufig und sehr schnell.

Ein paar Dinge, auf die ich gestoßen bin: manchmal zeigt der Monitor, dass er rate limited wurde (Infos zu oft abgerufen), und manchmal hängt er ein bisschen, wenn Codex angeschlossen ist. Ich habe Codex in der Anbieterliste deaktiviert, und alles läuft sauber.

Eine bezahlte Alternative für einmalig 2,99 $. Trackt Claude, Codex, Copilot, Cursor und Gemini mit Nutzung, Kosten und Limits live in der macOS-Menüleiste. Das zentrale Argument ist Einfachheit: installieren und fertig, die App erkennt deine Tools automatisch, ohne API-Keys für lokale CLI-Anbieter.

In Sachen Abdeckung ist SessionWatcher schmaler als CodexBar, aber sehr fokussiert. Wenn du eine native, minimalistische App willst und bereit bist, drei Euro zu zahlen, um dir den Konfigurationstanz zu sparen, ist das ein vernünftiger Deal.

EINE FRUSTRIERENDE ERFAHRUNG BEIM KÜNDIGEN DES ABOS

Ich habe TokenBar bei der Recherche für diesen Beitrag ausprobiert und hatte einige Mühe mit dem Kündigungsablauf. Hinter der App steht das Unternehmen Aura Technologies. Hier die Details zu dem, worauf ich gestoßen bin.

Wie es funktioniert. Man bekommt eine kostenlose Testphase angeboten (auf ihrer Zahlungsseite sind die Angaben zur Dauer widersprüchlich; bei mir waren es 3 Tage), abgewickelt über Stripe. Nach der Bestätigung erhält man einen temporären Schlüssel, der in der App angezeigt wird, statt ihn per E-Mail zugeschickt zu bekommen.

Um das Abo zu kündigen, muss man die Kündigungsoption in der App finden. Sie heißt “Manage” im Bereich Billing und steht in kleiner Schrift. In meinem Fall hat der Klick darauf nicht funktioniert, sodass ich von meiner Seite aus nicht kündigen konnte.

Was ich sonst noch versucht habe:

  • Über Stripe. Offizielle Antwort: Nur der Händler kann das Abo kündigen.
  • Über die Bank. Sie schlug vor, die Karte zu sperren und eine Rückbuchung zu veranlassen.
  • Über E-Mail. Ich habe den Support kontaktiert und wir haben uns zu dem Problem ausgetauscht.

Falls du jemals in einer ähnlichen Situation bist: Karte sperren und bei der Bank eine Rückbuchung (Chargeback) veranlassen. Ich habe das Unternehmen direkt erreicht und die Sache wurde geklärt. Das Abo wurde gekündigt und die Belastung erstattet (laut ihrer E-Mail).

UsageScope ist im Mac App Store für einmalig 1,99 $ erhältlich, setzt macOS 13.5+ voraus und ist standardmäßig local-first. Unterstützt Claude, ChatGPT und Gemini mit 5-Stunden- und Wochen-Limits, synchronisiert Tokens automatisch aus den CLIs von Claude Code, Codex und Gemini und speichert Tokens im macOS-Keychain. Die Distribution über den App Store ist ein Pluspunkt für alle, die diesen Kanal gegenüber Direkt-Downloads bevorzugen.

Ein solider Mittelweg: offizielle Distribution, schmalere Anbieterliste als CodexBar, keine Konfigurations-Akrobatik.

Trackt Claude Code, Codex und Kimi Coding aus der Menüleiste heraus, mit einem Token-Verbrauchsdiagramm über 7 Tage, Schwellenwert-Alerts und einem transparenten lokalen Proxy, der die Nutzung beliebiger Clients abgreift. Der lokale Proxy ist interessant, wenn du eigene Skripte oder Tools nutzt, die keine Standard-Logs schreiben. Die meisten Monitore sehen davon nichts, BurnRate schon.

Das ist das richtige Tool, wenn du Musteranalyse über die Zeit willst und nicht nur die aktuellen Zahlen.

Kostenlos, Open Source (GPL-3.0), vom onllm.dev-Team. Architektonisch unterscheidet sich onWatch vom Rest der Liste: es ist ein Hintergrund-Daemon in Go, der die Anbieter alle 60 Sekunden abfragt und Snapshots in einer lokalen SQLite speichert. Das Dashboard öffnet sich unter localhost:9211 im Browser, und der Menüleisten-Begleiter für macOS ist noch in der Beta. Plattformübergreifend, läuft auf macOS, Linux, Windows und in Docker.

Unterstützt acht Anbieter: Anthropic, Codex, GitHub Copilot, Synthetic, Z.ai, MiniMax, Gemini CLI und Antigravity. Schöne Details: historisches Tracking von Nutzungsmustern, Anomalie-Erkennung (zum Beispiel, wenn ein Anbieter Limits vorzeitig zurücksetzt), Prognose, wann die Quota vor dem nächsten Reset aufgebraucht ist, und ein anbieterübergreifender Vergleich der verfügbaren Kapazität. Optional verschickt es E-Mail- oder Push-Benachrichtigungen, wenn ein Schwellenwert erreicht ist. Der angegebene Speicherverbrauch liegt unter 60 MB. Keine Telemetrie, alles lokal.

Einen genaueren Blick wert, wenn du nicht ausschließlich auf macOS unterwegs bist, oder wenn du ein richtiges Web-Dashboard mit Historie willst statt eines einzelnen Menüleisten-Icons. Auch eine gute Option, wenn dich vor allem die Prognose “reicht meine Quota noch bis zum Tagesende?” interessiert und nicht nur der aktuelle Zahlenstand.

Ein Menüleisten-Tool mit interessantem Design und einfacher Einrichtung. Die kostenlose Version von Tokens4Breakfast lässt dich einen Anbieter verbinden, was reicht, wenn du beispielsweise nur Claude Code oder nur ChatGPT nutzt. Eine Einmalzahlung von 7,99 $ schaltet alle 8 Anbieter frei: Claude Code, Claude Web, OpenAI, Cursor, Copilot, OpenRouter, DeepSeek und Mistral.

Eine vernünftige Wahl, wenn dir die kostenlosen Monitore überladen vorkommen und du einfach nur eine kompakte Anzeige mit klarer Optik willst. Du kannst auch später bezahlen, sobald du einen zweiten Anbieter anbindest.

Kostenlos, Open Source (MIT), Plugin-basiert. OpenUsage baut auf Tauri, React und TypeScript auf, setzt macOS 14+ voraus und läuft auf Apple Silicon und Intel. Zum Zeitpunkt des Schreibens unterstützt es 15 Anbieter: Amp, Antigravity, Claude, Codex, Copilot, Cursor, Factory/Droid, Gemini, JetBrains AI Assistant, Kiro, Kimi Code, MiniMax, OpenCode Go, Windsurf und Z.ai. Jeder Anbieter ist als eigenes Plugin implementiert, neue lassen sich also hinzufügen, ohne die gesamte App zu aktualisieren. Klar von CodexBar inspiriert (der Autor erwähnt das direkt), aber mit anderem architektonischem Ansatz.

Was OpenUsage vom Rest abhebt: eine lokale HTTP-API unter 127.0.0.1:6736. Damit kann jedes andere Programm, jedes Skript oder jede Status Line den aktuellen Quota-Stand per curl localhost:6736/v1/usage abrufen (oder pro Anbieter, zum Beispiel /v1/usage/claude).

Du musst dich nicht direkt mit den Anbieter-APIs verbinden, du musst dich nicht mit Authentifizierung herumschlagen, OpenUsage sammelt schon alles ein und liefert es in einem einheitlichen JSON-Format. Praktisch, wenn du die Nutzung in die Status Line deines Editors, in dein eigenes Dashboard oder in Automations-Skripte einbetten willst. Außerdem gibt es einen globalen Tastatur-Shortcut, um das Panel zu öffnen, und Support für SOCKS5/HTTP-Proxies.

Das GitHub-Projekt ist sehr aktiv: 2,2k Stars, 29 Contributors zum Zeitpunkt des Schreibens, regelmäßige Releases. Eine Sache solltest du im Kopf behalten: im README sagt der Autor offen, dass der Code zu 100 % von KI-Tools geschrieben wurde (Cursor, Claude Code, Codex CLI), keine einzige Zeile von Hand. Für die einen ist das ein Beleg, dass KI-Entwicklung funktioniert, für die anderen ein Warnsignal in Sachen Code-Qualität. Wirf einen Blick in die Issues und ins Changelog, bevor du dich bei kritischer Arbeit darauf verlässt.

Keine Menüleisten-App, sondern ein recht bekanntes CLI-Tool, und der Erwähnung wert, weil viele der oben genannten GUI-Monitore im Grunde Wrapper um denselben Ansatz sind, den ccusage verwendet. Läuft ohne Installation per bunx ccusage oder npx ccusage@latest und analysiert die Token-Nutzung von CLI-Agents aus lokalen Daten, darunter Claude Code, Codex, OpenCode, Amp und andere.

Du bekommst Tages-, Wochen-, Monats- und Session-Aufschlüsselungen in einer Tabelle direkt im Terminal. Kombiniert mit einer anpassbaren Status Line in Claude Code kannst du Live-Zahlen direkt in Claude Code selbst anzeigen, indem du das statusLine-Kommando in ~/.claude/settings.json setzt.

Wenn du im Terminal lebst und die Menüleiste nicht so dein Ding ist, ist das deine Option.

ToolPreisOpen SourceAm besten für
CodexBarKostenlosJaGrößte Anbieter-Abdeckung
SessionWatcher2,99 $ einmaligNeinMinimalismus, Fokus auf Coding-Sessions
TokenBarNICHT VERWENDEN!NeinDubiose Abo-Falle
UsageScope1,99 $ einmalig, App StoreNeinDistribution über den App Store
BurnRateKostenlosNeinBurn-Rate-Analyse, Support für eigene Tools
onWatchKostenlosJaPlattformübergreifender Daemon mit Web-Dashboard und Prognosen
Tokens 4 BreakfastKostenlos für einen Anbieter, 7,99 $ für alle 8NeinEinfache Einrichtung, interessantes Design
OpenUsageKostenlosJaLokale HTTP-API für Status Line und Skript-Integrationen
ccusageKostenlosJaTerminal-User, Status-Line-Integration

Hinweis zur Tabelle: Preisseiten ändern sich. Schau die aktuellen Zahlen vor dem Kauf auf der Projektseite selbst nach.

Erste Frage: trackst du Abos oder API-Nutzung? Diese beiden Fälle brauchen leicht unterschiedliche Tools.

Wenn du mit Claude Pro, Max, Cursor Pro, Copilot oder einem anderen Festpreisplan unterwegs bist, sind die zentralen Schmerzpunkte Limits und Reset-Fenster. Du brauchst ein Tool, das Session- und Wochen-Quotas klar darstellt. CodexBar, SessionWatcher und UsageScope leisten das gut. Den meisten Leuten würde ich empfehlen, mit CodexBar anzufangen, weil es kostenlos, Open Source ist und die meisten Anbieter ohne Bezahlung abdeckt.

Wenn du hauptsächlich Pay-as-you-go-API-Zugriff nutzt (OpenAI API, Anthropic API, OpenRouter), zählt der Verbrauch in Geld und nicht das Session-Fenster. BurnRate ist genau darauf zugeschnitten. Tokens 4 Breakfast ist eine weitere Option in dieser Kategorie, wenn du eine Ausgabenprognose haben willst. onWatch passt, wenn du nicht nur aktuelle Zahlen willst, sondern eine Prognose des Quota-Verbrauchs vor dem nächsten Reset und Anomalie-Erkennung für den Fall, dass ein Anbieter Limits vorzeitig zurücksetzt.

Wenn du nur ein KI-Tool benutzt und das Claude Code ist, dann reicht ccusage im Terminal wahrscheinlich aus. In Kombination mit der Claude-Code-Status-Line bekommst du Live-Zahlen, ohne irgendetwas in die Menüleiste zu installieren.

Wenn du nicht ausschließlich auf macOS unterwegs bist, wird die Auswahl schnell kleiner: die meisten Tools in dieser Liste sind Mac-only. onWatch sticht hier heraus, weil es auf Linux, Windows und in Docker läuft und das Dashboard im Browser öffnet.

Wer auf Privatsphäre Wert legt, für den ist Open Source wichtig, weil du nachschauen kannst, was die App liest und wohin sie Dinge schickt. Die stärksten Kandidaten dafür sind CodexBar, OpenUsage und onWatch. Alle drei sind standardmäßig local-first, und onWatch betont explizit die Null-Telemetrie.

Drei schnelle Checks ersparen dir später viel Ärger.

Erstens: schau dir an, welche Berechtigungen die App tatsächlich anfragt. Full Disk Access ist gerechtfertigt, um Browser-Cookies zu lesen, aber nicht notwendig, wenn du nur CLI-Anbieter nutzt. Keychain-Zugriff ist zu erwarten, wenn die App OAuth-Tokens liest. Anfragen für Screen Recording oder Accessibility sollten in dieser Kategorie aber eine rote Flagge sein: keiner der hier vorgestellten Monitore braucht das.

Zweitens: prüf, wo API-Keys gespeichert werden, falls die App welche verlangt. Die richtige Antwort ist der macOS-Keychain. Keys im Klartext in Config-Dateien zu speichern, ist keine Best Practice.

Drittens: schau, wie die App mit Änderungen auf Anbieterseite umgeht. Anthropic und OpenAI ändern gelegentlich interne Endpunkte oder Cookie-Formate, und jedes Tool, das Dashboards statt CLI-Logs liest, wird an diesem Punkt vorübergehend kaputtgehen. Aktive Projekte beheben das innerhalb weniger Tage. Wirf einen Blick auf das Datum des letzten Commits auf GitHub, bevor du dich für die tägliche Arbeit auf eines davon verlässt.

Keine dieser Apps wird dich dazu bringen, weniger Tokens zu verbrauchen, und sie verändern die Anbieter-Limits nicht. Aber sie können den Überraschungsfaktor wegnehmen. Damit kannst du deinen Aufwand effektiver planen und ihn richtig verteilen.

Mir gefällt CodexBar: kostenlos, Open Source, breite Anbieter-Abdeckung, vernünftiges Berechtigungsmodell. Wenn du es über den App Store willst, dann UsageScope. Bist du reiner Terminal-Nutzer, dann ccusage. Wenn du über macOS hinaus arbeitest oder ein Web-Dashboard mit Historie und Prognosen brauchst, onWatch. Der Rest ist eine gute Wahl, wenn deine konkreten Anforderungen sich mit dem decken, was die Tools besser machen als die Standardlösungen.

Such dir deine eigene aus. Ich bin überzeugt, dass so ein Monitor an seinem Platz die Arbeit deutlich runder laufen lässt.

Viel Erfolg!

🤓