Kostenkontrolle
Token kosten Geld. Üblich sind 1 bis 150 Euro pro Monat und Agent. Ohne Überblick laufen die Kosten aber davon. Pinchy gibt Ihnen die Mittel, um die Kontrolle zu behalten.
Die Realität
Die meisten Agenten auf Claude Sonnet oder GPT-4o kosten 1 bis 150 Euro pro Monat, je nach Nutzung. Das bleibt überschaubar, solange Sie Ihre Ausgaben kennen.
Teure Modelle ohne Grenze, ein Agent, der sich in einer komplexen Aufgabe festfährt: So entstehen Rechnungen, die jeden CFO aufschrecken. Das kommt vor. Wir haben solche Fälle gehört.
Die meisten Agenten-Frameworks erfassen weder Token noch Kosten. Was Sie ausgegeben haben, erfahren Sie erst mit der API-Rechnung. Für Teams reicht das nicht. Das Usage-Dashboard von Pinchy löst das.
Der größte Hebel
Die Modelle unterscheiden sich nicht graduell. Sie liegen um eine Größenordnung auseinander.
| Modell | Relative Kosten | Geeignet für |
|---|---|---|
| Claude Opus / GPT-4 | 10x | Komplexe Analysen, kritische Aufgaben |
| Claude Sonnet / GPT-4o | 3x | Tägliche Arbeit, gute Balance |
| Claude Haiku / GPT-4o-mini | 1x | Einfache Aufgaben, hohes Volumen |
| Ollama (lokal) | Gratis* | Air-gapped, ohne Kosten, datenschutzfreundlich |
* Lokale Modelle brauchen eigene Hardware, verursachen aber keine API-Kosten.
Weisen Sie Routineaufgaben günstige Modelle zu und reservieren Sie teure Modelle für komplexe Analysen. Ein Triage-Agent braucht kein Opus. Bei Pinchy legen Sie das Modell pro Agent fest, und das funktioniert heute schon.
Der Ansatz von Pinchy
Wir sagen ehrlich, wo wir stehen. Manche Funktionen laufen heute, andere kommen bald. Das ist der Stand.
Wählen Sie für jeden Agenten das passende Modell. Ihr Agent für die E-Mail-Triage läuft auf Haiku. Ihr Agent für Code-Reviews läuft auf Sonnet. Ihr Strategie-Agent bekommt Opus. Sie entscheiden.
Funktioniert heuteJede Aktion eines Agenten landet im Protokoll, abgesichert mit HMAC-Signatur. Sie sehen genau, was wann geschah und wie viele Tool-Aufrufe es gab. Kosten im engeren Sinn erfasst das nicht, doch es zeigt lückenlos, was Ihre Agenten tun.
Funktioniert heuteEin Dashboard zeigt Token-Verbrauch, geschätzte Kosten und Nutzungsmuster je Agent. Sie sehen, welche Agenten teuer sind und warum. So entscheiden Sie fundiert über die Modellwahl.
Funktioniert heuteLegen Sie pro Agent ein monatliches Token-Budget fest. Ist es erreicht, pausiert der Agent und benachrichtigt Sie. Keine überraschenden Rechnungen mehr. Keine entgleisten Schleifen, die Ihr API-Guthaben aufzehren.
Kommt bald (#36)Buchen Sie ein Gespräch. Wir zeigen Ihnen, wie Pinchy Ihre Ausgaben steuert, heute und mit jedem weiteren Release.
Oder schreiben Sie uns: info@heypinchy.com