Wer KI in Produktion betreibt, weiß: Der eigentliche Job beginnt nach dem Go-Live.
Modelle ändern sich. Daten driften. Use Cases entwickeln sich. Mein Retainer ist die Lösung für Unternehmen, die eine KI-Lösung haben — und sie verlässlich betreiben und weiterentwickeln wollen, ohne ein eigenes KI-Team aufzubauen.
Warum ein Retainer oft sinnvoller ist als ein internes KI-Team
Ein internes KI-Team aufzubauen, kostet ein mittelständisches Unternehmen leicht 250.000 € pro Jahr — und das Team ist trotzdem nur teilweise ausgelastet, solange Sie nicht zehn KI-Projekte parallel laufen haben. Für die meisten Unternehmen lohnt sich das in den ersten ein bis zwei Jahren schlicht nicht.
Ein Retainer mit mir kostet einen Bruchteil davon und liefert genau das, was Sie wirklich brauchen: jemanden, der die Lösung kennt, monitort, weiterentwickelt und Sparringspartner für Ihre Verantwortlichen ist. Wenn Sie einmal genug Volumen haben, dass ein eigenes Team Sinn ergibt, helfe ich beim Aufbau und Übergang.
Der Retainer ist monatlich kündbar, hat ein klares Stunden-Kontingent und eine vereinbarte Reaktionszeit. Sie haben einen direkten Slack- oder E-Mail-Kanal zu mir — keine Ticket-Queue.
Was im Retainer enthalten ist
Pakete ab 1.900 €/Monat. Größere Volumen mit höheren Stunden-Kontingenten möglich.
- 01
Monitoring & Eval-Pflege
Ich beobachte Qualität, Kosten und Latenz Ihrer KI-Lösung kontinuierlich. Wenn ein Modell-Update die Qualität verschlechtert, fangen wir es vor den Nutzern ab.
- 02
Weiterentwicklung neuer Use Cases
Wenn neue Anwendungsfälle entstehen, prüfen wir sie gemeinsam und ich baue sie iterativ aus. Der Retainer wächst mit Ihrer KI-Reife.
- 03
Cost-Control & Modellwechsel
LLM-Markt bewegt sich monatlich. Ich evaluiere kontinuierlich neue Modelle und Provider und wechsle, wenn das gleiche Ergebnis mit weniger Kosten erreichbar ist.
- 04
Team-Coaching
Ihre Mitarbeitenden sollen verstehen, was die KI tut und wo ihre Grenzen liegen. Ich begleite Onboarding, Schulung und interne Best Practices.
- 05
Direktkontakt mit klaren Reaktionszeiten
Sie haben einen Slack- oder E-Mail-Kanal direkt zu mir. Standard-Reaktionszeit: ein Werktag. Eskalationen: wenige Stunden.
- 06
Quartalsweise Strategie-Reviews
Einmal im Quartal schauen wir gemeinsam: Was läuft, was lohnt sich nicht mehr, wohin als nächstes? Schriftlicher Report mit Handlungsempfehlungen.
Was Kunden im Retainer typischerweise erleben
- ab 1.900 €
monatlich für 12–16 Stunden Kontingent, kündbar
- 1 Werktag
Reaktionszeit auf Standard-Anfragen, ein paar Stunden bei Eskalation
- ≥ 25 %
typische LLM-Kosten-Einsparung allein durch laufende Modell-Optimierung
Häufige Fragen zum Retainer
Was ist die Mindest-Vertragslaufzeit?
Drei Monate Mindestlaufzeit, danach monatlich kündbar mit einem Monat Frist. So haben Sie Zeit, den Retainer wirken zu lassen — und sind nicht länger gebunden, als Sie wollen.
Was, wenn wir das Stunden-Kontingent nicht ausnutzen?
Ungenutzte Stunden lassen sich bis zu drei Monate ansparen. Danach verfallen sie. Wenn Sie regelmäßig deutlich darunter bleiben, sprechen wir über ein kleineres Paket.
Was, wenn wir mehr brauchen?
Mehr-Stunden werden zum vereinbarten Stundensatz nachverrechnet. Wenn das wiederholt vorkommt, wechseln wir in das nächstgrößere Paket.
Funktioniert der Retainer nur für Lösungen, die Sie gebaut haben?
Nein. Ich übernehme auch bestehende KI-Lösungen anderer Dienstleister, sofern Code und Architektur sauber dokumentiert sind. Eine erste Bestandsaufnahme von 5–10 Stunden klärt die Übernahme-Aufwände.
Was ist nicht im Retainer enthalten?
Größere neue Implementierungs-Projekte über das Stunden-Kontingent hinaus. Die werden separat als Festpreis-Projekt angeboten und können dann wieder in den Retainer übergehen.
Auch interessant
Lassen Sie uns 30 Minuten reden.
Ich höre zu, stelle Fragen und sage offen, ob und wie ich helfen kann.