Ausgangslage
Der Mandant ist ein technischer Großhändler für Industrieelektronik mit Sitz in Süddeutschland. Das Sortiment umfasst rund 180.000 Artikel von 320 Herstellern: Sensoren, Steuerungen, Antriebstechnik, Verkabelung, Schaltschrankkomponenten. Kunden sind Maschinenbauer, Anlagenbauer und Industrieunternehmen aus DACH und Polen. Das Angebotsvolumen liegt bei rund 14.500 Angeboten pro Jahr, mit einem starken Long Tail kleinerer Anfragen und einer Konzentration der Marge auf etwa 350 A-Kunden.
Anfang 2025 hatte der Vertriebsinnendienst (12 FTE) eine ständig überlastete Pipeline. Eine typische komplexe Anfrage durchlief sieben Hände: Posteingang, Erst-Sichtung, Plausibilitätsprüfung, Verfügbarkeits-Check im ERP, Konditions-Klärung mit dem Key-Account-Manager, Angebot-Erstellung im Word-Template, abschließende Freigabe. Bei Anfragen mit über 50 Positionen oder mit Sondergrößen lag die Durchlaufzeit zwischen 3 und 7 Werktagen.
Das hatte zwei messbare Konsequenzen: Erstens lag die Hit-Rate auf abgegebene Angebote bei nur 31 %, weil Wettbewerber bei kurzen Liefer-Anfragen schneller waren. Zweitens — und schwerer wiegend — wurden geschätzt 18 % aller eingehenden Anfragen gar nicht erst bearbeitet, weil der Innendienst sie als „nicht lohnend“ eingestuft hatte (zu klein, zu komplex, zu unsicher). Damit ging Geschäft verloren, das im Standardprozess nicht messbar war.
Ziele & Erfolgsmetriken
Vier KPIs wurden im Kick-off als Pilot-Akzeptanzkriterien definiert:
- Reduktion der durchschnittlichen Angebotszeit für Anfragen mit ≤200 Positionen auf ≤2 Stunden (vorher 3–7 Werktage).
- Steigerung der Hit-Rate auf ≥40 % auf den Pilot-Produktkategorien.
- Bearbeitungsquote aller eingehenden Anfragen ≥95 % (vorher 82 %).
- Akzeptanzquote im Vertriebsinnendienst ≥70 % nach 90 Tagen Live-Betrieb.
Die Lösung im Überblick
Wir haben einen agentischen Workflow gebaut, der eine eingehende Anfrage komplett automatisiert verarbeitet — bis zum freigabereifen Angebots-PDF. Der Agent ist kein „freier Konversations-Bot“, sondern ein klar definierter Workflow mit fünf Werkzeugen, die er in fester Reihenfolge nutzt. Diese Disziplin ist wichtig, weil agentische Systeme in zu offenen Kontexten unzuverlässig werden.
Architektur-Pattern: orchestrierter Agent mit deterministischem Skelett. Die LLM-Aufrufe übernehmen ausschließlich Aufgaben, in denen Sprachverständnis nötig ist (Anfrage-Parsing, Klärfragen-Formulierung, Angebotstext). Alle preisrelevanten Entscheidungen (Verfügbarkeit, Konditionen, Margen) kommen aus deterministischen System-Aufrufen — das LLM darf hier nichts „erfinden“.
Agent-Workflow Schritt für Schritt
Was passiert, wenn eine Anfrage eingeht?
- 1Sek. 1–15
Anfrage-Parsing
E-Mail + Anhänge werden eingelesen, Positionen extrahiert (LLM mit strukturierter Ausgabe), Anfrage gegen Kundenstamm im CRM gematcht.
- →Strukturierte Anfrageliste
- →Kunden-Match
- →Vollständigkeits-Score
- 2Sek. 15–90
ERP & PIM-Lookup
Verfügbarkeitsprüfung pro Position, Datenblatt-Abgleich, Cross-Selling-Vorschlag (alternative Hersteller mit besserer Marge).
- →Verfügbarkeits-Liste
- →Lieferzeit pro Position
- →Margen-Indikation
- 3Sek. 90–150
Konditions-Berechnung
Rahmenvertrag des Kunden wird gezogen, Mengenrabatte, Sonder-Konditionen, Mindestmargen-Regeln. Konditions-Logik ist deterministisch (Python-Regeln), nicht LLM.
- →Position-Preise
- →Gesamtsumme
- →Margen-Check
- 4Sek. 150–230
Angebot generieren
Angebots-PDF wird erstellt (LLM für Anschreiben + Erläuterung, deterministisches Template für Positionen), Quellenangabe pro Konditions-Entscheidung.
- →Angebots-PDF
- →Begründungs-Log
- →Risiko-Hinweise
Nach diesen vier Schritten landet das Angebot im Freigabe-Postfach des zuständigen Vertriebsmitarbeiters. Bei Standard-Anfragen erfolgt die Freigabe meist innerhalb von Minuten — der Mitarbeiter prüft, ob das Angebot stimmt, klickt freigeben, und das System sendet es als PDF an den Kunden. Bei komplexeren Anfragen formuliert der Agent Klärfragen, die an den Innendienst gehen.
Wichtig: Der Agent verschickt nichts ohne menschliche Freigabe. Diese Architekturentscheidung war im Vertriebsinnendienst der zentrale Akzeptanztreiber.
Vorgehen & Zeitplan
- 1Woche 1–2
Discovery
Workflow-Zerlegung mit Innendienstleitung und 3 Pilot-Mitarbeitern, ERP-/CRM-API-Audit, Datenschutz-Klärung.
- →Detaillierter Workflow
- →Tool-Definition
- →DSFA
- 2Woche 3–6
MVP
Agent baut Angebote für eine Produktkategorie (Sensorik) auf 200 historischen Anfragen.
- →Agent v1
- →Eval-Set 200 Cases
- →Vertriebs-UI
- 3Woche 7–10
Pilot-Live
Live-Betrieb mit 3 Innendienstmitarbeitern als Freigeber, 4 Wochen kontrollierter Echtbetrieb.
- →Akzeptanzprotokoll
- →ROI-Indikation
- →Roll-out-Empfehlung
- 4Woche 11–24
Roll-out
Skalierung auf alle Produktkategorien, alle 12 Innendienstmitarbeiter, vollständige Integration.
- →Vollständige Implementation
- →Schulung
- →Hyper-Care
Ergebnisse nach 12 Monaten Live-Betrieb
Gemessen nach 12 Monaten Live-Betrieb (Mai 2025 – Mai 2026)
Im Detail: Die durchschnittliche Angebotszeit ist von 2,8 Werktagen (Median: 1,5 Werktage) auf 4 Minuten Ø gefallen. Das gilt für rund 78 % aller eingehenden Anfragen, die der Agent vollständig durchläuft. Die restlichen 22 % brauchen Klärung durch den Innendienst und liegen dann bei einer Bearbeitungszeit von durchschnittlich 4 Stunden — immer noch deutlich besser als vorher.
Die Hit-Rate ist von 31 % auf 49 % gestiegen — eine Steigerung um 18 Prozentpunkte. Diese Steigerung kommt aus drei klar voneinander trennbaren Effekten: schnellere Antwortzeit (vor allem bei A-Kunden mit zeitkritischen Projekten), bessere Konditions-Konsistenz (Rahmenvertrag-Rabatte werden nicht mehr „vergessen“) und Cross-Selling-Vorschläge des Agents (alternative Hersteller mit besserer Verfügbarkeit oder Marge). Die Bearbeitungsquote aller Anfragen ist von 82 % auf 99 % gestiegen — fast nichts wird mehr vorab abgelehnt.
„Vorher haben wir Anfragen gefiltert, weil unser Vertriebsinnendienst nicht hinterherkam. Heute beantworten wir alle — und nehmen mehr mit. Das ist ein Geschäftsmodell-Effekt, nicht nur ein Effizienzgewinn.“
— Vertriebsleiter, Mai 2026
Wirtschaftlichkeit
Investition (alle Beträge netto):
- Pilot 32.500 € (10 Wochen, mehrere Quellsysteme)
- Implementation 142.000 € (14 Wochen Roll-out)
- Managed Service 6.500 €/Monat
- LLM-Lizenzen ca. 2.200 €/Monat (Claude + GPT + Mistral, Mischbetrieb)
- Hosting (IONOS Karlsruhe) 850 €/Monat
- Interne Aufwände (Innendienstleitung 25 % Zeit, 3 Pilot-MA je 15 %, IT-Owner 25 %) ca. 95.000 €
Total Cost of Ownership Jahr 1: rund 360.000 €. Realisierter Effekt Jahr 1: 4,8 M € zusätzlicher Deckungsbeitrag (aus Hit-Rate-Steigerung + neu bearbeitete Anfragen). Reine Effizienz-Einsparung im Innendienst zusätzlich ca. 320.000 € (nicht für Personalabbau genutzt, sondern für Aufstockung des Außendienstes umgewidmet). ROI Jahr 1: über 1.300 % auf den Cash-Effekt.
Diese Zahlen klingen hoch — sie sind aber konsistent mit Bench-Daten aus vergleichbaren agentischen Vertriebs-Implementierungen, weil der Hebel in B2B-Vertrieb sehr groß ist: Schon 5 % mehr Hit-Rate auf 95 M € Umsatzbasis sind 4,75 M € zusätzlicher Umsatz, davon ein wesentlicher Teil Deckungsbeitrag.
Stolpersteine
- ERP-API hatte 14 versteckte Sonderfälle. proAlpha bot eine saubere REST-API für Standardprodukte. Bei Sondergrößen, kundenspezifischen Varianten und Set-Artikeln gab es Sonderlogik, die nur Teile davon dokumentierte. Wir haben gemeinsam mit dem ERP-Owner 14 Sonderfälle identifiziert und in den Agent eingebaut. Das hat den Pilot um 2 Wochen verlängert.
- Margenregeln waren historisch gewachsen. Der Mandant hatte über 18 Jahre 60+ Margenregeln aufgebaut, von denen rund 12 in den letzten 3 Jahren nicht mehr aktiv waren. Wir haben gemeinsam mit dem Vertriebsleiter aufgeräumt, was nebenbei einen Konsolidierungseffekt hatte (klarere Konditions-Logik im gesamten Hause).
- Akzeptanz im Innendienst kippte erst mit dem ersten Großauftrag. 6 Wochen nach Live war die Stimmung im Innendienst gemischt — viele wollten doch lieber wieder Word-Templates. Die Wende kam, als ein Innendienstler einen 350.000-€-Auftrag eines A-Kunden gewann, weil der Agent das Angebot in 3 Stunden lieferte (Wettbewerber brauchte 5 Tage). Danach kippte die Stimmung schlagartig.
Lessons Learned
- Agenten-Erfolg = Tool-Disziplin. Je klarer die fünf Werkzeuge des Agents definiert sind, desto zuverlässiger arbeitet er. Offene Agenten-Konstruktionen mit „freier Entscheidung“ funktionieren in Demos, scheitern in Produktion.
- Halluzination ist konstruktiv lösbar. Wer das LLM nur dort einsetzt, wo Sprachverstehen nötig ist (parsen, formulieren), und alle preisrelevanten Pfade deterministisch hält, vermeidet 95 % der Halluzinationsrisiken.
- Mensch im Loop ist Akzeptanz-Anker. Niemand wollte einen Agent, der eigenständig Angebote verschickt. Mit Mensch-Freigabe wurde das System schnell als Werkzeug akzeptiert, nicht als Bedrohung.
- Margenregeln aufräumen ist Pflichtaufwand. Wer historische Konditions-Logik 1:1 in einen Agent übersetzt, transportiert Altlasten in die KI. Das Aufräumen ist ein Geschenk an die Organisation insgesamt.
- Roll-out-Geschwindigkeit unterschätzt man. Vom Pilot-Live zum Vollausbau dauerte es 14 Wochen — länger als geplant, weil jede neue Produktkategorie eigene Sonderlogik mitbrachte.
Wenn Sie einen vergleichbaren Use Case haben — komplexer B2B-Vertrieb, viele Quellsysteme, hoher Innendienst-Aufwand — sprechen Sie uns an. Im kostenfreien Erstgespräch teilen wir unsere Erfahrungen aus diesem und anderen Mandaten und beurteilen offen, ob ein Pilot Sinn macht. Mehr Methodik finden Sie in unserem Use-Case-Leitfaden zu KI-Angebotserstellung.
