Case Study Großhandel | KI-Agent für Angebote (240 MA)

Ausgangslage

Der Mandant ist ein technischer Großhändler für Industrieelektronik mit Sitz in Süddeutschland. Das Sortiment umfasst rund 180.000 Artikel von 320 Herstellern: Sensoren, Steuerungen, Antriebstechnik, Verkabelung, Schaltschrankkomponenten. Kunden sind Maschinenbauer, Anlagenbauer und Industrieunternehmen aus DACH und Polen. Das Angebotsvolumen liegt bei rund 14.500 Angeboten pro Jahr, mit einem starken Long Tail kleinerer Anfragen und einer Konzentration der Marge auf etwa 350 A-Kunden.

Anfang 2025 hatte der Vertriebsinnendienst (12 FTE) eine ständig überlastete Pipeline. Eine typische komplexe Anfrage durchlief sieben Hände: Posteingang, Erst-Sichtung, Plausibilitätsprüfung, Verfügbarkeits-Check im ERP, Konditions-Klärung mit dem Key-Account-Manager, Angebot-Erstellung im Word-Template, abschließende Freigabe. Bei Anfragen mit über 50 Positionen oder mit Sondergrößen lag die Durchlaufzeit zwischen 3 und 7 Werktagen.

Das hatte zwei messbare Konsequenzen: Erstens lag die Hit-Rate auf abgegebene Angebote bei nur 31 %, weil Wettbewerber bei kurzen Liefer-Anfragen schneller waren. Zweitens — und schwerer wiegend — wurden geschätzt 18 % aller eingehenden Anfragen gar nicht erst bearbeitet, weil der Innendienst sie als „nicht lohnend“ eingestuft hatte (zu klein, zu komplex, zu unsicher). Damit ging Geschäft verloren, das im Standardprozess nicht messbar war.

Ziele & Erfolgsmetriken

Vier KPIs wurden im Kick-off als Pilot-Akzeptanzkriterien definiert:

Reduktion der durchschnittlichen Angebotszeit für Anfragen mit ≤200 Positionen auf ≤2 Stunden (vorher 3–7 Werktage).
Steigerung der Hit-Rate auf ≥40 % auf den Pilot-Produktkategorien.
Bearbeitungsquote aller eingehenden Anfragen ≥95 % (vorher 82 %).
Akzeptanzquote im Vertriebsinnendienst ≥70 % nach 90 Tagen Live-Betrieb.

Die Lösung im Überblick

Wir haben einen agentischen Workflow gebaut, der eine eingehende Anfrage komplett automatisiert verarbeitet — bis zum freigabereifen Angebots-PDF. Der Agent ist kein „freier Konversations-Bot“, sondern ein klar definierter Workflow mit fünf Werkzeugen, die er in fester Reihenfolge nutzt. Diese Disziplin ist wichtig, weil agentische Systeme in zu offenen Kontexten unzuverlässig werden.

Architektur-Pattern: orchestrierter Agent mit deterministischem Skelett. Die LLM-Aufrufe übernehmen ausschließlich Aufgaben, in denen Sprachverständnis nötig ist (Anfrage-Parsing, Klärfragen-Formulierung, Angebotstext). Alle preisrelevanten Entscheidungen (Verfügbarkeit, Konditionen, Margen) kommen aus deterministischen System-Aufrufen — das LLM darf hier nichts „erfinden“.

Agent-Workflow Schritt für Schritt

Was passiert, wenn eine Anfrage eingeht?

1Sek. 1–15
Anfrage-Parsing
E-Mail + Anhänge werden eingelesen, Positionen extrahiert (LLM mit strukturierter Ausgabe), Anfrage gegen Kundenstamm im CRM gematcht.
- →Strukturierte Anfrageliste
- →Kunden-Match
- →Vollständigkeits-Score
2Sek. 15–90
ERP & PIM-Lookup
Verfügbarkeitsprüfung pro Position, Datenblatt-Abgleich, Cross-Selling-Vorschlag (alternative Hersteller mit besserer Marge).
- →Verfügbarkeits-Liste
- →Lieferzeit pro Position
- →Margen-Indikation
3Sek. 90–150
Konditions-Berechnung
Rahmenvertrag des Kunden wird gezogen, Mengenrabatte, Sonder-Konditionen, Mindestmargen-Regeln. Konditions-Logik ist deterministisch (Python-Regeln), nicht LLM.
- →Position-Preise
- →Gesamtsumme
- →Margen-Check
4Sek. 150–230
Angebot generieren
Angebots-PDF wird erstellt (LLM für Anschreiben + Erläuterung, deterministisches Template für Positionen), Quellenangabe pro Konditions-Entscheidung.
- →Angebots-PDF
- →Begründungs-Log
- →Risiko-Hinweise

Nach diesen vier Schritten landet das Angebot im Freigabe-Postfach des zuständigen Vertriebsmitarbeiters. Bei Standard-Anfragen erfolgt die Freigabe meist innerhalb von Minuten — der Mitarbeiter prüft, ob das Angebot stimmt, klickt freigeben, und das System sendet es als PDF an den Kunden. Bei komplexeren Anfragen formuliert der Agent Klärfragen, die an den Innendienst gehen.

Wichtig: Der Agent verschickt nichts ohne menschliche Freigabe. Diese Architekturentscheidung war im Vertriebsinnendienst der zentrale Akzeptanztreiber.

Vorgehen & Zeitplan

1Woche 1–2
Discovery
Workflow-Zerlegung mit Innendienstleitung und 3 Pilot-Mitarbeitern, ERP-/CRM-API-Audit, Datenschutz-Klärung.
- →Detaillierter Workflow
- →Tool-Definition
- →DSFA
2Woche 3–6
MVP
Agent baut Angebote für eine Produktkategorie (Sensorik) auf 200 historischen Anfragen.
- →Agent v1
- →Eval-Set 200 Cases
- →Vertriebs-UI
3Woche 7–10
Pilot-Live
Live-Betrieb mit 3 Innendienstmitarbeitern als Freigeber, 4 Wochen kontrollierter Echtbetrieb.
- →Akzeptanzprotokoll
- →ROI-Indikation
- →Roll-out-Empfehlung
4Woche 11–24
Roll-out
Skalierung auf alle Produktkategorien, alle 12 Innendienstmitarbeiter, vollständige Integration.
- →Vollständige Implementation
- →Schulung
- →Hyper-Care

Ergebnisse nach 12 Monaten Live-Betrieb

Gemessen nach 12 Monaten Live-Betrieb (Mai 2025 – Mai 2026)

Min Ø Angebotszeit (vorher 3 Tage)

18 %

höhere Hit-Rate

35 %

mehr bearbeitete Anfragen

4,8 M €

zusätzlicher DB Jahr 1

Im Detail: Die durchschnittliche Angebotszeit ist von 2,8 Werktagen (Median: 1,5 Werktage) auf 4 Minuten Ø gefallen. Das gilt für rund 78 % aller eingehenden Anfragen, die der Agent vollständig durchläuft. Die restlichen 22 % brauchen Klärung durch den Innendienst und liegen dann bei einer Bearbeitungszeit von durchschnittlich 4 Stunden — immer noch deutlich besser als vorher.

Die Hit-Rate ist von 31 % auf 49 % gestiegen — eine Steigerung um 18 Prozentpunkte. Diese Steigerung kommt aus drei klar voneinander trennbaren Effekten: schnellere Antwortzeit (vor allem bei A-Kunden mit zeitkritischen Projekten), bessere Konditions-Konsistenz (Rahmenvertrag-Rabatte werden nicht mehr „vergessen“) und Cross-Selling-Vorschläge des Agents (alternative Hersteller mit besserer Verfügbarkeit oder Marge). Die Bearbeitungsquote aller Anfragen ist von 82 % auf 99 % gestiegen — fast nichts wird mehr vorab abgelehnt.

„Vorher haben wir Anfragen gefiltert, weil unser Vertriebsinnendienst nicht hinterherkam. Heute beantworten wir alle — und nehmen mehr mit. Das ist ein Geschäftsmodell-Effekt, nicht nur ein Effizienzgewinn.“
— Vertriebsleiter, Mai 2026

Wirtschaftlichkeit

Investition (alle Beträge netto):

Pilot 32.500 € (10 Wochen, mehrere Quellsysteme)
Implementation 142.000 € (14 Wochen Roll-out)
Managed Service 6.500 €/Monat
LLM-Lizenzen ca. 2.200 €/Monat (Claude + GPT + Mistral, Mischbetrieb)
Hosting (IONOS Karlsruhe) 850 €/Monat
Interne Aufwände (Innendienstleitung 25 % Zeit, 3 Pilot-MA je 15 %, IT-Owner 25 %) ca. 95.000 €

Total Cost of Ownership Jahr 1: rund 360.000 €. Realisierter Effekt Jahr 1: 4,8 M € zusätzlicher Deckungsbeitrag (aus Hit-Rate-Steigerung + neu bearbeitete Anfragen). Reine Effizienz-Einsparung im Innendienst zusätzlich ca. 320.000 € (nicht für Personalabbau genutzt, sondern für Aufstockung des Außendienstes umgewidmet). ROI Jahr 1: über 1.300 % auf den Cash-Effekt.

Diese Zahlen klingen hoch — sie sind aber konsistent mit Bench-Daten aus vergleichbaren agentischen Vertriebs-Implementierungen, weil der Hebel in B2B-Vertrieb sehr groß ist: Schon 5 % mehr Hit-Rate auf 95 M € Umsatzbasis sind 4,75 M € zusätzlicher Umsatz, davon ein wesentlicher Teil Deckungsbeitrag.

Stolpersteine

ERP-API hatte 14 versteckte Sonderfälle. proAlpha bot eine saubere REST-API für Standardprodukte. Bei Sondergrößen, kundenspezifischen Varianten und Set-Artikeln gab es Sonderlogik, die nur Teile davon dokumentierte. Wir haben gemeinsam mit dem ERP-Owner 14 Sonderfälle identifiziert und in den Agent eingebaut. Das hat den Pilot um 2 Wochen verlängert.
Margenregeln waren historisch gewachsen. Der Mandant hatte über 18 Jahre 60+ Margenregeln aufgebaut, von denen rund 12 in den letzten 3 Jahren nicht mehr aktiv waren. Wir haben gemeinsam mit dem Vertriebsleiter aufgeräumt, was nebenbei einen Konsolidierungseffekt hatte (klarere Konditions-Logik im gesamten Hause).
Akzeptanz im Innendienst kippte erst mit dem ersten Großauftrag. 6 Wochen nach Live war die Stimmung im Innendienst gemischt — viele wollten doch lieber wieder Word-Templates. Die Wende kam, als ein Innendienstler einen 350.000-€-Auftrag eines A-Kunden gewann, weil der Agent das Angebot in 3 Stunden lieferte (Wettbewerber brauchte 5 Tage). Danach kippte die Stimmung schlagartig.

Lessons Learned

Agenten-Erfolg = Tool-Disziplin. Je klarer die fünf Werkzeuge des Agents definiert sind, desto zuverlässiger arbeitet er. Offene Agenten-Konstruktionen mit „freier Entscheidung“ funktionieren in Demos, scheitern in Produktion.
Halluzination ist konstruktiv lösbar. Wer das LLM nur dort einsetzt, wo Sprachverstehen nötig ist (parsen, formulieren), und alle preisrelevanten Pfade deterministisch hält, vermeidet 95 % der Halluzinationsrisiken.
Mensch im Loop ist Akzeptanz-Anker. Niemand wollte einen Agent, der eigenständig Angebote verschickt. Mit Mensch-Freigabe wurde das System schnell als Werkzeug akzeptiert, nicht als Bedrohung.
Margenregeln aufräumen ist Pflichtaufwand. Wer historische Konditions-Logik 1:1 in einen Agent übersetzt, transportiert Altlasten in die KI. Das Aufräumen ist ein Geschenk an die Organisation insgesamt.
Roll-out-Geschwindigkeit unterschätzt man. Vom Pilot-Live zum Vollausbau dauerte es 14 Wochen — länger als geplant, weil jede neue Produktkategorie eigene Sonderlogik mitbrachte.

Wenn Sie einen vergleichbaren Use Case haben — komplexer B2B-Vertrieb, viele Quellsysteme, hoher Innendienst-Aufwand — sprechen Sie uns an. Im kostenfreien Erstgespräch teilen wir unsere Erfahrungen aus diesem und anderen Mandaten und beurteilen offen, ob ein Pilot Sinn macht. Mehr Methodik finden Sie in unserem Use-Case-Leitfaden zu KI-Angebotserstellung.

Häufig gestellte Fragen

Was macht der KI-Agent konkret?

Er parst eingehende Anfragen (E-Mail, PDF-Anhang, RFQ-Portal), prüft Verfügbarkeit im ERP, holt Konditionen aus dem Kunden-Vertragssystem, zieht Hersteller-Datenblätter aus dem PIM, kalkuliert auf Basis hinterlegter Marge und generiert ein revisionssicheres Angebots-PDF. Der Vertriebsinnendienst bekommt das Ergebnis als Vorschlag zur Freigabe.

Welche Quellsysteme sind angebunden?

ERP (proAlpha), CRM (Microsoft Dynamics 365), PIM (Akeneo), Vertragsmanagement (eigenentwickelt MSSQL-basiert), E-Mail (Microsoft Exchange) und SharePoint für historische Angebote. Anbindung über REST-APIs (Dynamics, Akeneo), DB-Reader (proAlpha, MSSQL) und Microsoft Graph (Mail, SharePoint).

Welches LLM steckt dahinter?

Hauptpfad: Claude 3.5 Sonnet via Anthropic EU-Endpoint (Frankfurt). Fallback: GPT-4o via Azure OpenAI Sweden Central. Für die Anfrage-Klassifikation und einfache Datenextraktion: Mistral Small via La Plateforme. Open-Weight-Modelle wurden geprüft, aber für die Komplexität der Angebote nicht hinreichend.

Wie wird Halluzination verhindert?

Drei Mechanismen: (1) Der Agent hat keine eigene Kreativität bei Konditionen — Preise und Margen kommen ausschließlich aus deterministischen Tool-Calls. (2) Jedes generierte Angebot wird vor Versand vom Vertriebsinnendienst freigegeben. (3) Pflicht-Eval auf 200 historischen Anfragen mit bekannten Lösungen, fortlaufend ergänzt.

Was kostet das Setup?

Pilot 32.500 € (10 Wochen, Komplexität durch ERP-Anbindung), Implementation 142.000 € (14 Wochen Roll-out auf alle Produktkategorien), Managed Service 6.500 €/Monat. LLM-Kosten ca. 2.200 €/Monat bei aktuellem Anfragevolumen.

Hat der Vertriebsinnendienst Angst um seinen Job?

Anfangs ja. Nach 6 Monaten Live ist die Stimmung gekippt — kein Personalabbau, stattdessen wurden zwei zusätzliche Außendienst-Stellen geschaffen, die durch die Effizienzgewinne im Innendienst finanziert wurden. Innendienst-Mitarbeiter machen heute mehr Beratung und weniger Tipparbeit.

Wo wird gehostet?

Vollständig in der EU. Anwendungsserver auf IONOS Cloud (Karlsruhe), Daten-Pipeline und Vektor-DB ebenfalls IONOS, LLM-Inferenz über Anthropic EU (Frankfurt) und Azure OpenAI (Stockholm). Auftragsverarbeitungsverträge mit allen Anbietern.

Wie sieht die Hit-Rate-Verbesserung aus?

Vorher 31 % Auftragseingang auf abgegebene Angebote, jetzt 49 %. Die Verbesserung kommt aus drei Effekten: schnellere Antwort, bessere Konditions-Konsistenz (kein Vergessen von Rahmenvertrags-Rabatten) und höhere Anfragekapazität (vorher wurden Anfragen gefiltert / abgewiesen, heute werden alle bearbeitet).

Kostenfreie KI-Potenzialanalyse

30 Minuten Strategiegespräch mit einem KBD-Berater. Konkret, ehrlich, ohne Verkaufsdruck — wir sagen Ihnen offen, ob KI für Ihren Use Case lohnt.

Analyse Ihrer 3 wichtigsten Prozesse
Konkrete Roadmap mit Aufwandsschätzung
Indikative ROI-Rechnung für Ihren Case

Ergänzend lesenswert

KI im Großhandel

Branchen-Pillar mit weiteren Use Cases

KI-Angebotserstellung

Use-Case-Methodik vertieft

KI-Agenten im Unternehmen

Wann Agenten sinnvoll sind

Weitere Case Studies

Maschinenbau & Logistik

KI-Readiness-Check

Sind Sie bereit für solche Projekte?

DSGVO-konforme KI

Rechtssicher implementieren