Case Study · Versicherung · 340 MA

    Versicherer reduziert Schaden-Durchlaufzeit um 58 % — durch KI-Triage und Dokument-Verständnis

    Wie ein deutscher Regionalversicherer mit 340 Mitarbeitern die Durchlaufzeit für Kfz-Bagatell-Schäden von 9,2 auf 3,8 Tage gesenkt hat — durch ein KI-System aus Schaden-Triage, Dokument-Verständnis und teilautomatisierter Dunkelverarbeitung. BaFin-konform und mit klarer Audit-Spur.

    30 Tage
    zum ersten Pilot
    Ø 40 %
    weniger manuelle Arbeit
    100 %
    Hosting in Deutschland
    DSGVO + EU AI Act
    konform implementiert

    Ausgangslage

    Der Mandant ist ein 1894 gegründeter Regionalversicherer mit Schwerpunkt Sach-/Kfz und einem Beitragsvolumen von rund 1,1 Mrd € pro Jahr. Im Kfz-Schadenbereich gehen rund 24.000 Meldungen pro Jahr ein, davon etwa 62 % Bagatell-Schäden bis 5.000 €. Die durchschnittliche Durchlaufzeit lag Anfang 2025 bei 9,2 Tagen — ein Wettbewerbsnachteil gegenüber Direktversicherern, die im Schnitt unter 4 Tage liefern.

    Gleichzeitig kämpfte die Schadenabteilung mit einem demografischen Problem: 18 % der Sachbearbeiter standen innerhalb von fünf Jahren vor dem Renteneintritt, der Bewerbungs-Markt für klassische Schaden-Sachbearbeiter war faktisch leer. Die Frage lautete nicht „wie skalieren wir?“, sondern „wie schaffen wir gleiches Volumen mit weniger Personal — bei gleichem oder höherem Service-Level?“.

    Ziele & KPIs

    • Reduktion Durchlaufzeit Bagatell-Schäden auf ≤ 5 Tage innerhalb 9 Monaten Live-Betrieb.
    • Dunkelverarbeitungs-Quote ≥ 30 % der Bagatell-Schäden nach 12 Monaten.
    • Kunden-Beschwerdequote ≤ Vorjahres-Niveau (max. +0,2 Prozentpunkte toleriert).
    • BaFin-Audit-Bereitschaft als zwingende Vorbedingung — kein KI-Einsatz ohne vollständige Doku.

    Die Lösung

    Wir haben drei Komponenten gebaut, die als Pipeline zusammenarbeiten und einzeln deaktivierbar sind:

    Komponente 1: Schaden-Triage-Klassifikator

    Auf Basis der eingehenden Schadenmeldung (Kundenportal, E-Mail, Telefonat-Transkript) klassifiziert das System: Bagatell vs. komplex, Glasbruch / Parkrempler / Wildunfall / Sonstiges, geschätzte Schadenhöhe, Konfidenz-Score. Modell: Multi-Label-Klassifikator (XGBoost-Ensemble + DistilBERT-Embedding-Features).

    Komponente 2: Dokument-Verständnis

    LLM-basierte Extraktion strukturierter Daten aus Schaden-Belegen (Werkstatt-Kostenvoranschläge, Fotos mit OCR, Polizei-Berichten). Output: strukturierter JSON-Datensatz, der direkt in das Schaden-System (Adcubum Syrius) übernommen werden kann.

    Komponente 3: Regelbasierte Dunkelverarbeitung

    Wenn Triage-Konfidenz ≥ 0,9 UND Schadenhöhe ≤ 1.500 € UND Versicherungsverhältnis sauber UND keine Auffälligkeiten in der historischen Schadenhistorie: vollständig automatische Regulierung mit Auszahlung innerhalb 24 h. Alles andere: KI-vorbereitete Hellverarbeitung durch Sachbearbeiter.

    Architektur & BaFin-Anforderungen

    Vier Schichten: (1) Eingangs-Schicht mit Anbindung an Kundenportal, E-Mail-Postfach und Telefonie-Transkription. (2) ML-/LLM-Schicht on-prem im OBS-Rechenzentrum Dortmund mit zwei GPU-Servern (Llama 3.1 70B Quantized + Mixtral 8x7B als Fallback). (3) Decision-Schichtmit deterministischer Regel-Engine, die jede KI-Entscheidung mit Eingabe-Snapshot, Modell-Version und Confidence-Score in einer unveränderlichen Audit-DB ablegt. (4) Eskalations-Schichtmit klar definierten Pfaden zu Sachbearbeiter, Schadenleiter und Compliance-Officer.

    BaFin-Konformität wurde in zwei Workshops mit dem Compliance-Officer und der Internen Revision entwickelt. Kernprinzip: keine KI-Entscheidung ohne nachvollziehbare Begründung, Modell-Versionsstand in jedem Log-Eintrag, vierteljährliches Drift-Review mit dokumentiertem Sign-off.

    Vorgehen & Zeitplan

    Vom Kick-off bis zum Live-Betrieb

    1. 1Woche 1–2

      Kick-off & BaFin-Setup

      Use-Case-Schärfung, Compliance-Workshop, Audit-Konzept.

      • Audit-Konzept
      • DSFA
      • Modell-Governance
    2. 2Woche 3–10

      Pilot Triage + Doku

      Triage-Klassifikator + Doku-Extraktion auf 1.200 historischen Schäden, Eval-Set 200 Fälle.

      • Triage-Modell v1
      • Doku-Extraktion v1
      • Eval-Bericht
    3. 3Woche 11–24

      Roll-out + Dunkelverarbeitung

      Skalierung auf alle Bagatell-Schäden, schrittweise Dunkelverarbeitungs-Aktivierung.

      • Vollständige Implementation
      • Sachbearbeiter-Schulung
      • Hyper-Care 8 Wochen

    Ergebnisse nach 13 Monaten Live-Betrieb

    Gemessen über 13 Monate Live-Betrieb, Vergleich zum Vorjahresdurchschnitt

    58 %
    kürzere Durchlaufzeit
    41 %
    Dunkelverarbeitungs-Quote
    920 k €
    Einsparung Jahr 1
    -0,1 %p
    Beschwerdequote (sogar gesunken)

    Die durchschnittliche Durchlaufzeit für Bagatell-Schäden ist von 9,2 auf 3,8 Tage gefallen. 41 % aller Bagatell-Schäden werden vollständig automatisch reguliert; weitere 38 % mit KI-Unterstützung in Hellverarbeitung. Die Beschwerdequote ist nicht gestiegen, sondern um 0,1 Prozentpunkte gefallen — vermutlich Effekt der schnelleren Bearbeitung.

    „Wir haben am Anfang lange diskutiert, ob KI-Entscheidungen bei Schaden-Auszahlungen überhaupt vereinbar sind mit unserem Selbstverständnis. Heute sehe ich es nüchterner: für Bagatell-Schäden bekommt der Kunde eine schnellere und gleich gute Bearbeitung. Bei allem Komplexen entscheiden weiter Menschen.“
    — Vorstand Schaden, April 2026

    Wirtschaftlichkeit

    Investition Jahr 1: Pilot 49 k €, Implementation 295 k €, Hardware 142 k €, Managed Service 138 k €, interne Aufwände rund 80 k € — Total Cost of Ownership ca. 590 k €. Realisierte Einsparung 920 k € (Personalkosten-Vermeidung 540 k € + Reduktion Doppelbearbeitung 230 k € + Reduktion Beschwerde-Bearbeitung 85 k € + Vermeidung Druck-/Versand-Kosten 65 k €). Net Benefit Jahr 1: 330 k €. Ab Jahr 2 ohne Implementation/Hardware-Kosten: ca. 740 k € Net Benefit p. a.

    Lessons Learned

    • BaFin-Konformität früh verankern — Audit-Konzept vor Modell-Bau, nicht danach.
    • Dunkelverarbeitung schrittweise hochfahren — wir starteten bei 5 % Quote und steigerten konservativ.
    • On-Prem-LLM ist Aufwand wert, wenn die Daten-Sensibilität BaFin-relevant ist.
    • Sachbearbeiter werden zu KI-Reviewern: Rollen-Profil hat sich geändert, nicht abgebaut.

    Mehr: Erstgespräch buchen oder 30-Tage-Pilot.

    Häufig gestellte Fragen

    Welche Schadenarten werden vom System bearbeitet?
    Aktuell: Kfz-Bagatell-Schäden (Glasbruch, Parkrempler, Wildunfall ohne Personenschaden) bis 5.000 € Schadensumme. Das ist rund 62 % aller eingehenden Kfz-Schadenmeldungen. Komplexere Schäden, Personenschäden und alle Sonderfälle gehen weiter klassisch zur Sachbearbeitung — die KI ordnet sie nur vor.
    Wie wird die BaFin-Konformität sichergestellt?
    Drei Säulen: (1) Vollständige Audit-Spur jeder KI-Entscheidung mit Modell-Version und Eingabe-Snapshot. (2) Menschliche Letztentscheidung bei Auszahlung > 1.500 € oder Konfidenz < 0,9 — keine reine KI-Auszahlung in dieser Spanne. (3) Vierteljährliches Modell-Review mit Drift-Erkennung und Bias-Auditing nach unserem internen Standard, der dem MaRisk-AT-9-Prinzip entspricht. Dokumentation für IT-Sicherheits-Audit der BaFin liegt bereit.
    Wie hoch ist die Dunkelverarbeitungs-Quote?
    Aktuell 41 % der Bagatell-Schäden werden vollständig automatisch reguliert (Eingang bis Auszahlung), 38 % laufen mit KI-Unterstützung durch einen Sachbearbeiter (Hellverarbeitung), 21 % werden komplett klassisch bearbeitet. Vor dem Projekt: 0 % Dunkelverarbeitung, 100 % klassische Bearbeitung.
    Was passiert bei einem Fehler des Systems?
    Eskalations-Logik mit drei Stufen: (1) Inhaltlicher Zweifel im Modell → Sachbearbeiter-Triage. (2) Beschwerde des Versicherten → sofortiger Stop der KI-Bearbeitung dieses Falls und manuelle Übernahme. (3) Strukturelle Auffälligkeit (z. B. mehrere Beschwerden in kurzem Zeitraum) → Modell-Review-Trigger, ggf. Rollback auf vorherige Modell-Version. Wir haben in 13 Live-Monaten zwei Modell-Rollbacks durchgeführt.
    Wo werden die Daten verarbeitet?
    100 % auf eigenen Servern beim Versicherer im OBS-Rechenzentrum (Dortmund). Selbst gehostete LLMs (Llama 3.1 70B + Mixtral 8x7B), kein US-Cloud-Routing. Hintergrund: BaFin-MaRisk plus eigene Compliance-Richtlinie des Versicherers schließen externe LLM-Dienste für Schadendaten aus.
    Was hat das Projekt insgesamt gekostet?
    Pilot 49.000 € (10 Wochen), Implementation 295.000 € (24 Wochen), Hardware (2 GPU-Server für LLM-Hosting) 142.000 €, Managed Service 11.500 €/Monat. ROI Jahr 1: 920 k € Einsparung gegen rund 590 k € Total Cost of Ownership Jahr 1.

    Kostenfreie KI-Potenzialanalyse

    30 Minuten Strategiegespräch mit einem KBD-Berater. Konkret, ehrlich, ohne Verkaufsdruck — wir sagen Ihnen offen, ob KI für Ihren Use Case lohnt.

    • Analyse Ihrer 3 wichtigsten Prozesse
    • Konkrete Roadmap mit Aufwandsschätzung
    • Indikative ROI-Rechnung für Ihren Case

    Ergänzend lesenswert