Case Study · Öffentlicher Sektor · 480 MA Verwaltung

    Mittelstadt reduziert Bürger-Wartezeit um 62 % — durch Voice AI und KI-Wissensdatenbank

    Wie eine NRW-Mittelstadt mit 95.000 Einwohnern die Wartezeit auf Bürger-Anfragen von 8,4 auf 3,2 Minuten gesenkt hat — durch Voice AI für Bürger-Hotline plus KI-Wissensdatenbank für Sachbearbeiter. BSI-Grundschutz-konform, OZG-2.0-Pfad-kompatibel.

    30 Tage
    zum ersten Pilot
    Ø 40 %
    weniger manuelle Arbeit
    100 %
    Hosting in Deutschland
    DSGVO + EU AI Act
    konform implementiert

    Ausgangslage

    Die Stadt — eine NRW-Mittelstadt mit 95.000 Einwohnern — bekam Anfang 2025 strukturellen Druck aus drei Richtungen: (1) Personalmangel im Bürgerbüro mit 14 unbesetzten Stellen, (2) durchschnittliche Wartezeit am Telefon 8,4 Minuten mit Spitzen über 25 Minuten in den Mittagspausen-Stunden, (3) zunehmende Bürger-Beschwerden mit politischer Spitze (Stadtrats-Anfrage, Lokal-Pressethema). Klassische Ausweitung des Bürgerbüros war wegen leerem Personal-Markt nicht möglich.

    Ziele & KPIs

    • Wartezeit-Median ≤ 4 Minuten innerhalb 9 Monaten Live-Betrieb.
    • Containment-Rate Voice AI ≥ 50 % (Anrufe vollständig durch KI bearbeitet).
    • Bürger-Zufriedenheit (Schul-Note nach Anruf) ≤ 2,3 (Vorzeitraum: 2,8).
    • BSI-Grundschutz-Audit bestanden vor Live-Schaltung.
    • Kein Personalabbau (Vorgabe Personalrat).

    Die Lösung

    Komponente 1: Voice AI Bürger-Hotline

    Selbst gehostete Voice-AI-Stack auf KRZN-Hardware: Whisper-large-v3 für Spracherkennung, Llama 3.1 70B für Dialog-Logik, Coqui-TTS für Sprach-Ausgabe. RAG über strukturierte Stadt-Wissensbasis (Öffnungszeiten, Termine, Gebühren, häufige Fragen). 14 Themen-Cluster mit klaren Eskalations-Regeln.

    Komponente 2: KI-Wissensdatenbank für Sachbearbeiter

    Wenn ein Anruf an einen Sachbearbeiter durchgestellt wird oder ein Sachbearbeiter eine eigene Frage hat: RAG-System über alle Dienstanweisungen, Verwaltungsvorschriften, FAQs und historische Bürger-Antworten. Quellen-Angabe in jeder Antwort, klare Kennzeichnung „KI-Antwort, finale Verantwortung beim Sachbearbeiter“.

    BSI-Grundschutz im Detail

    (1) Hosting komplett im KRZN-Rechenzentrum, BSI-Profil „erhöhter Schutzbedarf“ für bürgerbezogene Daten. (2) Externe BSI-Audit-Stelle hat das Setup vor Live-Schaltung bestätigt; jährliches Re-Audit. (3) Keine externen LLM-Anbieter — alles selbst gehostet.(4) Logging aller Voice-Interaktionen mit Sprach-Pseudonymisierung (Stimm-Hashes statt Roh-Audio nach 14 Tagen). (5) Klare Lösch-Konzepte nach DSGVO Art. 17.

    Vorgehen & Zeitplan

    Vom Kick-off bis zum Live-Betrieb

    1. 1Woche 1–4

      Discovery + Personalrat

      Use-Case-Schärfung, Personalrat-Einbindung, BSI-Konzept.

      • Personalrat-Vereinbarung
      • BSI-Konzept
      • Themen-Cluster-Definition
    2. 2Woche 5–12

      Pilot Voice AI (3 Themen)

      Termin-Buchung, Müllabfuhr, Anfahrt — Pilot mit echten Anrufern.

      • Voice-AI-MVP
      • Eval-Bericht 200 Anrufe
    3. 3Woche 13–22

      Roll-out auf 14 Themen

      Schrittweise Erweiterung, Wissensdatenbank für Sachbearbeiter parallel.

      • Vollständiges Voice-System
      • Wissensdatenbank live
      • BSI-Audit bestanden

    Ergebnisse nach 12 Monaten Live-Betrieb

    Gemessen über 12 Monate Live-Betrieb, Vergleich zum Vorjahresdurchschnitt

    62 %
    kürzere Wartezeit
    67 %
    Voice-AI-Containment
    320 k €
    Einsparung Jahr 1
    2,1
    Bürger-Zufriedenheit (vorher 2,8)
    „Was uns überrascht hat: gerade ältere Bürger akzeptieren das System sehr gut, wenn die Stimme natürlich klingt und schnell die richtige Auskunft kommt. Die Befürchtung, das wäre eine Hürde, hat sich nicht bestätigt.“
    — Leiterin Bürgerbüro, Februar 2026

    Wirtschaftlichkeit

    Total Cost of Ownership Jahr 1: ca. 320 k € (Pilot, Implementation, Hardware-Anteil, Managed Service, Wissensdatenbank-Lizenz, interne Aufwände). Realisierte Einsparung 320 k € — Break-Even bereits Jahr 1, ab Jahr 2 ca. 245 k € Net Benefit p. a. Wichtig im öffentlichen Sektor: die Einsparung ist nicht „Kosten gespart“ im Sinne von „Menschen weg“, sondern „Mehrleistung mit gleichem Personal“ — die 14 unbesetzten Stellen werden faktisch nicht mehr benötigt.

    Lessons Learned

    • Personalrat als Co-Designer — nicht als nachgeschaltete Instanz.
    • BSI-Audit vor Live-Schaltung, nicht danach. Spart politisches Risiko.
    • Eskalations-Schlüsselworte sehr breit auslegen — lieber zu viele Durchstellungen als eine versäumte Härtefall-Eskalation.
    • Voice-Stimm-Qualität ist entscheidend — wir haben drei TTS-Engines gegeneinander getestet, bevor wir uns festgelegt haben.

    Mehr: Erstgespräch buchen.

    Häufig gestellte Fragen

    Welche Bürger-Anfragen werden vom System bearbeitet?
    Voice AI deckt aktuell 14 Standard-Themen: Termin-Buchung Bürgeramt, Termin-Buchung Standesamt, Anfahrt/Öffnungszeiten, Status Personalausweis-/Reisepass-Bestellung, Müllabfuhr-Termine, Hundesteuer, Anwohnerparkausweis, Sperrmüll-Anmeldung, Anfrage Status Bauantrag, Gewerbeanmeldungs-Vorinfo. Komplexere Anliegen werden ans menschliche Bürgerbüro durchgestellt.
    Wie wird BSI-Grundschutz umgesetzt?
    Hosting komplett im KRZN-Rechenzentrum (kommunale IT-Dienstleisterin), kein US-Cloud, BSI-Grundschutz-Profil „erhöhter Schutzbedarf“ für Bürgerdaten. Audit durch externe BSI-zugelassene Stelle vor Live-Schaltung, jährliches Re-Audit. Keine Übertragung personenbezogener Bürgerdaten an externe LLM-Anbieter — selbst gehostete Llama-3.1-Instanz auf KRZN-Hardware.
    Wie ist das Verhältnis zum Online-Zugangsgesetz (OZG)?
    Komplementär. Das System liefert die telefonische Schnellauskunft für Bürger, die OZG-Online-Wege nicht nutzen wollen oder können (insbesondere ältere Bevölkerung — 28 % der Anrufe kommen von Personen > 70 Jahre). OZG-Online-Verfahren bleiben unberührt; das System verweist aktiv auf den Online-Weg, wenn er für das jeweilige Anliegen schneller wäre.
    Was passiert mit kritischen Anliegen (Eilfällen, Beschwerden)?
    Eskalations-Logik mit drei Stufen: (1) Schlüsselworte wie „Beschwerde“, „Eilfall“, „Notfall“, „Kindeswohl“ lösen sofortige Durchstellung an Mitarbeiter aus. (2) Mehrfache Wiederholung der gleichen Frage durch denselben Anrufer löst Durchstellung aus. (3) Konfidenz < 0,8 in der Voice-AI-Antwort führt zur Durchstellung. So bleibt der menschliche Pfad immer offen.
    Wie wurde der Personalrat eingebunden?
    Sehr früh. Bereits in Woche 2 (vor jedem Modell-Bau) gab es eine Vorstellung mit Möglichkeit zur Stellungnahme. Der Personalrat hat zwei harte Bedingungen formuliert: (1) keine Personalreduktion durch das Projekt — bestätigt und schriftlich fixiert. (2) Mitspracherecht bei der Klassifizierung durchgestellter Anrufe — umgesetzt. Die Akzeptanz im Personalrat war später ein Treiber für die schnelle Live-Schaltung.
    Was hat das Projekt gekostet?
    Pilot 28 k €, Implementation 165 k €, Hardware (anteilig KRZN-Rechenzentrum) ca. 35 k €, Managed Service 5.500 €/Monat, Lizenz Wissensdatenbank 18 k € einmalig + 12 k €/Jahr. Total Cost of Ownership Jahr 1: ca. 320 k €. Realisierte Einsparung 320 k € (Personalkosten-Vermeidung 240 k € + reduzierte Wartezeit-Beschwerden 80 k €) — Break-Even bereits Jahr 1.

    Kostenfreie KI-Potenzialanalyse

    30 Minuten Strategiegespräch mit einem KBD-Berater. Konkret, ehrlich, ohne Verkaufsdruck — wir sagen Ihnen offen, ob KI für Ihren Use Case lohnt.

    • Analyse Ihrer 3 wichtigsten Prozesse
    • Konkrete Roadmap mit Aufwandsschätzung
    • Indikative ROI-Rechnung für Ihren Case

    Ergänzend lesenswert