Ausgangslage
Die Stadt — eine NRW-Mittelstadt mit 95.000 Einwohnern — bekam Anfang 2025 strukturellen Druck aus drei Richtungen: (1) Personalmangel im Bürgerbüro mit 14 unbesetzten Stellen, (2) durchschnittliche Wartezeit am Telefon 8,4 Minuten mit Spitzen über 25 Minuten in den Mittagspausen-Stunden, (3) zunehmende Bürger-Beschwerden mit politischer Spitze (Stadtrats-Anfrage, Lokal-Pressethema). Klassische Ausweitung des Bürgerbüros war wegen leerem Personal-Markt nicht möglich.
Ziele & KPIs
- Wartezeit-Median ≤ 4 Minuten innerhalb 9 Monaten Live-Betrieb.
- Containment-Rate Voice AI ≥ 50 % (Anrufe vollständig durch KI bearbeitet).
- Bürger-Zufriedenheit (Schul-Note nach Anruf) ≤ 2,3 (Vorzeitraum: 2,8).
- BSI-Grundschutz-Audit bestanden vor Live-Schaltung.
- Kein Personalabbau (Vorgabe Personalrat).
Die Lösung
Komponente 1: Voice AI Bürger-Hotline
Selbst gehostete Voice-AI-Stack auf KRZN-Hardware: Whisper-large-v3 für Spracherkennung, Llama 3.1 70B für Dialog-Logik, Coqui-TTS für Sprach-Ausgabe. RAG über strukturierte Stadt-Wissensbasis (Öffnungszeiten, Termine, Gebühren, häufige Fragen). 14 Themen-Cluster mit klaren Eskalations-Regeln.
Komponente 2: KI-Wissensdatenbank für Sachbearbeiter
Wenn ein Anruf an einen Sachbearbeiter durchgestellt wird oder ein Sachbearbeiter eine eigene Frage hat: RAG-System über alle Dienstanweisungen, Verwaltungsvorschriften, FAQs und historische Bürger-Antworten. Quellen-Angabe in jeder Antwort, klare Kennzeichnung „KI-Antwort, finale Verantwortung beim Sachbearbeiter“.
BSI-Grundschutz im Detail
(1) Hosting komplett im KRZN-Rechenzentrum, BSI-Profil „erhöhter Schutzbedarf“ für bürgerbezogene Daten. (2) Externe BSI-Audit-Stelle hat das Setup vor Live-Schaltung bestätigt; jährliches Re-Audit. (3) Keine externen LLM-Anbieter — alles selbst gehostet.(4) Logging aller Voice-Interaktionen mit Sprach-Pseudonymisierung (Stimm-Hashes statt Roh-Audio nach 14 Tagen). (5) Klare Lösch-Konzepte nach DSGVO Art. 17.
Vorgehen & Zeitplan
Vom Kick-off bis zum Live-Betrieb
- 1Woche 1–4
Discovery + Personalrat
Use-Case-Schärfung, Personalrat-Einbindung, BSI-Konzept.
- →Personalrat-Vereinbarung
- →BSI-Konzept
- →Themen-Cluster-Definition
- 2Woche 5–12
Pilot Voice AI (3 Themen)
Termin-Buchung, Müllabfuhr, Anfahrt — Pilot mit echten Anrufern.
- →Voice-AI-MVP
- →Eval-Bericht 200 Anrufe
- 3Woche 13–22
Roll-out auf 14 Themen
Schrittweise Erweiterung, Wissensdatenbank für Sachbearbeiter parallel.
- →Vollständiges Voice-System
- →Wissensdatenbank live
- →BSI-Audit bestanden
Ergebnisse nach 12 Monaten Live-Betrieb
Gemessen über 12 Monate Live-Betrieb, Vergleich zum Vorjahresdurchschnitt
„Was uns überrascht hat: gerade ältere Bürger akzeptieren das System sehr gut, wenn die Stimme natürlich klingt und schnell die richtige Auskunft kommt. Die Befürchtung, das wäre eine Hürde, hat sich nicht bestätigt.“
— Leiterin Bürgerbüro, Februar 2026
Wirtschaftlichkeit
Total Cost of Ownership Jahr 1: ca. 320 k € (Pilot, Implementation, Hardware-Anteil, Managed Service, Wissensdatenbank-Lizenz, interne Aufwände). Realisierte Einsparung 320 k € — Break-Even bereits Jahr 1, ab Jahr 2 ca. 245 k € Net Benefit p. a. Wichtig im öffentlichen Sektor: die Einsparung ist nicht „Kosten gespart“ im Sinne von „Menschen weg“, sondern „Mehrleistung mit gleichem Personal“ — die 14 unbesetzten Stellen werden faktisch nicht mehr benötigt.
Lessons Learned
- Personalrat als Co-Designer — nicht als nachgeschaltete Instanz.
- BSI-Audit vor Live-Schaltung, nicht danach. Spart politisches Risiko.
- Eskalations-Schlüsselworte sehr breit auslegen — lieber zu viele Durchstellungen als eine versäumte Härtefall-Eskalation.
- Voice-Stimm-Qualität ist entscheidend — wir haben drei TTS-Engines gegeneinander getestet, bevor wir uns festgelegt haben.
Mehr: Erstgespräch buchen.
