Glossar · Architektur

    Vektor-Datenbank — Speicher für Embeddings

    Eine Vektor-Datenbank speichert Embeddings (numerische Repräsentationen von Text) und ermöglicht blitzschnelle Ähnlichkeitssuche. Sie ist die Speicher-Komponente jeder RAG-Architektur. Im Mittelstand kommen typischerweise vier Optionen in Frage — die richtige Wahl hängt vor allem von der Datenmenge ab.

    30 Tage
    zum ersten Pilot
    Ø 40 %
    weniger manuelle Arbeit
    100 %
    Hosting in Deutschland
    DSGVO + EU AI Act
    konform implementiert

    Was ist eine Vektor-Datenbank?

    Eine Vektor-Datenbank speichert hochdimensionale Vektoren (Embeddings) zusammen mit Metadaten und ermöglicht zwei Operationen: (1) Insert/Update/Delete wie bei jeder DB, (2) Nearest-Neighbor-Suche — gegeben ein Vektor, finde die N ähnlichsten in der Datenbank.

    Letzteres ist der Kern: bei jeder Suchanfrage wird die Frage in einen Embedding-Vektor gewandelt, und die DB liefert die ähnlichsten gespeicherten Chunks zurück. Damit wird semantische Suche praktisch — auch über Millionen Dokumente in Millisekunden.

    Wie funktioniert die Suche?

    Naiv: für jede Anfrage wird der Anfrage-Vektor mit jedem gespeicherten Vektor verglichen (Kosinus-Ähnlichkeit). Bei 10.000 Chunks dauert das wenige Millisekunden. Bei 10 Mio Chunks wären es Minuten — nicht produktionstauglich.

    Lösung: Approximate Nearest Neighbor (ANN)-Indizes. Standard 2026 ist HNSW (Hierarchical Navigable Small World), das einen Such-Graph aufbaut, in dem die Suche logarithmisch statt linear skaliert. Damit liefern moderne Vektor-DBs auch über 100M Chunks Antworten unter 50 ms — bei 95–99 % Recall gegenüber der naiven Suche.

    Anbieter im Vergleich

    Tabelle horizontal scrollen
    Die vier relevantesten Vektor-DBs für den Mittelstand
    Kriterium
    Hosting-Modell
    Skalierung
    Preis-Niveau
    Wann?
    pgvector
    Postgres-ErweiterungBis ~500k Chunks0 € extraSie haben schon Postgres
    Qdrant
    Self-Hosted oder Cloud (EU)Mio Chunks problemlos200–1.500 €/MonatMittelstands-Standard
    Weaviate
    Self-Hosted oder Cloud10M+ Chunks300–2.000 €/MonatMulti-Tenancy gefragt
    Pinecone
    Cloud-only (USA mit EU-Region)Sehr groß70–3.000 €/MonatHyperscale ohne Self-Hosting

    Welche für welche Größe?

    Eine pragmatische Entscheidungs-Hilfe für Mittelstands-Cases:

    • Bis 100.000 Chunks (typisch ~10.000 Dokumente): pgvector. Einfach, günstig, transaktional mit Ihrer Hauptdatenbank konsistent.
    • 100.000 – 5 Mio Chunks: Qdrant Self-Hosted auf eigener Infrastruktur. Gute EU-Hosting-Optionen, deutsche Anbieter wie IONOS oder Hetzner.
    • 5–50 Mio Chunks: Qdrant Cloud, Weaviate Cloud. Volumen wird zur Operations-Frage — Managed-Services lohnen sich.
    • 50M+ Chunks: selten im Mittelstand. Pinecone, Vespa oder spezialisierte Setups.

    Im Pilot fast immer pgvector — der Switch zu einer dedizierten DB ist später ein 2-Tage-Projekt, falls überhaupt nötig. Mehr in unserem RAG-Glossar oder im Kosten-Rechner.

    Häufig gestellte Fragen

    Brauche ich überhaupt eine Vektor-Datenbank?
    Ja, sobald Sie semantische Suche oder RAG bauen. Theoretisch könnten Sie Embeddings auch in einer normalen Datei speichern und linear durchsuchen — bei wenigen tausend Chunks geht das. Ab 10.000+ Chunks brauchen Sie indexierte Suche (HNSW oder IVF), und das liefert eine Vektor-DB out-of-the-box.
    pgvector oder dedizierte DB?
    Faustregel: bis 100.000 Chunks reicht pgvector auf einer regulären PostgreSQL — ein Anbieter weniger, einfaches Backup, Transaktionen mit anderen Daten möglich. Ab 100k bis 10M Chunks lohnt eine dedizierte DB wie Qdrant. Über 10M lohnen kommerzielle Optionen wie Pinecone oder Weaviate Cloud.
    Was kostet eine Vektor-DB?
    pgvector: Zusatzkosten ~0 € (auf bestehender PostgreSQL). Qdrant Self-Hosted: 200–800 €/Monat Compute. Qdrant Cloud: 250–1.500 €/Monat je nach Volumen. Weaviate Cloud: ähnlich. Pinecone: ab 70 €/Monat im kleinsten Tier, schnell skalierbar. EU-Hosting fast überall verfügbar.
    Welche Indexierungs-Methode ist die richtige?
    HNSW (Hierarchical Navigable Small World) ist 2026 der De-facto-Standard — gute Latenz, gute Recall-Rate, mäßiger Speicherverbrauch. IVF (Inverted File Index) lohnt nur bei extrem großen Datenmengen mit Speicher-Constraints. Die meisten Vektor-DBs nutzen HNSW als Default und liefern gute Ergebnisse ohne Tuning.

    Kostenfreie KI-Potenzialanalyse

    30 Minuten Strategiegespräch mit einem KBD-Berater. Konkret, ehrlich, ohne Verkaufsdruck — wir sagen Ihnen offen, ob KI für Ihren Use Case lohnt.

    • Analyse Ihrer 3 wichtigsten Prozesse
    • Konkrete Roadmap mit Aufwandsschätzung
    • Indikative ROI-Rechnung für Ihren Case

    Ergänzend lesenswert