Vektor-Datenbank | Speicher für Embeddings im Vergleich

Vektor-Datenbank — Speicher für Embeddings

Eine Vektor-Datenbank speichert Embeddings (numerische Repräsentationen von Text) und ermöglicht blitzschnelle Ähnlichkeitssuche. Sie ist die Speicher-Komponente jeder RAG-Architektur. Im Mittelstand kommen typischerweise vier Optionen in Frage — die richtige Wahl hängt vor allem von der Datenmenge ab.

Was ist eine Vektor-Datenbank?

Eine Vektor-Datenbank speichert hochdimensionale Vektoren (Embeddings) zusammen mit Metadaten und ermöglicht zwei Operationen: (1) Insert/Update/Delete wie bei jeder DB, (2) Nearest-Neighbor-Suche — gegeben ein Vektor, finde die N ähnlichsten in der Datenbank.

Letzteres ist der Kern: bei jeder Suchanfrage wird die Frage in einen Embedding-Vektor gewandelt, und die DB liefert die ähnlichsten gespeicherten Chunks zurück. Damit wird semantische Suche praktisch — auch über Millionen Dokumente in Millisekunden.

Wie funktioniert die Suche?

Naiv: für jede Anfrage wird der Anfrage-Vektor mit jedem gespeicherten Vektor verglichen (Kosinus-Ähnlichkeit). Bei 10.000 Chunks dauert das wenige Millisekunden. Bei 10 Mio Chunks wären es Minuten — nicht produktionstauglich.

Lösung: Approximate Nearest Neighbor (ANN)-Indizes. Standard 2026 ist HNSW (Hierarchical Navigable Small World), das einen Such-Graph aufbaut, in dem die Suche logarithmisch statt linear skaliert. Damit liefern moderne Vektor-DBs auch über 100M Chunks Antworten unter 50 ms — bei 95–99 % Recall gegenüber der naiven Suche.

Anbieter im Vergleich

Tabelle horizontal scrollen

Die vier relevantesten Vektor-DBs für den Mittelstand
Kriterium	Hosting-Modell	Skalierung	Preis-Niveau	Wann?
pgvector	Postgres-Erweiterung	Bis ~500k Chunks	0 € extra	Sie haben schon Postgres
Qdrant	Self-Hosted oder Cloud (EU)	Mio Chunks problemlos	200–1.500 €/Monat	Mittelstands-Standard
Weaviate	Self-Hosted oder Cloud	10M+ Chunks	300–2.000 €/Monat	Multi-Tenancy gefragt
Pinecone	Cloud-only (USA mit EU-Region)	Sehr groß	70–3.000 €/Monat	Hyperscale ohne Self-Hosting

Welche für welche Größe?

Eine pragmatische Entscheidungs-Hilfe für Mittelstands-Cases:

Bis 100.000 Chunks (typisch ~10.000 Dokumente): pgvector. Einfach, günstig, transaktional mit Ihrer Hauptdatenbank konsistent.
100.000 – 5 Mio Chunks: Qdrant Self-Hosted auf eigener Infrastruktur. Gute EU-Hosting-Optionen, deutsche Anbieter wie IONOS oder Hetzner.
5–50 Mio Chunks: Qdrant Cloud, Weaviate Cloud. Volumen wird zur Operations-Frage — Managed-Services lohnen sich.
50M+ Chunks: selten im Mittelstand. Pinecone, Vespa oder spezialisierte Setups.

Im Pilot fast immer pgvector — der Switch zu einer dedizierten DB ist später ein 2-Tage-Projekt, falls überhaupt nötig. Mehr in unserem RAG-Glossar oder im Kosten-Rechner.

Häufig gestellte Fragen

Brauche ich überhaupt eine Vektor-Datenbank?

Ja, sobald Sie semantische Suche oder RAG bauen. Theoretisch könnten Sie Embeddings auch in einer normalen Datei speichern und linear durchsuchen — bei wenigen tausend Chunks geht das. Ab 10.000+ Chunks brauchen Sie indexierte Suche (HNSW oder IVF), und das liefert eine Vektor-DB out-of-the-box.

pgvector oder dedizierte DB?

Faustregel: bis 100.000 Chunks reicht pgvector auf einer regulären PostgreSQL — ein Anbieter weniger, einfaches Backup, Transaktionen mit anderen Daten möglich. Ab 100k bis 10M Chunks lohnt eine dedizierte DB wie Qdrant. Über 10M lohnen kommerzielle Optionen wie Pinecone oder Weaviate Cloud.

Was kostet eine Vektor-DB?

pgvector: Zusatzkosten ~0 € (auf bestehender PostgreSQL). Qdrant Self-Hosted: 200–800 €/Monat Compute. Qdrant Cloud: 250–1.500 €/Monat je nach Volumen. Weaviate Cloud: ähnlich. Pinecone: ab 70 €/Monat im kleinsten Tier, schnell skalierbar. EU-Hosting fast überall verfügbar.

Welche Indexierungs-Methode ist die richtige?

HNSW (Hierarchical Navigable Small World) ist 2026 der De-facto-Standard — gute Latenz, gute Recall-Rate, mäßiger Speicherverbrauch. IVF (Inverted File Index) lohnt nur bei extrem großen Datenmengen mit Speicher-Constraints. Die meisten Vektor-DBs nutzen HNSW als Default und liefern gute Ergebnisse ohne Tuning.

Kostenfreie KI-Potenzialanalyse

30 Minuten Strategiegespräch mit einem KBD-Berater. Konkret, ehrlich, ohne Verkaufsdruck — wir sagen Ihnen offen, ob KI für Ihren Use Case lohnt.

Analyse Ihrer 3 wichtigsten Prozesse
Konkrete Roadmap mit Aufwandsschätzung
Indikative ROI-Rechnung für Ihren Case

Ergänzend lesenswert

Embedding

Was wird gespeichert?

RAG

Wo Vektor-DBs zum Einsatz kommen

DSGVO-Konformität

Hosting-Aspekte

Wissensmanagement

Praxisbeispiel