Was ist eine Vektor-Datenbank?
Eine Vektor-Datenbank speichert hochdimensionale Vektoren (Embeddings) zusammen mit Metadaten und ermöglicht zwei Operationen: (1) Insert/Update/Delete wie bei jeder DB, (2) Nearest-Neighbor-Suche — gegeben ein Vektor, finde die N ähnlichsten in der Datenbank.
Letzteres ist der Kern: bei jeder Suchanfrage wird die Frage in einen Embedding-Vektor gewandelt, und die DB liefert die ähnlichsten gespeicherten Chunks zurück. Damit wird semantische Suche praktisch — auch über Millionen Dokumente in Millisekunden.
Wie funktioniert die Suche?
Naiv: für jede Anfrage wird der Anfrage-Vektor mit jedem gespeicherten Vektor verglichen (Kosinus-Ähnlichkeit). Bei 10.000 Chunks dauert das wenige Millisekunden. Bei 10 Mio Chunks wären es Minuten — nicht produktionstauglich.
Lösung: Approximate Nearest Neighbor (ANN)-Indizes. Standard 2026 ist HNSW (Hierarchical Navigable Small World), das einen Such-Graph aufbaut, in dem die Suche logarithmisch statt linear skaliert. Damit liefern moderne Vektor-DBs auch über 100M Chunks Antworten unter 50 ms — bei 95–99 % Recall gegenüber der naiven Suche.
Anbieter im Vergleich
Welche für welche Größe?
Eine pragmatische Entscheidungs-Hilfe für Mittelstands-Cases:
- Bis 100.000 Chunks (typisch ~10.000 Dokumente): pgvector. Einfach, günstig, transaktional mit Ihrer Hauptdatenbank konsistent.
- 100.000 – 5 Mio Chunks: Qdrant Self-Hosted auf eigener Infrastruktur. Gute EU-Hosting-Optionen, deutsche Anbieter wie IONOS oder Hetzner.
- 5–50 Mio Chunks: Qdrant Cloud, Weaviate Cloud. Volumen wird zur Operations-Frage — Managed-Services lohnen sich.
- 50M+ Chunks: selten im Mittelstand. Pinecone, Vespa oder spezialisierte Setups.
Im Pilot fast immer pgvector — der Switch zu einer dedizierten DB ist später ein 2-Tage-Projekt, falls überhaupt nötig. Mehr in unserem RAG-Glossar oder im Kosten-Rechner.
