Embeddings

Semantic search and vector representations for AI applications

Embedding-Modelle für semantische Suche, RAG und Clustering

Embedding-Modelle verwandeln Text — oder manchmal Bilder, Code oder Audio — in einen Vektor fester Länge aus Fliesskommazahlen. Ähnliche Eingaben landen im Embedding-Raum nah beieinander, unähnliche weit voneinander entfernt. Du greifst zu Embeddings, wenn du semantische Suche, Retrieval-Augmented Generation (RAG), Empfehlungen oder Clustering baust.

Top embeddings picks

Hand-picked across four common criteria — resolved against the live catalog so the picks track price and performance changes.

Beste Wahl insgesamt
Text Embedding 3 Large

OpenAI's most powerful embedding model. 3072 dimensions for maximum accuracy.

Learn more
Günstigstes
Jina Embeddings v3 (Multilingual)

Jina's frontier multilingual embedding model. 570M params, 8192 ctx, 89 languages, Matryoshka dims 128-1024.

Learn more
Höchste Dimensionen
Voyage AI voyage-3

Voyage's general-purpose embedding model. 1024 dims, 32k context, strong retrieval performance.

Learn more
Schnellstes
Text Embedding 3 Small

OpenAI's compact embedding model. 1536 dimensions, great for semantic search and RAG.

Learn more

Die Abrechnung läuft pro Token, ähnlich wie bei Textgenerierung, aber typischerweise 10–100× günstiger. Flagship-Modelle (OpenAI text-embedding-3-large, Voyage 3, Cohere Embed v3) kosten 0,05–0,15 € pro Million Tokens. Open-Weights-Optionen (Jina V3, BGE, MxBai) kosten auf eigener Infrastruktur faktisch nichts. Ein typischer RAG-Korpus von 10 Mio. Tokens (rund 20.000 Dokumente) kostet einmalige 0,50–1,50 € zum Embedden. Das Neu-Embedden bei jedem Modell-Upgrade ist der eigentliche Long-Tail-Kostenfaktor.

Der Trade-off heisst Dimension, Recall und Preis. Höherdimensionale Embeddings (3.072 oder 4.096 Dimensionen) erfassen mehr Nuance, kosten aber mehr beim Speichern und Suchen. Niedrigerdimensionale Modelle (256–768 Dimensionen) kosten zehnmal weniger und finden bei den meisten Workloads das richtige Dokument in 90–95 % der Fälle. Nimm das High-Dim-Flagship, wenn die Retrieval-Qualität geschäftskritisch ist (juristische Suche, medizinische Q&A); nimm ein Budget-Modell, wenn du den gelegentlichen verfehlten Treffer tolerieren kannst.

Achte auf die Chunk-Grösse: Die meisten Embedding-Modelle arbeiten am besten mit Chunks von 200–500 Tokens. Embeddest du ein ganzes 50-Seiten-Dokument als einen Vektor, verlierst du die Bedeutung pro Abschnitt. Embeddest du zu klein (unter 50 Tokens), werden einzelne Chunks verrauscht. Wähle einen Chunker, der Absatzgrenzen respektiert und eine kleine Überlappung (10–20 %) zwischen Chunks setzt.

Achte auf den mehrsprachigen Mismatch: Nicht jedes Embedding-Modell spricht jede Sprache gleich gut. Wenn dein Korpus mehrsprachig ist, wähle ein Modell, dessen Trainingsdaten deine Sprachen abdecken — Jina V3, Cohere Multilingual und Voyage Multilingual sind die sicheren Defaults.

Die Top-Picks oben decken das Recall-Flagship, das günstigste Produktiv-Modell, die höchstdimensionale Option und den schnellsten Indexer ab.

Related comparisons

Side-by-side reviews of the most-compared models in this category.

Frequently asked questions

Start Building with AI

Access all models through a single API. Get free credits when you sign up — no credit card required.