Embeddings
Semantic search and vector representations for AI applications
Embedding-Modelle für semantische Suche, RAG und Clustering
Embedding-Modelle verwandeln Text — oder manchmal Bilder, Code oder Audio — in einen Vektor fester Länge aus Fließkommazahlen. Ähnliche Eingaben landen im Embedding-Raum nah beieinander, unähnliche weit voneinander entfernt. Du greifst zu Embeddings, wenn du semantische Suche, Retrieval-Augmented Generation (RAG), Empfehlungen oder Clustering baust.
7 models available
Text Embedding 3 Large
OpenAI's most powerful embedding model. 3072 dimensions for maximum accuracy.
Voyage AI voyage-3
Voyage's general-purpose embedding model. 1024 dims, 32k context, strong retrieval performance.
Cohere embed-multilingual-v3
Cohere's multilingual embedding model. Supports 100+ languages with separate search and classification modes.
Jina Embeddings v3 (Multilingual)
Jina's frontier multilingual embedding model. 570M params, 8192 ctx, 89 languages, Matryoshka dims 128-1024.
mxbai-embed-large-v1
Mixedbread's open-source 335M embedding model. Top MTEB benchmark for English retrieval at release.
Text Embedding 3 Small
OpenAI's compact embedding model. 1536 dimensions, great for semantic search and RAG.
Voyage AI voyage-code-3
Voyage's code-specialized embedding model. Up to 32k context, Matryoshka 256-2048 dims, int8/binary support.
Top embeddings picks
Hand-picked across four common criteria — resolved against the live catalog so the picks track price and performance changes.
OpenAI's most powerful embedding model. 3072 dimensions for maximum accuracy.
Learn moreJina's frontier multilingual embedding model. 570M params, 8192 ctx, 89 languages, Matryoshka dims 128-1024.
Learn moreVoyage's general-purpose embedding model. 1024 dims, 32k context, strong retrieval performance.
Learn moreOpenAI's compact embedding model. 1536 dimensions, great for semantic search and RAG.
Learn moreDie Abrechnung läuft pro Token, ähnlich wie bei Textgenerierung, aber typischerweise 10–100× günstiger. Flagship-Modelle (OpenAI text-embedding-3-large, Voyage 3, Cohere Embed v3) kosten 0,05–0,15 € pro Million Tokens. Open-Weights-Optionen (Jina V3, BGE, MxBai) kosten auf eigener Infrastruktur faktisch nichts. Ein typischer RAG-Korpus von 10 Mio. Tokens (rund 20.000 Dokumente) kostet einmalige 0,50–1,50 € zum Embedden. Das Neu-Embedden bei jedem Modell-Upgrade ist der eigentliche Long-Tail-Kostenfaktor.
Der Trade-off heißt Dimension, Recall und Preis. Höherdimensionale Embeddings (3.072 oder 4.096 Dimensionen) erfassen mehr Nuance, kosten aber mehr beim Speichern und Suchen. Niedrigerdimensionale Modelle (256–768 Dimensionen) kosten zehnmal weniger und finden bei den meisten Workloads das richtige Dokument in 90–95 % der Fälle. Nimm das High-Dim-Flagship, wenn die Retrieval-Qualität geschäftskritisch ist (juristische Suche, medizinische Q&A); nimm ein Budget-Modell, wenn du den gelegentlichen verfehlten Treffer tolerieren kannst.
Achte auf die Chunk-Größe: Die meisten Embedding-Modelle arbeiten am besten mit Chunks von 200–500 Tokens. Embeddest du ein ganzes 50-Seiten-Dokument als einen Vektor, verlierst du die Bedeutung pro Abschnitt. Embeddest du zu klein (unter 50 Tokens), werden einzelne Chunks verrauscht. Wähle einen Chunker, der Absatzgrenzen respektiert und eine kleine Überlappung (10–20 %) zwischen Chunks setzt.
Achte auf den mehrsprachigen Mismatch: Nicht jedes Embedding-Modell spricht jede Sprache gleich gut. Wenn dein Korpus mehrsprachig ist, wähle ein Modell, dessen Trainingsdaten deine Sprachen abdecken — Jina V3, Cohere Multilingual und Voyage Multilingual sind die sicheren Defaults.
Die Top-Picks oben decken das Recall-Flagship, das günstigste Produktiv-Modell, die höchstdimensionale Option und den schnellsten Indexer ab.
Popular use cases
Common patterns built with embeddings on Railwail.
Related comparisons
Side-by-side reviews of the most-compared models in this category.
Frequently asked questions
Start Building with AI
Access all models through a single API. Get free credits when you sign up — no credit card required.