Embeddings
Semantic search and vector representations for AI applications
Embedding-modellen voor semantisch zoeken, RAG en clustering
Embedding-modellen zetten tekst — of soms afbeeldingen, code of audio — om in een vector met vaste lengte van floating-pointgetallen. Vergelijkbare invoer landt dicht bij elkaar in de embeddingruimte, ongelijksoortige invoer ver uit elkaar. Je grijpt naar embeddings bij het bouwen van semantisch zoeken, retrieval-augmented generation (RAG), aanbevelingen of clustering.
7 models available
Text Embedding 3 Large
OpenAI's most powerful embedding model. 3072 dimensions for maximum accuracy.
Voyage AI voyage-3
Voyage's general-purpose embedding model. 1024 dims, 32k context, strong retrieval performance.
Cohere embed-multilingual-v3
Cohere's multilingual embedding model. Supports 100+ languages with separate search and classification modes.
Jina Embeddings v3 (Multilingual)
Jina's frontier multilingual embedding model. 570M params, 8192 ctx, 89 languages, Matryoshka dims 128-1024.
mxbai-embed-large-v1
Mixedbread's open-source 335M embedding model. Top MTEB benchmark for English retrieval at release.
Text Embedding 3 Small
OpenAI's compact embedding model. 1536 dimensions, great for semantic search and RAG.
Voyage AI voyage-code-3
Voyage's code-specialized embedding model. Up to 32k context, Matryoshka 256-2048 dims, int8/binary support.
Top embeddings picks
Hand-picked across four common criteria — resolved against the live catalog so the picks track price and performance changes.
OpenAI's most powerful embedding model. 3072 dimensions for maximum accuracy.
Learn moreJina's frontier multilingual embedding model. 570M params, 8192 ctx, 89 languages, Matryoshka dims 128-1024.
Learn moreVoyage's general-purpose embedding model. 1024 dims, 32k context, strong retrieval performance.
Learn moreOpenAI's compact embedding model. 1536 dimensions, great for semantic search and RAG.
Learn moreDe prijs is per token, vergelijkbaar met tekstgeneratie maar doorgaans 10-100× goedkoper. Flagship-modellen (OpenAI text-embedding-3-large, Voyage 3, Cohere Embed v3) kosten €0,05-€0,15 per miljoen tokens. Open-weights opties (Jina V3, BGE, MxBai) kosten in de praktijk niets als je ze op eigen infrastructuur draait. Een typische RAG-corpus van 10 miljoen tokens (rond 20.000 documenten) kost €0,50-€1,50 om eenmalig te embedden. Opnieuw embedden bij elke modelupgrade is de belangrijkste long-tail-kost.
De afweging is dimensie, recall en prijs. Hogerdimensionele embeddings (3.072 of 4.096 dim) vangen meer nuance maar kosten meer in opslag en zoeken. Lagerdimensionele modellen (256-768 dim) kosten tien keer minder en vinden in de meeste werklasten nog steeds 90-95% van de tijd het juiste document. Gebruik het hoge-dim-flagship wanneer retrievalkwaliteit mission-critical is (juridisch zoeken, medische Q&A); gebruik een budgetmodel wanneer je af en toe een gemist resultaat kan tolereren.
Pas op met chunkgrootte: de meeste embeddingmodellen presteren het best op chunks van 200-500 tokens. Een document van 50 pagina's als één vector embedden vernietigt de betekenis per sectie. Te klein embedden (onder 50 tokens) maakt individuele chunks ruizig. Kies een chunker die alinea-grenzen respecteert en een kleine overlap (10-20%) tussen chunks toevoegt.
Pas op met meertalige mismatch: niet elk embeddingmodel spreekt elke taal even goed. Als je corpus meertalig is, kies een model waarvan de trainingsdata jouw talen dekt — Jina V3, Cohere Multilingual en Voyage Multilingual zijn de veilige defaults.
De topkeuzes hierboven dekken het hoogste-recall-flagship, het goedkoopste productiemodel, de optie met de hoogste dimensies en de snelste indexer.
Popular use cases
Common patterns built with embeddings on Railwail.
Related comparisons
Side-by-side reviews of the most-compared models in this category.
Frequently asked questions
Start Building with AI
Access all models through a single API. Get free credits when you sign up — no credit card required.