Embeddings

Semantic search and vector representations for AI applications

Embedding-modellen voor semantisch zoeken, RAG en clustering

Embedding-modellen zetten tekst — of soms afbeeldingen, code of audio — om in een vector met vaste lengte van floating-pointgetallen. Vergelijkbare invoer landt dicht bij elkaar in de embeddingruimte, ongelijksoortige invoer ver uit elkaar. Je grijpt naar embeddings bij het bouwen van semantisch zoeken, retrieval-augmented generation (RAG), aanbevelingen of clustering.

Top embeddings picks

Hand-picked across four common criteria — resolved against the live catalog so the picks track price and performance changes.

Beste algemeen
Text Embedding 3 Large

OpenAI's most powerful embedding model. 3072 dimensions for maximum accuracy.

Learn more
Goedkoopst
Jina Embeddings v3 (Multilingual)

Jina's frontier multilingual embedding model. 570M params, 8192 ctx, 89 languages, Matryoshka dims 128-1024.

Learn more
Hoogste dimensies
Voyage AI voyage-3

Voyage's general-purpose embedding model. 1024 dims, 32k context, strong retrieval performance.

Learn more
Snelste
Text Embedding 3 Small

OpenAI's compact embedding model. 1536 dimensions, great for semantic search and RAG.

Learn more

De prijs is per token, vergelijkbaar met tekstgeneratie maar doorgaans 10-100× goedkoper. Flagship-modellen (OpenAI text-embedding-3-large, Voyage 3, Cohere Embed v3) kosten €0,05-€0,15 per miljoen tokens. Open-weights opties (Jina V3, BGE, MxBai) kosten in de praktijk niets als je ze op eigen infrastructuur draait. Een typische RAG-corpus van 10 miljoen tokens (rond 20.000 documenten) kost €0,50-€1,50 om eenmalig te embedden. Opnieuw embedden bij elke modelupgrade is de belangrijkste long-tail-kost.

De afweging is dimensie, recall en prijs. Hogerdimensionele embeddings (3.072 of 4.096 dim) vangen meer nuance maar kosten meer in opslag en zoeken. Lagerdimensionele modellen (256-768 dim) kosten tien keer minder en vinden in de meeste werklasten nog steeds 90-95% van de tijd het juiste document. Gebruik het hoge-dim-flagship wanneer retrievalkwaliteit mission-critical is (juridisch zoeken, medische Q&A); gebruik een budgetmodel wanneer je af en toe een gemist resultaat kan tolereren.

Pas op met chunkgrootte: de meeste embeddingmodellen presteren het best op chunks van 200-500 tokens. Een document van 50 pagina's als één vector embedden vernietigt de betekenis per sectie. Te klein embedden (onder 50 tokens) maakt individuele chunks ruizig. Kies een chunker die alinea-grenzen respecteert en een kleine overlap (10-20%) tussen chunks toevoegt.

Pas op met meertalige mismatch: niet elk embeddingmodel spreekt elke taal even goed. Als je corpus meertalig is, kies een model waarvan de trainingsdata jouw talen dekt — Jina V3, Cohere Multilingual en Voyage Multilingual zijn de veilige defaults.

De topkeuzes hierboven dekken het hoogste-recall-flagship, het goedkoopste productiemodel, de optie met de hoogste dimensies en de snelste indexer.

Related comparisons

Side-by-side reviews of the most-compared models in this category.

Frequently asked questions

Start Building with AI

Access all models through a single API. Get free credits when you sign up — no credit card required.