Embeddings
Semantic search and vector representations for AI applications
Modelli embedding per ricerca semantica, RAG e clustering
I modelli embedding trasformano testo — o a volte immagini, codice o audio — in un vettore di numeri in virgola mobile di lunghezza fissa. Input simili finiscono vicini nello spazio degli embedding, input dissimili lontani. Si ricorre agli embedding per costruire ricerca semantica, retrieval-augmented generation (RAG), raccomandazioni o clustering.
7 models available
Text Embedding 3 Large
OpenAI's most powerful embedding model. 3072 dimensions for maximum accuracy.
Voyage AI voyage-3
Voyage's general-purpose embedding model. 1024 dims, 32k context, strong retrieval performance.
Cohere embed-multilingual-v3
Cohere's multilingual embedding model. Supports 100+ languages with separate search and classification modes.
Jina Embeddings v3 (Multilingual)
Jina's frontier multilingual embedding model. 570M params, 8192 ctx, 89 languages, Matryoshka dims 128-1024.
mxbai-embed-large-v1
Mixedbread's open-source 335M embedding model. Top MTEB benchmark for English retrieval at release.
Text Embedding 3 Small
OpenAI's compact embedding model. 1536 dimensions, great for semantic search and RAG.
Voyage AI voyage-code-3
Voyage's code-specialized embedding model. Up to 32k context, Matryoshka 256-2048 dims, int8/binary support.
Top embeddings picks
Hand-picked across four common criteria — resolved against the live catalog so the picks track price and performance changes.
OpenAI's most powerful embedding model. 3072 dimensions for maximum accuracy.
Learn moreJina's frontier multilingual embedding model. 570M params, 8192 ctx, 89 languages, Matryoshka dims 128-1024.
Learn moreVoyage's general-purpose embedding model. 1024 dims, 32k context, strong retrieval performance.
Learn moreOpenAI's compact embedding model. 1536 dimensions, great for semantic search and RAG.
Learn moreIl pricing è per token, simile alla generazione di testo ma tipicamente 10-100× più economico. I modelli flagship (OpenAI text-embedding-3-large, Voyage 3, Cohere Embed v3) costano €0,05-€0,15 per milione di token. Le opzioni open-weights (Jina V3, BGE, MxBai) costano sostanzialmente zero da far girare sulla propria infrastruttura. Un corpus RAG tipico di 10 milioni di token (circa 20.000 documenti) costa €0,50-€1,50 da embeddare una volta. Il ri-embedding a ogni upgrade del modello è il principale costo long-tail.
Il compromesso è dimensione, recall e prezzo. Embedding a dimensione più alta (3.072 o 4.096 dim) catturano più sfumature ma costano di più da memorizzare e cercare. I modelli a dimensione più bassa (256-768 dim) costano dieci volte meno e recuperano comunque il documento giusto il 90-95% delle volte nella maggior parte dei carichi di lavoro. Usate il flagship ad alta dimensione quando la qualità del retrieval è mission-critical (ricerca legale, Q&A medico); usate un modello economico quando potete tollerare il risultato mancato occasionale.
Attenzione alla dimensione dei chunk: la maggior parte dei modelli embedding rende meglio su chunk di 200-500 token. Embeddare un intero documento di 50 pagine come un singolo vettore fa perdere il significato per sezione. Embeddare troppo piccolo (sotto i 50 token) e i singoli chunk diventano rumorosi. Scegliete un chunker che rispetti i confini dei paragrafi e aggiunga una piccola sovrapposizione (10-20%) tra chunk.
Attenzione al mismatch multilingue: non tutti i modelli embedding parlano ogni lingua allo stesso modo. Se il vostro corpus è multilingue, scegliete un modello i cui dati di training coprano le vostre lingue — Jina V3, Cohere Multilingual e Voyage Multilingual sono i default sicuri.
Le top picks qui sopra coprono il flagship con il recall più alto, il modello di produzione più economico, l'opzione a dimensione più alta e l'indicizzatore più veloce.
Popular use cases
Common patterns built with embeddings on Railwail.
Related comparisons
Side-by-side reviews of the most-compared models in this category.
Frequently asked questions
Start Building with AI
Access all models through a single API. Get free credits when you sign up — no credit card required.