Embeddings

Semantic search and vector representations for AI applications

Modelli embedding per ricerca semantica, RAG e clustering

I modelli embedding trasformano testo — o a volte immagini, codice o audio — in un vettore di numeri in virgola mobile di lunghezza fissa. Input simili finiscono vicini nello spazio degli embedding, input dissimili lontani. Si ricorre agli embedding per costruire ricerca semantica, retrieval-augmented generation (RAG), raccomandazioni o clustering.

Top embeddings picks

Hand-picked across four common criteria — resolved against the live catalog so the picks track price and performance changes.

Migliore in assoluto
Text Embedding 3 Large

OpenAI's most powerful embedding model. 3072 dimensions for maximum accuracy.

Learn more
Più economico
Jina Embeddings v3 (Multilingual)

Jina's frontier multilingual embedding model. 570M params, 8192 ctx, 89 languages, Matryoshka dims 128-1024.

Learn more
Dimensioni più alte
Voyage AI voyage-3

Voyage's general-purpose embedding model. 1024 dims, 32k context, strong retrieval performance.

Learn more
Più veloce
Text Embedding 3 Small

OpenAI's compact embedding model. 1536 dimensions, great for semantic search and RAG.

Learn more

Il pricing è per token, simile alla generazione di testo ma tipicamente 10-100× più economico. I modelli flagship (OpenAI text-embedding-3-large, Voyage 3, Cohere Embed v3) costano €0,05-€0,15 per milione di token. Le opzioni open-weights (Jina V3, BGE, MxBai) costano sostanzialmente zero da far girare sulla propria infrastruttura. Un corpus RAG tipico di 10 milioni di token (circa 20.000 documenti) costa €0,50-€1,50 da embeddare una volta. Il ri-embedding a ogni upgrade del modello è il principale costo long-tail.

Il compromesso è dimensione, recall e prezzo. Embedding a dimensione più alta (3.072 o 4.096 dim) catturano più sfumature ma costano di più da memorizzare e cercare. I modelli a dimensione più bassa (256-768 dim) costano dieci volte meno e recuperano comunque il documento giusto il 90-95% delle volte nella maggior parte dei carichi di lavoro. Usate il flagship ad alta dimensione quando la qualità del retrieval è mission-critical (ricerca legale, Q&A medico); usate un modello economico quando potete tollerare il risultato mancato occasionale.

Attenzione alla dimensione dei chunk: la maggior parte dei modelli embedding rende meglio su chunk di 200-500 token. Embeddare un intero documento di 50 pagine come un singolo vettore fa perdere il significato per sezione. Embeddare troppo piccolo (sotto i 50 token) e i singoli chunk diventano rumorosi. Scegliete un chunker che rispetti i confini dei paragrafi e aggiunga una piccola sovrapposizione (10-20%) tra chunk.

Attenzione al mismatch multilingue: non tutti i modelli embedding parlano ogni lingua allo stesso modo. Se il vostro corpus è multilingue, scegliete un modello i cui dati di training coprano le vostre lingue — Jina V3, Cohere Multilingual e Voyage Multilingual sono i default sicuri.

Le top picks qui sopra coprono il flagship con il recall più alto, il modello di produzione più economico, l'opzione a dimensione più alta e l'indicizzatore più veloce.

Related comparisons

Side-by-side reviews of the most-compared models in this category.

Frequently asked questions

Start Building with AI

Access all models through a single API. Get free credits when you sign up — no credit card required.