Embeddings

Semantic search and vector representations for AI applications

Modelos de embeddings para pesquisa semântica, RAG e clustering

Os modelos de embeddings transformam texto — ou por vezes imagens, código ou áudio — num vetor de comprimento fixo de números em vírgula flutuante. Inputs semelhantes ficam próximos no espaço de embeddings, inputs diferentes ficam longe. Recorra a embeddings para construir pesquisa semântica, retrieval-augmented generation (RAG), recomendações ou clustering.

Top embeddings picks

Hand-picked across four common criteria — resolved against the live catalog so the picks track price and performance changes.

Melhor no global
Text Embedding 3 Large

OpenAI's most powerful embedding model. 3072 dimensions for maximum accuracy.

Learn more
Mais barato
Jina Embeddings v3 (Multilingual)

Jina's frontier multilingual embedding model. 570M params, 8192 ctx, 89 languages, Matryoshka dims 128-1024.

Learn more
Dimensões mais altas
Voyage AI voyage-3

Voyage's general-purpose embedding model. 1024 dims, 32k context, strong retrieval performance.

Learn more
Mais rápido
Text Embedding 3 Small

OpenAI's compact embedding model. 1536 dimensions, great for semantic search and RAG.

Learn more

O pricing é por token, semelhante à geração de texto mas tipicamente 10-100× mais barato. Os modelos flagship (OpenAI text-embedding-3-large, Voyage 3, Cohere Embed v3) custam €0,05-€0,15 por milhão de tokens. As opções open-weights (Jina V3, BGE, MxBai) custam praticamente nada se as fizer correr na sua própria infraestrutura. Um corpus RAG típico de 10 milhões de tokens (cerca de 20.000 documentos) custa €0,50-€1,50 para fazer embedding uma vez. O re-embedding a cada upgrade de modelo é o principal custo a longo prazo.

O compromisso é dimensão, recall e preço. Embeddings de dimensão maior (3.072 ou 4.096 dim) captam mais nuance mas custam mais a armazenar e a pesquisar. Os modelos de dimensão menor (256-768 dim) custam dez vezes menos e ainda recuperam o documento certo 90-95% das vezes na maior parte das cargas. Use o flagship de dimensão alta quando a qualidade do retrieval for missão crítica (pesquisa jurídica, Q&A médica); use um modelo económico quando puder tolerar o resultado ocasional em falta.

Atenção ao tamanho dos chunks: a maior parte dos modelos de embeddings rende melhor em chunks de 200-500 tokens. Fazer embedding de um documento inteiro de 50 páginas como um único vetor faz perder o significado por secção. Fazer embedding demasiado pequeno (abaixo de 50 tokens) torna os chunks individuais ruidosos. Escolha um chunker que respeite as fronteiras de parágrafo e adicione uma pequena sobreposição (10-20%) entre chunks.

Atenção ao mismatch multilingue: nem todos os modelos de embeddings falam todas as línguas com a mesma competência. Se o corpus é multilingue, escolha um modelo cujos dados de treino cubram as suas línguas — Jina V3, Cohere Multilingual e Voyage Multilingual são os defaults seguros.

As top picks acima cobrem o flagship de maior recall, o modelo de produção mais barato, a opção de dimensão mais alta e o indexador mais rápido.

Related comparisons

Side-by-side reviews of the most-compared models in this category.

Frequently asked questions

Start Building with AI

Access all models through a single API. Get free credits when you sign up — no credit card required.