Embeddings
Semantic search and vector representations for AI applications
Modelos de embeddings para búsqueda semántica, RAG y clustering
Los modelos de embeddings convierten texto — o a veces imágenes, código o audio — en un vector de números en coma flotante de longitud fija. Las entradas similares acaban cerca unas de otras en el espacio de embedding, las distintas acaban lejos. Recurres a embeddings cuando construyes búsqueda semántica, generación aumentada por recuperación (RAG), recomendaciones o clustering.
7 models available
Text Embedding 3 Large
OpenAI's most powerful embedding model. 3072 dimensions for maximum accuracy.
Voyage AI voyage-3
Voyage's general-purpose embedding model. 1024 dims, 32k context, strong retrieval performance.
Cohere embed-multilingual-v3
Cohere's multilingual embedding model. Supports 100+ languages with separate search and classification modes.
Jina Embeddings v3 (Multilingual)
Jina's frontier multilingual embedding model. 570M params, 8192 ctx, 89 languages, Matryoshka dims 128-1024.
mxbai-embed-large-v1
Mixedbread's open-source 335M embedding model. Top MTEB benchmark for English retrieval at release.
Text Embedding 3 Small
OpenAI's compact embedding model. 1536 dimensions, great for semantic search and RAG.
Voyage AI voyage-code-3
Voyage's code-specialized embedding model. Up to 32k context, Matryoshka 256-2048 dims, int8/binary support.
Top embeddings picks
Hand-picked across four common criteria — resolved against the live catalog so the picks track price and performance changes.
OpenAI's most powerful embedding model. 3072 dimensions for maximum accuracy.
Learn moreJina's frontier multilingual embedding model. 570M params, 8192 ctx, 89 languages, Matryoshka dims 128-1024.
Learn moreVoyage's general-purpose embedding model. 1024 dims, 32k context, strong retrieval performance.
Learn moreOpenAI's compact embedding model. 1536 dimensions, great for semantic search and RAG.
Learn moreLa tarificación es por token, similar a la generación de texto pero típicamente 10-100× más barata. Los modelos punteros (OpenAI text-embedding-3-large, Voyage 3, Cohere Embed v3) cuestan 0,05-0,15 € por millón de tokens. Las opciones de pesos abiertos (Jina V3, BGE, MxBai) cuestan efectivamente nada si las corres en tu propia infraestructura. Un corpus RAG típico de 10 millones de tokens (unos 20 000 documentos) cuesta 0,50-1,50 € para embebeer una vez. El re-embebido en cada actualización de modelo es el principal coste recurrente.
El compromiso es dimensión, recall y precio. Los embeddings de mayor dimensión (3 072 o 4 096 dims) capturan más matiz pero cuestan más almacenarlos y buscarlos. Los modelos de menor dimensión (256-768 dims) cuestan diez veces menos y aun así recuperan el documento correcto el 90-95 % de las veces en la mayoría de cargas. Usa el puntero de alta dimensión cuando la calidad de recuperación es crítica (búsqueda legal, Q&A médico); usa un modelo económico cuando puedas tolerar algún resultado perdido ocasional.
Cuidado con el tamaño de los chunks: la mayoría de los modelos de embeddings rinden mejor en chunks de 200-500 tokens. Embebeer un documento entero de 50 páginas como un solo vector pierde el significado por sección. Embebeer demasiado pequeño (por debajo de 50 tokens) hace que los chunks individuales se vuelvan ruido. Elige un chunker que respete los límites de párrafo y añade un pequeño solapamiento (10-20 %) entre chunks.
Cuidado con el desajuste multilingüe: no todos los modelos de embeddings hablan todos los idiomas por igual. Si tu corpus es multilingüe, elige un modelo cuyos datos de entrenamiento cubran tus idiomas — Jina V3, Cohere Multilingual y Voyage Multilingual son los valores por defecto seguros.
Las selecciones principales arriba cubren el puntero de mayor recall, el modelo de producción más barato, la opción de mayor dimensión y el indexador más rápido.
Popular use cases
Common patterns built with embeddings on Railwail.
Related comparisons
Side-by-side reviews of the most-compared models in this category.
Frequently asked questions
Start Building with AI
Access all models through a single API. Get free credits when you sign up — no credit card required.