Embeddings
Semantic search and vector representations for AI applications
Modele embeddingowe do wyszukiwania semantycznego, RAG i klastrowania
Modele embeddingowe zamieniają tekst — albo czasem obrazy, kod lub audio — w wektor liczb zmiennoprzecinkowych o stałej długości. Podobne inputy lądują blisko siebie w przestrzeni embeddingów, niepodobne daleko. Po embeddingi sięgaj, budując wyszukiwanie semantyczne, retrieval-augmented generation (RAG), rekomendacje albo klastrowanie.
7 models available
Text Embedding 3 Large
OpenAI's most powerful embedding model. 3072 dimensions for maximum accuracy.
Voyage AI voyage-3
Voyage's general-purpose embedding model. 1024 dims, 32k context, strong retrieval performance.
Cohere embed-multilingual-v3
Cohere's multilingual embedding model. Supports 100+ languages with separate search and classification modes.
Jina Embeddings v3 (Multilingual)
Jina's frontier multilingual embedding model. 570M params, 8192 ctx, 89 languages, Matryoshka dims 128-1024.
mxbai-embed-large-v1
Mixedbread's open-source 335M embedding model. Top MTEB benchmark for English retrieval at release.
Text Embedding 3 Small
OpenAI's compact embedding model. 1536 dimensions, great for semantic search and RAG.
Voyage AI voyage-code-3
Voyage's code-specialized embedding model. Up to 32k context, Matryoshka 256-2048 dims, int8/binary support.
Top embeddings picks
Hand-picked across four common criteria — resolved against the live catalog so the picks track price and performance changes.
OpenAI's most powerful embedding model. 3072 dimensions for maximum accuracy.
Learn moreJina's frontier multilingual embedding model. 570M params, 8192 ctx, 89 languages, Matryoshka dims 128-1024.
Learn moreVoyage's general-purpose embedding model. 1024 dims, 32k context, strong retrieval performance.
Learn moreOpenAI's compact embedding model. 1536 dimensions, great for semantic search and RAG.
Learn moreCennik jest za token, podobnie jak w generowaniu tekstu, ale zwykle 10-100× tańszy. Modele flagship (OpenAI text-embedding-3-large, Voyage 3, Cohere Embed v3) kosztują €0,05-€0,15 za milion tokenów. Opcje open-weights (Jina V3, BGE, MxBai) kosztują praktycznie nic do uruchomienia na własnej infrastrukturze. Typowy korpus RAG 10 milionów tokenów (około 20 000 dokumentów) kosztuje €0,50-€1,50, by raz go embedować. Re-embedding przy każdej aktualizacji modelu to główny koszt long-tail.
Kompromis to wymiar, recall i cena. Wyższe wymiarowo embeddingi (3 072 lub 4 096 dim) łapią więcej niuansów, ale kosztują więcej w przechowywaniu i przeszukiwaniu. Modele niższych wymiarów (256-768 dim) kosztują dziesięć razy mniej i wciąż wyłapują właściwy dokument w 90-95% przypadków w większości obciążeń. Używaj wysokowymiarowego flagshipa, gdy jakość retrievalu jest krytyczna (wyszukiwanie prawne, medyczne Q&A); używaj modelu budżetowego, gdy możesz tolerować okazjonalne pominięcie.
Uwaga na rozmiar chunków: większość modeli embeddingowych pracuje najlepiej na chunkach 200-500 tokenów. Embedowanie 50-stronicowego dokumentu jako jednego wektora gubi znaczenie sekcyjne. Embedowanie zbyt drobno (poniżej 50 tokenów) sprawia, że pojedyncze chunki stają się zaszumione. Wybierz chunker, który szanuje granice akapitów i dodaje niewielkie zachodzenie (10-20%) między chunkami.
Uwaga na niedopasowanie wielojęzyczne: nie każdy model embeddingowy mówi tak samo w każdym języku. Jeśli twój korpus jest wielojęzyczny, wybierz model, którego dane treningowe pokrywają twoje języki — Jina V3, Cohere Multilingual i Voyage Multilingual to bezpieczne defaulty.
Top picks powyżej obejmują flagship o najwyższym recallu, najtańszy model produkcyjny, opcję o najwyższych wymiarach i najszybszy indeksator.
Popular use cases
Common patterns built with embeddings on Railwail.
Related comparisons
Side-by-side reviews of the most-compared models in this category.
Frequently asked questions
Start Building with AI
Access all models through a single API. Get free credits when you sign up — no credit card required.