Welk LLM is het goedkoopst op Railwail?

Modellen als Gemini Flash, GPT-5 Mini, Claude Haiku en DeepSeek V3 zitten aan de onderkant — meestal enkele centen per miljoen input-tokens. De exacte rangorde verandert bij elke prijsupdate van een provider, dus sorteer het modelraster hierboven op input-kosten om de actueel goedkoopste optie te zien.

Welk model heeft het langste contextvenster?

Gemini 2.5 Pro staat momenteel bovenaan met vensters van 2M tokens, gevolgd door Claude 4.6 (1M tokens) en GPT-5 (rond 400K tokens). Voor de meeste werklasten is 128K ruim voldoende; gebruik de long-context-tier alleen wanneer je echt een hele codebase of onderzoeksartikel in één prompt moet lezen.

Open source of proprietary — wat moet ik kiezen?

Open-weights modellen (Llama 3, Qwen, DeepSeek, Mistral, Mixtral) lopen snel in en winnen op prijs-per-token en datasoevereiniteit. Proprietary flagships zijn nog altijd toonaangevend op redeneren, meertalige dekking en betrouwbaarheid van tool-use. Wie kostenbewust is of self-hosting nodig heeft, begint met open. Wie naar eindgebruikers levert, begint met proprietary en optimaliseert daarna naar beneden.

GPT-5 vs Claude 4.6 — welk is beter?

GPT-5 leidt op ruwe benchmarkscores, wiskunde en codegeneratie; Claude 4.6 leidt op longform-schrijven, nuance bij het opvolgen van instructies en de kalibratie van de refusal rate. Beide blijven op de meeste taken binnen 5% van elkaar. Voer ze naast elkaar uit op je echte prompts op /compare/gpt-5-vs-claude-4-6 — de verschillen zijn workload-specifiek.

Hoe wissel ik van model in mijn code?

Railwail is OpenAI-compatibel: je verandert alleen de `model`-parameter. Hetzelfde endpoint, dezelfde SDK, dezelfde request body. Probeer een nieuw model in productie door 10% van het verkeer er een week heen te routeren en kwaliteit, latency en kosten in het dashboard te vergelijken.

Wordt JSON-modus ondersteund?

Ja — geef `response_format: { type: 'json_object' }` mee aan elk model dat gestructureerde output ondersteunt. Voor strakkere typing gebruik je `json_schema` met een Zod- of Pydantic-definitie. Ongeveer 80% van de tekstmodellen op Railwail ondersteunt één van beide of beide modes; de detailpagina van het model vermeldt wat elk model accepteert.

Ondersteunt Railwail streaming?

Elk tekstmodel op Railwail ondersteunt server-sent-event streaming via de standaard `stream: true`-parameter. De latency tot het eerste token is doorgaans 200-800ms afhankelijk van model en regio. Annuleer een stream door de verbinding te sluiten — je betaalt alleen voor de tokens die daadwerkelijk zijn gegenereerd.

Is de API AVG/GDPR-compliant?

Ja. Railwail verwerkt verkeer in EU-datacenters, sluit een verwerkersovereenkomst met elke betalende klant en traint nooit op je prompts. Individuele providers hebben hun eigen residency-garanties — de detailpagina van het model toont de databehandeling per provider zodat je er een kunt kiezen die past bij je compliance-positie.

Text & Chat Models

Powerful language models for conversation, analysis, and content generation

Tekst- en chatmodellen voor AI-werklasten in productie

Large language models zijn het werkpaard van moderne AI: chatbots, agents, samenvatters, classificaties en vertalers. De categorie is de drukst bevolkte op Railwail — OpenAI, Anthropic, Google, Mistral, Meta, DeepSeek, xAI en tientallen open-weights labs strijden hier mee.

All Text & Chat Image Video Audio Text-to-Speech Speech-to-Text Embeddings Code Multimodal Robotics / VLA

49 models available

Bio_ClinicalBERT

Text & Chathuggingface

Popular

The original Bio_ClinicalBERT from Alsentzer et al., a BERT model initialized from BioBERT and further pretrained on all MIMIC-III clinical notes. Served as a fill-mask endpoint it predicts masked tokens in clinical text and produces clinical embeddings. It is the standard encoder backbone behind many downstream clinical NLP fine-tunes.

€1.00

medicalresearchnlp

Biomedical NER (all entities)

Text & Chathuggingface

Popular

Token-classification model from d4data that tags 84 biomedical entity types in clinical and medical text, including disease, sign, symptom, medication, dosage, lab value, body part and procedure. Trained on the Maccrobat clinical case corpus on a DistilBERT base, so it runs cheaply for high-volume tagging.

€1.00

medicalresearchnlp

Claude Opus 4

Text & ChatAnthropic

NewPopular

Anthropic's most powerful model. Exceptional at complex analysis, agentic tasks, and extended reasoning.

Free5.0s

flagshipreasoningagentic

Claude Opus 4.8

Text & ChatAnthropic

NewPopular

Anthropic's most capable Opus-tier model. State of the art on long-horizon agentic work, coding and knowledge tasks, with a 1M-token context window at standard pricing.

Text & Chat Models

Tekst- en chatmodellen voor AI-werklasten in productie

Bio_ClinicalBERT

Biomedical NER (all entities)

Claude Opus 4

Claude Opus 4.8

Claude Sonnet 4

DeepSeek V3.1

DeepSeek V4 Pro

Gemini 2.0 Flash

Gemini 2.5 Pro

GPT-4.1

GPT-4o

GPT-5.5

Grok 4

Grok 4.20 Reasoning

Kimi K2 (Moonshot)

Medical NER (DeBERTa)

MiniMax-01

o3-mini

Perplexity Sonar Pro

AI21 Jamba 1.5 Large

AI21 Jamba 1.5 Mini

BioBERT Disease NER (NCBI)

Claude Haiku 3.5

Clinical Assertion and Negation BERT

Clinical NER (problem, test, treatment)

Cohere Aya 23 35B

Cohere Command Light (legacy)

Cohere Command R (08-2024)

Cohere Command R+ (08-2024)

DeepSeek R1

DeepSeek V3

DeepSeek V4 Flash

GPT-4o Mini

GPT-5 Mini

GPT-5.1

Grok 3

Grok 4.20 (Non-Reasoning)

Grok 4.20 Multi-Agent

Llama 3.3 70B

Mistral Large

OpenAI o3

OpenAI o4-mini

Perplexity Sonar

Perplexity Sonar Reasoning

Qwen 2.5 72B

Qwen 2.5-Max

SeamlessM4T v2 Large (Text)

Snowflake Arctic Instruct

Yi Large

Top text & chat models picks

Popular use cases

Related comparisons

Gemini 2.5 Pro vs GPT-5

DeepSeek V3 vs GPT-5 Mini

Frequently asked questions