Qual é o LLM mais barato no Railwail?

Modelos como Gemini Flash, GPT-5 Mini, Claude Haiku e DeepSeek V3 estão no patamar mais baixo — tipicamente uns cêntimos por milhão de tokens em input. A ordenação exata muda a cada atualização de preço de fornecedor, por isso ordene a grelha de modelos acima por custo de input para ver a opção mais barata em cada momento.

Que modelo tem a janela de contexto mais longa?

O Gemini 2.5 Pro lidera atualmente com janelas de 2M tokens, seguido pelo Claude 4.6 (1M tokens) e pelo GPT-5 (cerca de 400K tokens). Para a maior parte das cargas, 128K chegam e sobram; recorra ao tier de contexto longo apenas quando precisar mesmo de ler uma codebase ou um artigo de investigação inteiro num único prompt.

Open source ou proprietário — o que escolher?

Os modelos open-weights (Llama 3, Qwen, DeepSeek, Mistral, Mixtral) estão a recuperar terreno rapidamente e ganham em preço-por-token e soberania dos dados. Os flagships proprietários ainda lideram no raciocínio, cobertura multilingue e fiabilidade no uso de ferramentas. Se for sensível ao custo ou precisar de self-hosting, comece pelo open. Se vai distribuir a utilizadores finais, comece pelo proprietário e otimize depois para baixo.

GPT-5 vs Claude 4.6 — qual é melhor?

O GPT-5 lidera em pontuações de benchmark brutas, matemática e geração de código; o Claude 4.6 lidera em escrita longform, na finura ao seguir instruções e na calibração da taxa de recusa. Ambos ficam a 5% um do outro na maioria das tarefas. Execute-os lado a lado nos seus prompts reais em /compare/gpt-5-vs-claude-4-6 — as diferenças dependem da carga de trabalho.

Como mudo de modelo no meu código?

O Railwail é compatível com a OpenAI: mude apenas o parâmetro `model`. Mesmo endpoint, mesmo SDK, mesmo corpo do request. Experimente um novo modelo em produção encaminhando 10% do tráfego para ele durante uma semana e compare qualidade, latência e custo no dashboard.

O modo JSON é suportado?

Sim — passe `response_format: { type: 'json_object' }` em qualquer modelo que suporte saída estruturada. Para tipagem mais estrita, use `json_schema` com uma definição em Zod ou Pydantic. Cerca de 80% dos modelos de texto no Railwail suportam um ou ambos os modos; a página de detalhe do modelo indica o que cada um aceita.

O Railwail suporta streaming?

Todos os modelos de texto no Railwail suportam streaming via server-sent-events através do parâmetro padrão `stream: true`. A latência até ao primeiro token é tipicamente de 200-800ms, conforme o modelo e a região. Cancele um stream fechando a ligação — só paga pelos tokens efetivamente gerados.

A API é compatível com o RGPD?

Sim. O Railwail processa tráfego em data centers da UE, assina um DPA com cada cliente pagante e nunca treina sobre os seus prompts. Cada fornecedor tem as suas próprias garantias de residência — a página de detalhe do modelo lista a gestão de dados por fornecedor, para que possa escolher um que se ajuste à sua postura de compliance.

Text & Chat Models

Powerful language models for conversation, analysis, and content generation

Modelos de texto e chat para cargas de trabalho de IA em produção

Os large language models são o cavalo de trabalho da IA moderna: chatbots, agentes, resumidores, classificadores, tradutores. É a categoria mais concorrida no Railwail — OpenAI, Anthropic, Google, Mistral, Meta, DeepSeek, xAI e dezenas de laboratórios open-weights competem aqui.

All Text & Chat Image Video Audio Text-to-Speech Speech-to-Text Embeddings Code Multimodal Robotics / VLA

49 models available

Bio_ClinicalBERT

Text & Chathuggingface

Popular

The original Bio_ClinicalBERT from Alsentzer et al., a BERT model initialized from BioBERT and further pretrained on all MIMIC-III clinical notes. Served as a fill-mask endpoint it predicts masked tokens in clinical text and produces clinical embeddings. It is the standard encoder backbone behind many downstream clinical NLP fine-tunes.

€1.00

medicalresearchnlp

Biomedical NER (all entities)

Text & Chathuggingface

Popular

Token-classification model from d4data that tags 84 biomedical entity types in clinical and medical text, including disease, sign, symptom, medication, dosage, lab value, body part and procedure. Trained on the Maccrobat clinical case corpus on a DistilBERT base, so it runs cheaply for high-volume tagging.

€1.00

medicalresearchnlp

Claude Opus 4

Text & ChatAnthropic

NewPopular

Anthropic's most powerful model. Exceptional at complex analysis, agentic tasks, and extended reasoning.

Free5.0s

flagshipreasoningagentic

Claude Opus 4.8

Text & ChatAnthropic

NewPopular

Anthropic's most capable Opus-tier model. State of the art on long-horizon agentic work, coding and knowledge tasks, with a 1M-token context window at standard pricing.

Text & Chat Models

Modelos de texto e chat para cargas de trabalho de IA em produção

Bio_ClinicalBERT

Biomedical NER (all entities)

Claude Opus 4

Claude Opus 4.8

Claude Sonnet 4

DeepSeek V3.1

DeepSeek V4 Pro

Gemini 2.0 Flash

Gemini 2.5 Pro

GPT-4.1

GPT-4o

GPT-5.5

Grok 4

Grok 4.20 Reasoning

Kimi K2 (Moonshot)

Medical NER (DeBERTa)

MiniMax-01

o3-mini

Perplexity Sonar Pro

AI21 Jamba 1.5 Large

AI21 Jamba 1.5 Mini

BioBERT Disease NER (NCBI)

Claude Haiku 3.5

Clinical Assertion and Negation BERT

Clinical NER (problem, test, treatment)

Cohere Aya 23 35B

Cohere Command Light (legacy)

Cohere Command R (08-2024)

Cohere Command R+ (08-2024)

DeepSeek R1

DeepSeek V3

DeepSeek V4 Flash

GPT-4o Mini

GPT-5 Mini

GPT-5.1

Grok 3

Grok 4.20 (Non-Reasoning)

Grok 4.20 Multi-Agent

Llama 3.3 70B

Mistral Large

OpenAI o3

OpenAI o4-mini

Perplexity Sonar

Perplexity Sonar Reasoning

Qwen 2.5 72B

Qwen 2.5-Max

SeamlessM4T v2 Large (Text)

Snowflake Arctic Instruct

Yi Large

Top text & chat models picks

Popular use cases

Related comparisons

Gemini 2.5 Pro vs GPT-5

DeepSeek V3 vs GPT-5 Mini

Frequently asked questions