Code Models
AI-powered coding assistants for development
Modelos de geração de código para autocomplete, review e refactor
Os modelos de geração de código são large language models treinados ou fine-tuned especificamente sobre código-fonte. Sustentam o autocomplete em IDE, a PR review, o refactoring automático, a geração de testes e a tradução entre linguagens. Recorre-se a um modelo de código — em vez de um modelo de texto genérico — quando se quer maior exatidão em tarefas de programação e outputs estruturados (diffs, JSON) que se integram bem com tooling para developers.
13 models available
Codestral
Mistral's code-specialized model. Optimized for code generation, completion, and understanding across 80+ languages.
DeepSeek Coder V2
DeepSeek's specialized coding model. Excellent at code generation, debugging, and explanation.
Granite Code 20B
IBM Granite 20B Code Instruct. Larger Granite code model balancing quality and inference cost for enterprise CI/CD code-review automation.
Granite Code 34B
IBM Granite 34B Code Instruct. Largest Granite code-instruction model. Top-tier among Apache-2.0 code LLMs on HumanEval, MBPP and MultiPL-E.
Granite Code 3B
IBM Granite 3B Code Instruct. Apache-2.0 small code-instruction model. Strong on Python, Java, JavaScript and Go for enterprise IDE integrations.
Granite Code 8B
IBM Granite 8B Code Instruct. Trained on permissively-licensed code, strong on multi-language code completion and instruction-following.
Magicoder S CL 7B
UIUC Magicoder S CL 7B. CodeLlama-7B fine-tuned with OSS-Instruct synthetic data. Strong HumanEval Plus and MBPP Plus performance per parameter.
Phind CodeLlama 34B v2
Phind CodeLlama 34B v2. Highly tuned CodeLlama variant focused on retrieval-augmented developer assistant workflows.
StarCoder2 15B
BigCode StarCoder2 15B code-generation flagship. Trained on 4T tokens of Stack v2 data with grouped-query attention and 16k context.
StarCoder2 3B
BigCode StarCoder2 3B code-generation model. Trained on The Stack v2, supports 600+ programming languages. Apache-2.0 licensed for commercial use.
StarCoder2 7B
BigCode StarCoder2 7B code-generation model. 16k context, 600+ programming languages, strong fill-in-the-middle (FIM) performance.
WizardCoder 33B
WizardLM WizardCoder 33B v1.1. Evol-Instruct fine-tune of DeepSeek-Coder-33B with strong code-generation benchmark performance.
Yi-Coder 9B
01.AI Yi-Coder 9B chat model. Strong multilingual code completion and chat, 128k context, competitive with code-specialized models 2x its size.
Top code models picks
Hand-picked across four common criteria — resolved against the live catalog so the picks track price and performance changes.
Mistral's code-specialized model. Optimized for code generation, completion, and understanding across 80+ languages.
Learn moreDeepSeek's specialized coding model. Excellent at code generation, debugging, and explanation.
Learn moreMistral's code-specialized model. Optimized for code generation, completion, and understanding across 80+ languages.
Learn moreMistral's code-specialized model. Optimized for code generation, completion, and understanding across 80+ languages.
Learn moreO pricing na geração de código segue o mesmo modelo por token da geração de texto geral. Os modelos de código flagship (GPT-5 Codex, Claude 4.6 Sonnet, Codestral) custam €1-€10 por milhão de tokens em input; os tiers económicos (Codestral Mamba, DeepSeek Coder, Qwen Coder) custam €0,05-€0,50 por milhão. Um pedido único de autocomplete em IDE raramente passa de alguns milhares de tokens em input, pelo que o custo por chamada é uma fração de cêntimo. As contas crescem quando se lançam agentes que fazem prompts a si próprios dezenas de vezes por tarefa.
O triângulo de compromissos é exatidão, velocidade e contexto. Os flagships resolvem problemas mais difíceis e seguem convenções de projeto de forma mais fiável, mas respondem a 30-80 tokens/segundo, o que parece lento dentro de um loop apertado de autocomplete. Os modelos económicos rápidos (Codestral Mamba, GPT-5 Mini) fazem streaming a 200+ tokens/segundo e sentem-se nativos no editor. Para tarefas em batch (refactor de um repo inteiro, gerar testes para cinquenta ficheiros) a exatidão do flagship ganha. Para loops apertados de autocomplete, ganha o tier rápido.
Atenção ao contexto cross-file: a maior parte dos loops de autocomplete envia só o ficheiro atual. Para refactoring verdadeiramente codebase-aware, é preciso uma camada de retrieval que puxe ficheiros relacionados para o prompt. Ferramentas como Cursor e Continue fazem-no automaticamente; se está a construir o seu, faça primeiro embedding da codebase e recupere os 5-10 ficheiros mais relevantes por request.
Atenção à contaminação de licenças: alguns modelos de código open-weights foram treinados apenas em código com licença permissiva; outros varreram código GPL com termos de redistribuição pouco claros. Se vai lançar código gerado num produto closed-source, prefira modelos comerciais com garantias explícitas sobre licença de código.
As top picks acima cobrem o flagship mais exato, o cavalo de batalha mais barato, o modelo com o contexto mais longo e a opção de autocomplete mais rápida.
Popular use cases
Common patterns built with code models on Railwail.
Frequently asked questions
Start Building with AI
Access all models through a single API. Get free credits when you sign up — no credit card required.