Code Models
AI-powered coding assistants for development
Modelli di generazione codice per autocomplete, review e refactor
I modelli di generazione codice sono large language model addestrati o fine-tuned specificamente su codice sorgente. Alimentano l'autocomplete IDE, la PR review, il refactoring automatizzato, la generazione di test e la traduzione cross-language. Si ricorre a un modello code — rispetto a uno di testo generico — quando si vuole maggiore correttezza sui task di programmazione e output strutturati (diff, JSON) che si integrano bene con il tooling per sviluppatori.
13 models available
Codestral
Mistral's code-specialized model. Optimized for code generation, completion, and understanding across 80+ languages.
DeepSeek Coder V2
DeepSeek's specialized coding model. Excellent at code generation, debugging, and explanation.
Granite Code 20B
IBM Granite 20B Code Instruct. Larger Granite code model balancing quality and inference cost for enterprise CI/CD code-review automation.
Granite Code 34B
IBM Granite 34B Code Instruct. Largest Granite code-instruction model. Top-tier among Apache-2.0 code LLMs on HumanEval, MBPP and MultiPL-E.
Granite Code 3B
IBM Granite 3B Code Instruct. Apache-2.0 small code-instruction model. Strong on Python, Java, JavaScript and Go for enterprise IDE integrations.
Granite Code 8B
IBM Granite 8B Code Instruct. Trained on permissively-licensed code, strong on multi-language code completion and instruction-following.
Magicoder S CL 7B
UIUC Magicoder S CL 7B. CodeLlama-7B fine-tuned with OSS-Instruct synthetic data. Strong HumanEval Plus and MBPP Plus performance per parameter.
Phind CodeLlama 34B v2
Phind CodeLlama 34B v2. Highly tuned CodeLlama variant focused on retrieval-augmented developer assistant workflows.
StarCoder2 15B
BigCode StarCoder2 15B code-generation flagship. Trained on 4T tokens of Stack v2 data with grouped-query attention and 16k context.
StarCoder2 3B
BigCode StarCoder2 3B code-generation model. Trained on The Stack v2, supports 600+ programming languages. Apache-2.0 licensed for commercial use.
StarCoder2 7B
BigCode StarCoder2 7B code-generation model. 16k context, 600+ programming languages, strong fill-in-the-middle (FIM) performance.
WizardCoder 33B
WizardLM WizardCoder 33B v1.1. Evol-Instruct fine-tune of DeepSeek-Coder-33B with strong code-generation benchmark performance.
Yi-Coder 9B
01.AI Yi-Coder 9B chat model. Strong multilingual code completion and chat, 128k context, competitive with code-specialized models 2x its size.
Top code models picks
Hand-picked across four common criteria — resolved against the live catalog so the picks track price and performance changes.
Mistral's code-specialized model. Optimized for code generation, completion, and understanding across 80+ languages.
Learn moreDeepSeek's specialized coding model. Excellent at code generation, debugging, and explanation.
Learn moreMistral's code-specialized model. Optimized for code generation, completion, and understanding across 80+ languages.
Learn moreMistral's code-specialized model. Optimized for code generation, completion, and understanding across 80+ languages.
Learn moreIl pricing nella generazione di codice segue lo stesso modello per-token della generazione testo generico. I modelli code flagship (GPT-5 Codex, Claude 4.6 Sonnet, Codestral) costano €1-€10 per milione di token in input; i tier economici (Codestral Mamba, DeepSeek Coder, Qwen Coder) costano €0,05-€0,50 per milione. Una singola richiesta di autocomplete IDE raramente supera qualche migliaio di token in input, quindi il costo per chiamata è una frazione di centesimo. Le bollette crescono quando si rilasciano agenti che si ri-promptano dozzine di volte per task.
Il triangolo di compromessi è correttezza, velocità e contesto. I flagship risolvono problemi più difficili e seguono le convenzioni di progetto in modo più affidabile ma rispondono a 30-80 token/secondo, sensazione lenta dentro un loop di autocomplete stretto. I modelli economici veloci (Codestral Mamba, GPT-5 Mini) streamano a 200+ token/secondo e nell'editor sembrano nativi. Per task batch (refactor di un intero repo, generare test per cinquanta file) la correttezza del flagship vince. Per loop di autocomplete stretti, vince il tier veloce.
Attenzione al contesto cross-file: la maggior parte dei loop di autocomplete invia solo il file corrente. Per un refactor veramente codebase-aware serve un layer di retrieval che tira i file correlati nel prompt. Tool come Cursor e Continue lo fanno automaticamente; se ne state costruendo uno vostro, embeddate prima la codebase e recuperate i 5-10 file più rilevanti per richiesta.
Attenzione alla contaminazione di licenza: alcuni modelli code open-weights sono stati addestrati solo su codice con licenza permissiva; altri hanno spazzato codice GPL con termini di ridistribuzione ambigui. Se rilasciate codice generato in un prodotto closed-source, preferite modelli commerciali con garanzie esplicite sulla licenza del codice.
Le top picks qui sopra coprono il flagship più corretto, il workhorse più economico, il modello con il contesto più lungo e l'opzione di autocomplete più veloce.
Popular use cases
Common patterns built with code models on Railwail.
Frequently asked questions
Start Building with AI
Access all models through a single API. Get free credits when you sign up — no credit card required.