Code Models
AI-powered coding assistants for development
Modèles de génération de code pour autocomplete, review et refactoring
Les modèles de génération de code sont des grands modèles de langage entraînés ou affinés spécifiquement sur du code source. Ils alimentent l'autocomplete IDE, la PR review, le refactoring automatisé, la génération de tests et la traduction cross-langage. On y a recours — plutôt qu'à un modèle texte généraliste — quand on veut une correction plus forte sur les tâches de programmation et des sorties structurées (diffs, JSON) qui se marient bien avec l'outillage dev.
13 models available
Codestral
Mistral's code-specialized model. Optimized for code generation, completion, and understanding across 80+ languages.
DeepSeek Coder V2
DeepSeek's specialized coding model. Excellent at code generation, debugging, and explanation.
Granite Code 20B
IBM Granite 20B Code Instruct. Larger Granite code model balancing quality and inference cost for enterprise CI/CD code-review automation.
Granite Code 34B
IBM Granite 34B Code Instruct. Largest Granite code-instruction model. Top-tier among Apache-2.0 code LLMs on HumanEval, MBPP and MultiPL-E.
Granite Code 3B
IBM Granite 3B Code Instruct. Apache-2.0 small code-instruction model. Strong on Python, Java, JavaScript and Go for enterprise IDE integrations.
Granite Code 8B
IBM Granite 8B Code Instruct. Trained on permissively-licensed code, strong on multi-language code completion and instruction-following.
Magicoder S CL 7B
UIUC Magicoder S CL 7B. CodeLlama-7B fine-tuned with OSS-Instruct synthetic data. Strong HumanEval Plus and MBPP Plus performance per parameter.
Phind CodeLlama 34B v2
Phind CodeLlama 34B v2. Highly tuned CodeLlama variant focused on retrieval-augmented developer assistant workflows.
StarCoder2 15B
BigCode StarCoder2 15B code-generation flagship. Trained on 4T tokens of Stack v2 data with grouped-query attention and 16k context.
StarCoder2 3B
BigCode StarCoder2 3B code-generation model. Trained on The Stack v2, supports 600+ programming languages. Apache-2.0 licensed for commercial use.
StarCoder2 7B
BigCode StarCoder2 7B code-generation model. 16k context, 600+ programming languages, strong fill-in-the-middle (FIM) performance.
WizardCoder 33B
WizardLM WizardCoder 33B v1.1. Evol-Instruct fine-tune of DeepSeek-Coder-33B with strong code-generation benchmark performance.
Yi-Coder 9B
01.AI Yi-Coder 9B chat model. Strong multilingual code completion and chat, 128k context, competitive with code-specialized models 2x its size.
Top code models picks
Hand-picked across four common criteria — resolved against the live catalog so the picks track price and performance changes.
Mistral's code-specialized model. Optimized for code generation, completion, and understanding across 80+ languages.
Learn moreDeepSeek's specialized coding model. Excellent at code generation, debugging, and explanation.
Learn moreMistral's code-specialized model. Optimized for code generation, completion, and understanding across 80+ languages.
Learn moreMistral's code-specialized model. Optimized for code generation, completion, and understanding across 80+ languages.
Learn moreLa tarification en génération de code suit le même modèle au token que le texte généraliste. Les modèles phares de code (GPT-5 Codex, Claude 4.6 Sonnet, Codestral) coûtent 1 à 10 € par million de tokens d'entrée ; les tiers économiques (Codestral Mamba, DeepSeek Coder, Qwen Coder) coûtent 0,05 à 0,50 € par million. Une seule requête d'autocomplete IDE dépasse rarement quelques milliers de tokens d'entrée, alors le coût par appel se compte en fractions de centime. Les factures gonflent quand vous livrez des agents qui se relancent des dizaines de fois par tâche.
Le triangle de compromis est correction, vitesse et contexte. Les phares résolvent des problèmes plus durs et suivent les conventions du projet plus fidèlement mais répondent à 30-80 tokens/seconde, ce qui paraît lent dans une boucle d'autocomplete serrée. Les modèles rapides économiques (Codestral Mamba, GPT-5 Mini) streament à 200+ tokens/seconde et paraissent natifs dans l'éditeur. Pour les tâches par lots (refactor de tout un repo, génération de tests pour cinquante fichiers), la correction phare gagne. Pour les boucles d'autocomplete serrées, le tiers rapide gagne.
Attention au contexte cross-fichier : la plupart des boucles d'autocomplete n'envoient que le fichier courant. Pour du refactoring conscient du codebase, vous avez besoin d'une couche de retrieval qui tire les fichiers connexes dans le prompt. Des outils comme Cursor et Continue le font automatiquement ; si vous le construisez vous-même, embeddez le codebase d'abord et récupérez les 5 à 10 fichiers les plus pertinents par requête.
Attention à la contamination de licence : quelques modèles open-weights ont été entraînés uniquement sur du code sous licence permissive ; d'autres ont aspiré du code GPL avec des termes de redistribution flous. Si vous livrez du code généré dans un produit closed-source, préférez les modèles commerciaux avec garanties explicites de licence de code.
Les top picks ci-dessus couvrent le phare le plus correct, le cheval de trait le moins cher, le modèle au plus long contexte et l'option autocomplete la plus rapide.
Popular use cases
Common patterns built with code models on Railwail.
Frequently asked questions
Start Building with AI
Access all models through a single API. Get free credits when you sign up — no credit card required.