Code Models
AI-powered coding assistants for development
Code-Generierungs-Modelle für Autovervollständigung, Review und Refactors
Code-Generierungs-Modelle sind große Sprachmodelle, die speziell auf Quellcode trainiert oder feinjustiert wurden. Sie treiben IDE-Autovervollständigung, PR-Review, automatisches Refactoring, Test-Generierung und sprachübergreifende Übersetzung an. Du greifst zu einem Code-Modell — statt zu einem allgemeinen Textmodell —, wenn du höhere Korrektheit bei Programmieraufgaben und strukturierte Ausgaben (Diffs, JSON) willst, die gut mit Entwickler-Tooling zusammenspielen.
13 models available
Codestral
Mistral's code-specialized model. Optimized for code generation, completion, and understanding across 80+ languages.
DeepSeek Coder V2
DeepSeek's specialized coding model. Excellent at code generation, debugging, and explanation.
Granite Code 20B
IBM Granite 20B Code Instruct. Larger Granite code model balancing quality and inference cost for enterprise CI/CD code-review automation.
Granite Code 34B
IBM Granite 34B Code Instruct. Largest Granite code-instruction model. Top-tier among Apache-2.0 code LLMs on HumanEval, MBPP and MultiPL-E.
Granite Code 3B
IBM Granite 3B Code Instruct. Apache-2.0 small code-instruction model. Strong on Python, Java, JavaScript and Go for enterprise IDE integrations.
Granite Code 8B
IBM Granite 8B Code Instruct. Trained on permissively-licensed code, strong on multi-language code completion and instruction-following.
Magicoder S CL 7B
UIUC Magicoder S CL 7B. CodeLlama-7B fine-tuned with OSS-Instruct synthetic data. Strong HumanEval Plus and MBPP Plus performance per parameter.
Phind CodeLlama 34B v2
Phind CodeLlama 34B v2. Highly tuned CodeLlama variant focused on retrieval-augmented developer assistant workflows.
StarCoder2 15B
BigCode StarCoder2 15B code-generation flagship. Trained on 4T tokens of Stack v2 data with grouped-query attention and 16k context.
StarCoder2 3B
BigCode StarCoder2 3B code-generation model. Trained on The Stack v2, supports 600+ programming languages. Apache-2.0 licensed for commercial use.
StarCoder2 7B
BigCode StarCoder2 7B code-generation model. 16k context, 600+ programming languages, strong fill-in-the-middle (FIM) performance.
WizardCoder 33B
WizardLM WizardCoder 33B v1.1. Evol-Instruct fine-tune of DeepSeek-Coder-33B with strong code-generation benchmark performance.
Yi-Coder 9B
01.AI Yi-Coder 9B chat model. Strong multilingual code completion and chat, 128k context, competitive with code-specialized models 2x its size.
Top code models picks
Hand-picked across four common criteria — resolved against the live catalog so the picks track price and performance changes.
Mistral's code-specialized model. Optimized for code generation, completion, and understanding across 80+ languages.
Learn moreDeepSeek's specialized coding model. Excellent at code generation, debugging, and explanation.
Learn moreMistral's code-specialized model. Optimized for code generation, completion, and understanding across 80+ languages.
Learn moreMistral's code-specialized model. Optimized for code generation, completion, and understanding across 80+ languages.
Learn moreDie Preisgestaltung bei Code-Generierung folgt demselben Per-Token-Modell wie allgemeiner Text. Flagship-Code-Modelle (GPT-5 Codex, Claude 4.6 Sonnet, Codestral) kosten 1–10 € pro Million Input-Tokens; Budget-Stufen (Codestral Mamba, DeepSeek Coder, Qwen Coder) kosten 0,05–0,50 € pro Million. Eine einzelne IDE-Autocomplete-Anfrage läuft selten über wenige Tausend Input-Tokens, der Aufruf-Preis liegt also bei Bruchteilen eines Cents. Die Rechnungen wachsen, wenn du Agenten ausspielst, die sich pro Aufgabe Dutzende Male selbst neu prompten.
Das Trade-off-Dreieck heißt Korrektheit, Geschwindigkeit und Kontext. Flagships lösen schwierigere Probleme und folgen Projektkonventionen zuverlässiger, antworten aber mit 30–80 Tokens/Sekunde — innerhalb einer engen Autocomplete-Schleife fühlt sich das langsam an. Schnelle Budget-Modelle (Codestral Mamba, GPT-5 Mini) streamen mit 200+ Tokens/Sekunde und fühlen sich im Editor nativ an. Für Batch-Aufgaben (refactor ein ganzes Repo, generiere Tests für fünfzig Dateien) gewinnt Flagship-Korrektheit. Für enge Autocomplete-Schleifen gewinnt die schnelle Stufe.
Achte auf datei-übergreifenden Kontext: Die meisten Autocomplete-Schleifen senden nur die aktuelle Datei. Für echtes codebasis-bewusstes Refactoring brauchst du eine Retrieval-Schicht, die verwandte Dateien in den Prompt zieht. Tools wie Cursor und Continue machen das automatisch; wenn du es selbst baust, embedde zuerst die Codebase und hol pro Anfrage die fünf bis zehn relevantesten Dateien.
Achte auf Lizenzkontamination: Einige Open-Weights-Code-Modelle wurden ausschließlich auf permissiv lizenziertem Code trainiert, andere haben GPL-Code mit unklaren Weiterverbreitungs-Bedingungen mitgenommen. Wenn du generierten Code in einem Closed-Source-Produkt ausspielst, bevorzuge kommerzielle Modelle mit expliziten Lizenz-Garantien für den Code.
Die Top-Picks oben decken das Korrektheits-Flagship, das günstigste Arbeitspferd, das Long-Context-Modell und die schnellste Autocomplete-Option ab.
Popular use cases
Common patterns built with code models on Railwail.
Frequently asked questions
Start Building with AI
Access all models through a single API. Get free credits when you sign up — no credit card required.