Question 1

Welches Code-Modell schreibt den korrektesten Code?

Accepted Answer

GPT-5 und Claude 4.6 Sonnet führen aktuell auf HumanEval+, SWE-bench und Codeforces-artigen Problemsätzen. Bei domain-spezifischen Sprachen (SQL, Regex, Infrastructure-as-Code) schlagen spezialisierte Modelle die Flagships manchmal auf der engen Aufgabe, verlieren aber beim allgemeinen Reasoning.

Question 2

Welches ist am günstigsten?

Accepted Answer

Open-Weights-Modelle wie DeepSeek Coder V2, Qwen 2.5 Coder und Codestral Mamba laufen auf managed Infrastruktur unter 0,20 € pro Million Input-Tokens. Sie sind 80–90 % so fähig wie Flagships bei routinemäßigen Autocomplete- und Refactoring-Aufgaben. Greif zum Flagship nur, wenn Korrektheit wichtiger ist als Latenz.

Question 3

Was ist mit codebasis-bewusstem Kontext?

Accepted Answer

Die meisten Code-Modelle arbeiten ab Werk mit Single-File-Kontext. Für Multi-File-Reasoning brauchst du eine Retrieval-Schicht, die dein Repo embeddet und verwandte Dateien einbezieht. Cursor und Continue.dev machen das automatisch; in deinen eigenen Agenten nutze ein Embedding-Modell aus /models/embedding, um den Retriever zu bauen.

Question 4

Kann ich diese für Autocomplete in meiner IDE nutzen?

Accepted Answer

Ja — Railwails OpenAI-kompatibler Endpoint funktioniert ab Werk mit Cursor, Continue.dev, Cody und den meisten anderen IDE-Plugins. Zeige das Plugin auf unsere Base-URL und wähle ein schnelles Modell mit First-Byte-Latenz unter 100 ms.

Question 5

Welche Programmiersprachen werden unterstützt?

Accepted Answer

Flagship-Modelle beherrschen 80+ Sprachen mit starker Performance auf den Top 20 (Python, TypeScript, JavaScript, Java, Go, Rust, C++, C#, Ruby, PHP, Swift, Kotlin, SQL, Bash usw.). Nischen-Sprachen (Erlang, Elixir, Crystal, Zig) funktionieren weiterhin, aber mit niedrigerer Korrektheit — prüfe auf eigenen Snippets, bevor du integrierst.

Question 6

Können sie Tests generieren?

Accepted Answer

Ja, und das ist heute einer der besten ROI-Use-Cases. Füttere eine Funktion und frag nach Unit-Tests; das Modell produziert 5–15 Testfälle inklusive Edge-Cases und Fehlerpfaden. Kombiniere mit einem Coverage-Tool, um die Suite vor dem Merge zu validieren.

Question 7

Wie ist der generierte Code lizenziert?

Accepted Answer

Kommerzielle Modelle gewähren unbeschränkte kommerzielle Nutzung des Outputs. Wenige Open-Weights-Checkpoints, die auf GPL-lizenziertem Code trainiert wurden, tragen Lizenzkontaminations-Ambivalenz — die Modellkarte listet die Lizenzangabe der Trainingsdaten. Für Closed-Source-Produkte bevorzuge kommerzielle Modelle mit expliziter Urheberrechts-Freistellung.

Question 8

Gibt es einen JSON-Mode für strukturierten Output?

Accepted Answer

Ja — alle Flagship-Code-Modelle unterstützen `response_format: { type: 'json_object' }` und `json_schema`. Nutze ihn für ASTs, Diffs oder strukturierte Refactoring-Instruktionen. Für datei-übergreifende Edit-Pläne liefert ein JSON-Schema mit Dateipfaden und Datei-spezifischen Diff-Aktionen die zuverlässigsten Ergebnisse.

Code Models

Code-Generierungs-Modelle für Autovervollständigung, Review und Refactors

Codestral

Code Llama 13B Instruct

Code Llama 34B Instruct

Code Llama 70B Instruct

Code Llama 7B Instruct

CodeGen 350M Mono

DeepSeek Coder 1.3B Instruct

DeepSeek Coder 33B Instruct (GGUF)

DeepSeek Coder V2

Granite Code 20B

Granite Code 8B

Grok Build 0.1

Magicoder S CL 7B

Phind CodeLlama 34B v2

Qwen2.5-Coder 32B Instruct

Qwen2.5-Coder 7B Instruct

Replit Code v1 3B

Replit Code v1.5 3B

Stable Code Instruct 3B

StarCoder2 15B

WizardCoder 33B

Top code models picks

Popular use cases

Frequently asked questions

Start Building with AI