OpenAI hat ein neues KI-Modell namens GPT-5.3-Codex-Spark vorgestellt, das Entwicklern beim Schreiben und Debuggen von Code helfen soll. Das Modell läuft auf Hardware von Cerebras Systems, dem Chip-Unternehmen, das für seine Wafer-Scale-Prozessoren bekannt ist. Es ist die erste öffentliche Veröffentlichung von OpenAI, die Cerebras-Chips nutzt.
Ein codefokussiertes Modell
GPT-5.3-Codex-Spark ist das neueste Modell aus OpenAIs Reihe von Code-Generierungsmodellen und baut auf der früheren Codex-Serie auf. Es wurde darauf trainiert, Quellcode in mehreren Programmiersprachen zu verstehen und zu generieren. Der Name deutet auf eine Betonung der Geschwindigkeit hin – „Spark“ – und die Versionsnummer weist auf inkrementelle Verbesserungen gegenüber früheren GPT-5-Derivaten hin. Genaue Benchmark-Ergebnisse oder Leistungsdaten wurden nicht veröffentlicht.
Warum Cerebras-Hardware wichtig ist
Cerebras entwickelt das CS-2-System, einen einzelnen Wafer-Scale-Chip mit Hunderttausenden von Verarbeitungskernen. Der Betrieb von GPT-5.3-Codex-Spark auf dieser Hardware könnte im Vergleich zu herkömmlichen GPU-Clustern eine geringere Latenz und einen höheren Durchsatz bei der Codegenerierung bedeuten. Cerebras hat bereits mit anderen KI-Laboren zusammengearbeitet, um große Sprachmodelle zu beschleunigen, aber dies ist eine bemerkenswerte Partnerschaft für beide Unternehmen. Ob das Modell über den Cloud-Dienst von Cerebras oder auf lokalen Systemen läuft, wurde nicht bekannt gegeben.
Die Hardware-Landschaft
Der Deal unterstreicht den Wettbewerb unter den Chip-Herstellern um die Stromversorgung von KI-Workloads. Nvidia dominiert den Markt mit seinen GPUs, aber Cerebras sowie Unternehmen wie Graphcore und AMD drängen mit Alternativen. Für OpenAI könnte die Nutzung von Cerebras-Hardware die Abhängigkeit von Nvidia verringern und möglicherweise Kosten senken. Wie stark die Leistung des Modells von der einzigartigen Architektur von Cerebras abhängt, ist noch nicht klar.
GPT-5.3-Codex-Spark ist über die API von OpenAI verfügbar. Die Preisgestaltung folgt den bestehenden API-Stufen, es wurden keine separaten Ratenbegrenzungen angekündigt.
Bislang wurden keine externen Bewertungen des Modells veröffentlicht. Entwickler, die es nutzen, werden in den kommenden Wochen wahrscheinlich ihre eigenen Ergebnisse teilen.



