Codex (speziell OpenAI Codex) ist ein auf künstlicher Intelligenz basierendes Modell, das geschriebene, natürliche Sprache in Programmcode übersetzt. Es ist ein direkter Nachkömmling der GPT-3-Modellfamilie und wurde gezielt mit Milliarden von Zeilen öffentlich zugänglichen Quellcodes (unter anderem aus GitHub-Repositories) trainiert.
Bedeutung
Codex markierte den Durchbruch der generativen KI in der Softwareentwicklung. Es bildet das technologische Fundament von GitHub Copilot und veränderte die Art und Weise, wie Entwickler Code schreiben. Das Modell fungiert als intelligenter Assistent, der repetitive Schreibarbeit (Boilerplate-Code) minimiert und die Einarbeitung in neue Programmiersprachen und APIs dramatisch beschleunigt.
Funktionsweise
Codex verarbeitet den eingegebenen Prompt (z. B. einen Kommentar im Code wie ‚// Funktion zur Validierung einer E-Mail-Adresse in JavaScript‚) und berechnet die statistisch wahrscheinlichste Folge von Programmierzeichen, die diese Aufgabe löst. Es unterstützt über ein Dutzend Programmiersprachen, darunter Python, JavaScript, PHP, HTML und CSS. Das Modell versteht Kontext, wodurch es Variablen und Funktionen aus dem umgebenden Code konsistent weiterverwenden kann.
Praxisbeispiel
Ein Entwickler schreibt in seiner IDE einen Kommentar: ‚// Erstelle eine Funktion, die ein Array von Objekten nach dem Key „position“ sortiert‘. Codex generiert in Sekundenbruchteilen die vollständige Sortierfunktion in JavaScript, die der Entwickler per Tabulatortaste übernimmt.