OpenAI führt neues Modell für Bildgenerierung im Wettkampf gegen Google ein

Das Unternehmen von Sam Altman setzt weiterhin auf eine aggressive Strategie gegen Google, indem es ein neues Modell zur Generierung von Bildern in ChatGPT ankündigt. OpenAI startet die schrittweise Einführung von GPT Image 1.5, das eine erheblich verbesserte Befolgung von Anweisungen, präzisere Bearbeitungsmöglichkeiten und bis zu viermal schnellere Erstellung von Bildern verspricht.

Das neue Modell wird ab Dienstag für alle Nutzer von ChatGPT sowie über APIs verfügbar sein. Dieser Schritt erfolgt vor dem Hintergrund des zunehmenden Wettbewerbs mit Google, nachdem CEO Sam Altman einen internen „Code Red“ ausgerufen hat – ein Signal für dringende Maßnahmen zur Wiederherstellung der Führungsposition des Unternehmens im Bereich der künstlichen Intelligenz.

Der Grund für diese Maßnahmen ist der Aufstieg von Google Gemini, einschließlich Gemini 3 und dem neuen Bildgenerator Nano Banana Pro, die in mehreren Benchmarks führend sind. Obwohl OpenAI kürzlich GPT-5.2 als sein bisher fortschrittlichstes Modell vorgestellt hat, bleibt Google weiterhin in einer stärkeren Position.

Einführung von GPT Image 1.5

GPT Image 1.5 stellt das erste neue Bildmodell von OpenAI seit April dar und wird früher als ursprünglich geplant eingeführt. Laut dem Unternehmen bietet die neue Version verbesserte Werkzeuge für die Nachbearbeitung, darunter präzise Steuerung von Details wie Gesichtszügen, Beleuchtung, Komposition und Farbton – ein zentrales Problem bei bisherigen KI-Generatoren, die oft das gesamte Bild bei minimalen Bearbeitungen verändern.

„Die meisten generativen Bildwerkzeuge sind bei Iterationen schwach. GPT Image 1.5 stellt einen signifikanten Fortschritt in der Beibehaltung visueller Konsistenz dar“, äußern die Vertreter von OpenAI.

Integration neuer Funktionen

Parallel zum neuen Modell werden Bilder in ChatGPT auch ein spezielles Menü in der Seitenleiste haben, das als eine Art „Kreativstudio“ fungiert. Laut Fiji Simo, CEO von OpenAI Applications, erleichtert die neue Benutzeroberfläche die Erstellung und Bearbeitung von Bildern sowie die Inspiration durch beliebte Vorlagen und Filter.

Das Unternehmen plant zudem eine breitere Integration visueller Elemente in ChatGPT – einschließlich beim Suchen, Überprüfen von Sportergebnissen oder Umrechnen von Maßeinheiten, wobei die Informationen mit klaren Quellen präsentiert werden.

„Wenn visuelle Darstellungen Geschichten besser erzählen als Worte, muss ChatGPT dies nutzen. Unser Ziel ist es, die Distanz zwischen der Idee im Kopf des Nutzers und deren Umsetzung zu verkürzen“, erklärt Simo.

Schlussfolgerung

Mit dem neuen Modell demonstriert OpenAI eindeutig, dass der Wettbewerb im Bereich der generativen KI in eine noch intensivere Phase eintritt, in der Geschwindigkeit, Qualität und Benutzerfreundlichkeit entscheidend sein werden.