Das neue GPT-4o-KI-Modell von ChatGPT ist besser im Sprechen und Sprechen
ChatGPT wird von einigen verschiedenen KI-Modellen angetrieben, mit GPT-4 Turbo für zahlende Abonnenten und GPT-3.5 für alle anderen. OpenAI hat nun ein neues Modell vorgestellt, das bald für alle verfügbar sein wird: GPT-4o.
GPT-4o (das "o" steht anscheinend für "omni") ist ein neues KI-Modell, das Text, Audio oder Bilder sowohl als Ein- als auch als Ausgabe verarbeitet. Das ist eine große Veränderung zu den vorherigen Modellen von OpenAI, die spezialisierter waren und für unterschiedliche Workloads kombiniert werden mussten. Google Gemini ist so konzipiert, dass es auf ähnliche Weise funktioniert, so dass es scheint, als würde OpenAI die Konkurrenz einholen.
In einem Blogbeitrag sagte OpenAI, dass GPT-4o "in nur 232 Millisekunden auf Audioeingaben reagieren kann, mit einem Durchschnitt von 320 Millisekunden, was der menschlichen Reaktionszeit in einem Gespräch entspricht. Es erreicht die GPT-4 Turbo-Leistung bei Text in Englisch und Code, mit einer deutlichen Verbesserung von Text in nicht-englischen Sprachen, während es auch viel schneller und 50 % billiger in der API ist. GPT-4o ist im Vergleich zu bestehenden Modellen besonders gut in Bezug auf Seh- und Audioverständnis."
Die verbesserten Sound- und Sprachfunktionen bedeuten, dass sich GPT-4o eher wie ein virtueller Assistent verhalten kann, was OpenAI und Google in der Vergangenheit mit gemischtem Erfolg versucht haben. OpenAI plant, "in den kommenden Wochen" einen Sprachmodus hinzuzufügen, der auf GPT-4o basiert und zuerst für ChatGPT Plus-Abonnenten verfügbar sein wird.
GPT-4o ist kein vollständiger Ersatz für GPT-4 und GPT-3.5, zumindest noch nicht. Es mag sich in einigen Szenarien anders verhalten, da es anders trainiert wird, aber OpenAI verspricht eine ähnliche Leistung wie GPT-4 Turbo in den Bereichen Text, Argumentation und Codierung. Wichtig ist, dass es auf kostenlosen ChatGPT-Konten verfügbar sein wird, die bisher auf das weniger leistungsfähige GPT-3.5-Modell beschränkt waren.
Das neue GPT-4o-Modell wird jetzt in ChatGPT eingeführt, sowohl für kostenlose Benutzer als auch für ChatGPT Plus-Abonnenten. Es wird ein Nachrichtenlimit geben, aber das Limit wird für Plus-Benutzer "5x höher" sein. ChatGPT Plus-Abonnenten erhalten "in den kommenden Wochen" ebenfalls Zugriff auf den Voice-Modus, und das neue Modell steht Entwicklern jetzt als API zum Ausprobieren zur Verfügung.
Quelle: OpenAI (1, 2)