Die o1-Serie sei so trainiert worden, dass sie ähnlich wie ein Mensch sich mehr Zeit zur Lösung eines Problems nehme, teilte der Microsoft-Partner am Donnerstag mit. «Sie können in den Bereichen Wissenschaft, Programmierung und Mathematik komplexe Aufgaben durchdenken und schwierigere Probleme lösen als frühere Modelle», hiess es. Bei gewissen Standardtests in den Bereichen Physik, Chemie und Biologie sei die Leistung der neuen Künstlichen Intelligenzen (KI) vergleichbar mit der menschlicher Doktoranden.
Das gegenwärtige Standardmodell von OpenAI trägt die Bezeichnung GPT-4o. Dieses liefert wie auch die Vorgängerversionen etwa als ChatBot die Antworten möglichst schnell. Bei o1 wurde die Maschine dagegen den technischen Angaben zufolge darauf trainiert, besser sogenannte «Gedankenketten» (chain-of-thought, COT) zu bilden. Dabei nimmt sich die KI die Zeit, um komplexe Aufgaben in einfachere Einzelschritte herunterzubrechen. Zwar schneiden schon die bisherigen Modelle wie GPT-4o besser ab, wenn der Nutzer die Probleme in Häppchen aufteilt. Das neue Modell soll nun in der Lage sein, dieses selbstständig zu tun.
Als Beispiel für einen direkten Vergleich zwischen den Modellen verwies der US-Konzern auf die Qualifikationsprüfung für die Internationale Mathematik-Olympiade. Hier habe GPT-4o ein Ergebnis von 13 Prozent erzielt, das neue o1-Modell komme auf 83 Prozent.
OpenAI hält Denkprozesse Der KI geheim
Der neue Ansatz ermögliche es auch, die KI-Modelle auf gewisse Weise sicherer zu machen, erklärte OpenAI. Das neue COT-Verfahren erlaube es, sozusagen die Gedanken der KI zu lesen und ihre Denkprozesse zu verstehen. Der ganze Vorgang funktioniere jedoch nur, wenn die Maschine «ihre Gedanken in unveränderter Form ausdrücken» könne, also ohne Einschränkungen. Deswegen könnten an dieser Stelle keine Richtlinien oder Vorlieben der Nutzer einfliessen.
Diese faktisch unzensierten Zwischenschritte bei der Lösung von Problemen will OpenAI «nicht dem Nutzer direkt sichtbar machen», also geheimhalten. «Daher haben wir nach Abwägung mehrerer Faktoren, darunter das Anwendungserlebnis, der Wettbewerbsvorteil und die Möglichkeit, die Überwachung der Gedankenketten fortzusetzen, beschlossen, den Benutzern die rohen Gedankenketten nicht zu zeigen.» Stattdessen werde bei den o1-Modellen eine Zusammenfassung des Denkvorgangs generiert. OpenAI räumte ein, dass diese Entscheidung Nachteile mit sich bringe.
Die leistungsfähigeren Modelle von OpenAI werden seit längerem erwartet. Die Nachrichtenagentur Reuters hatte im November 2023 als erstes Medium von dem Projekt berichtet, das damals noch als Q* bezeichnet wurde. Im Juli meldete Reuters dann, dass der Name auf «Strawberry» (Erdbeere) geändert worden sei. Der OpenAI-Forscher Noam Brown bestätigte auf dem Kurznachrichtendienst X, dass es sich bei o1 um dieses Projekt handle.
(Reuters)