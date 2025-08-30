So fand beispielsweise die gemeinnützige KI-Bewertungsorganisation METR heraus, dass die heutigen Top-Modelle zwar viele Programmieraufgaben, für die Menschen weniger als vier Minuten benötigen, zuverlässig erledigen können. Die Systeme straucheln jedoch bei Aufgaben, die länger als vier Stunden dauern, obwohl sich die Dauer der für KI lösbaren Aufgaben etwa alle paar Monate verdoppelt. Dies zeigt eine zentrale Einschränkung: Die heutigen Modelle verfügen oft über das für eine bestimmte Aktion erforderliche Wissen oder die erforderlichen Fähigkeiten. Lange Abfolgen von Schritten miteinander zu verknüpfen, ist für sie jedoch immer noch schwierig.