GDPval: OpenAI bewertet KI-Leistung in wirtschaftlich relevanten Aufgaben
GDPval ist ein neues Benchmark-System von OpenAI, das die Leistungsfähigkeit moderner KI-Modelle bei realen, wirtschaftlich wertvollen Aufgaben misst. Der Datensatz deckt 44 Berufe in den neun größten Wirtschaftssektoren der USA…