
Un nuevo test desarrollado por OpenAI marca un hito en la evolución de la inteligencia artificial: la versión avanzada de su modelo GPT-5 ha igualado o superado el desempeño de profesionales humanos en el 40,6% de los casos evaluados. Este avance, presentado recientemente, sitúa en el centro del debate la capacidad de la IA para asumir tareas de alto valor económico y su potencial impacto en el futuro del trabajo.
Por: Infobae
El test, denominado GDPval, representa el primer intento de OpenAI por medir de manera sistemática cómo se compara su tecnología con expertos humanos en sectores clave de la economía estadounidense. GDPval se enfoca en nueve industrias que aportan de forma significativa al producto interno bruto de Estados Unidos, entre las que se encuentran la salud, las finanzas, la manufactura y el sector público.
En total, la evaluación abarca 44 ocupaciones, desde ingenieros de software y enfermeros hasta periodistas, con el objetivo de analizar el rendimiento de la IA en tareas que requieren un alto nivel de especialización.
Para realizar la prueba, OpenAI solicitó a profesionales experimentados que compararan informes generados por modelos de IA con los elaborados por otros expertos humanos, decidiendo cuál consideraban superior.
Un ejemplo de las tareas evaluadas fue pedir a banqueros de inversión un análisis competitivo sobre la industria de entregas de última milla para comparar sus resultados con los informes producidos por la IA. El desempeño de cada modelo se midió a través de la tasa de “victorias” frente a los informes humanos en las 44 ocupaciones seleccionadas.
Puedes leer la nota completa en Infobae