Benchmark muestra a expertos en juego de IA

Por mucho que odiemos admitirlo, existe una clara posibilidad de que AI algún día podría tomar nuestros trabajos. Ya estamos viendo que esto sucede, especialmente en el espacio gráficodonde los usuarios pueden generar fácilmente una imagen de suficiencia profesional con algunas indicaciones simples. Pero, ¿qué tan pronto podemos esperar que la IA realmente nos reemplace en el espacio de trabajo? Eso es algo que Operai se propuso descubrir en un punto de referencia reciente para ver qué tan bien está Modelo GPT-5 Hace trabajo humano.

OpenAI Benchmarks GPT-5 contra trabajos humanos

Este nuevo punto de referencia se llama gdpval. Según OpenAI, mide modelos de IA como GPT-5 en tareas que un humano podría hacer en sus trabajos. «Mide el rendimiento del modelo en las tareas dibujadas directamente del trabajo de conocimiento del mundo real de profesionales experimentados en una amplia gama de ocupaciones y sectores, proporcionando una imagen más clara de cómo funcionan los modelos en tareas económicamente valiosas. «

Actualmente, GDPVAL se basa en nueve industrias que más contribuyen al PIB de Estados Unidos. Esto incluye atención médica, finanzas, fabricación y gobierno, solo por nombrar algunos. En una de las pruebas, OpenAI pidió a los profesionales de la industria que compararan los informes generados por la IA y los de otros profesionales. También pidió a los banqueros de inversión que creen un panorama de la competencia para la industria de entrega de última milla y lo compararan con los informes generados por IA.

Sorprendentemente y algo preocupante, el modelo GPT-5 de OpenAI realizó lo mejor de todos los modelos de la compañía. Operai descubrió que el trabajo generado por GPT-5 se clasificó mejor o a la par con los expertos de la industria el 40.6% del tiempo. La compañía también echó un vistazo a su competidor, Anthrope, y su modelo Claude AI. Claude parecía funcionar mejor con una tasa de victorias del 49%. Sin embargo, Operai cree que es porque Claude es mejor para hacer «gráficos agradables. «

¿Esto reemplazará a los humanos en sus trabajos?

Como dijimos, existe la posibilidad de que algunos trabajos puedan eventualmente sigue el camino del dinosaurio. Sin embargo, por ahora, parece que estamos en un período de transición. Discurso a TechCrunchEl economista jefe de Openi, el Dr. Aaron Chatterji, sugiere que, en base a los resultados de GDPVAL, no se trata de reemplazar a los humanos de IA. Pero más bien, se trata de humanos que aprovechan la IA para liberar tiempo para tareas más significativas.

Por ejemplo, su trabajo puede requerir que escriba informes basados ​​en datos. En lugar de pasar horas formatando todo, la IA puede hacer el trabajo por usted en minutos. Esto liberaría tiempo para que pase en otras tareas en el trabajo o incluso en las personales. Suena como una compensación justa.

Fuente: Android Headlines

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *