OpenAI muestra su modelo de razonamiento más poderoso llamado o3

OpenAI acaba de concluir su evento de 12 días llamado «Shipmas», donde hizo algunos anuncios sorprendentes. Como despedida adecuada, OpenAI nos presentó o3, su próximo modelo de razonamiento, y parece que será extremadamente inteligente.

Durante Shipmas, OpenAI anunció algunos otros grandes AI golosinas. Para empezar, introdujo su tarifa de 200 dólares al mes. ChatGPT Plan profesional. Esto dará a los usuarios acceso a la versión más potente de o1 y otras excelentes funciones. También, la compañía liberó a Sorasu generador de video de IA que prácticamente rompió Internet cuando la compañía lo mostró por primera vez. Puedes usarlo si eres miembro de ChatGPT Plus.

OpenAI nos da un adelanto de o3, su último modelo de razonamiento

¿Qué pasó con el o2? Bueno, está en el estado de la granja junto con Windows 9, OnePlus 4 y iPhone 9. AbiertoAI Decidí pasar a o3 porque hay una empresa de telecomunicaciones británica llamada O2. Entonces, esta era una manera de evitar problemas legales en el futuro.

o3 será un modelo de razonamiento, similar a un modelo normal. Sin embargo, la diferencia clave es que, en lugar de darle la respuesta de una vez, un modelo de razonamiento en realidad desglosará el proceso y le mostrará todos los pasos necesarios para llegar a la conclusión. Gemini 2.0 Flash Thinking de Google es un buen ejemplo de modelo de razonamiento. Entonces, si quieres observar más de cerca cómo un modelo llegó a su respuesta, entonces querrás usar modelos de razonamiento.

Dado que esta será la obra maestra de OpenAI, sabes que vendrá con una inteligencia de inteligencia artificial increíble. La compañía publicó algunas estadísticas sobre su rendimiento y muestra que ya pasó el punto de hacer que la IA sea más inteligente que un humano (bueno, en su mayoría).

Por ejemplo, la empresa sometió el modelo a las pruebas de codificación SWE-Bench Verified y superó a o1 en un 22,8%. A continuación, OpenAI sometió a o3 a la prueba de referencia científica Diamond GPQA (Google-Proof Q&A Benchmark), y obtuvo una puntuación del 87,7%. OpenAI también sometió a o3 al AIME (Examen de Matemáticas por Invitación Estadounidense) y solo falló una de las 15 preguntas. La AIME es una competición matemática extremadamente dura.

Parece que OpenAI realmente se superó a sí mismo esta vez. No sabemos cuándo la empresa lanzará este modelo al público. Simplemente no cuentes con eso pronto, ya que o1 todavía es bastante nuevo.

Fuente: Android Headlines

OpenAI nos da un adelanto de o3, su último modelo de razonamiento

Deja un comentario Cancelar respuesta