Grok realmente puede explicarte los memes.

En la cima del modelo de IA orden jerárquico, tenemos modelos como Gemini 1.5 Pro y GPT-4o con otros jugadores importantes como Llama 3, Claude 3 y otros. En algún lugar de la mezcla, tenemos el modelo Grok de xAI. Ha ido ganando funcionalidad en los últimos meses y Elon Musk acaba de anunciar una nueva capacidad para el modelo que parece sacada de una película de ciencia ficción. Grok ahora puede entender imágenes e incluso explicar chistes.

Grok ha estado en algunos problemas desde que obtuvo la capacidad de generar imágenes. Por supuesto, carecía de salvaguardias para impedir que la gente generando material problemático. De todos modos, se ha ido desarrollando. Si desea utilizar este modo, deberá ser suscriptor de X Premium+. Este es el nivel de pago más caro que ofrece la empresa. Cuesta $16/mes ($22/mes si te registras a través de la aplicación).

Grok ahora puede entender imágenes

Para que cualquier modelo de IA nos lleve a la era AGI (Inteligencia General Artificial), debe ser multimodal. Esto significa que tiene la capacidad de comprender y generar múltiples formas de medios. Grok adquirió la capacidad de generar imágenes, pero entenderlas es una historia diferente.

Elon Musk publicó en X sobre la nueva habilidad de Grok. en el ejemplomuestra que puede proporcionar una explicación de una imagen que se le ha subido. Como ejemplo, mostró a Grok explicando un meme. El meme mostraba a un par de soldados viendo a soldados que se hacían pasar por muertos (que además son físicos).

Grok ofrece una explicación de seis puntos de lo que sucede en la imagen y termina con una declaración final. Entonces, ¿qué tan preciso fue? Digamos que Grok no hablará en ningún taller de comedia en el corto plazo. El modelo pudo identificar lo que estaba sucediendo en la escena como los soldados, el cerro y la gente en el suelo.

Sin embargo, dice “El humor proviene del remate del segundo panel, donde un guardia dice: «Isaac Newton inventó la gravedad», lo que implica que la razón por la que los físicos no se mueven (y por lo tanto parecen muertos) es por la gravedad, que Newton es famoso por describir matemáticamente. , no inventar.«

También dice que el humor surge del hecho de que los físicos “estarían tan dedicados a su trabajo que se tumbarían para estudiar o “descubrir” la gravedad,“. Entonces, claramente entendió mal el significado del chiste.

¿Significa esto que Grok es malo?

No, significa que la propia IA tiene algunas mejoras que hacer. Estamos hablando de entrenar un modelo para comprender humoruna de las creaciones más humanas jamás creadas. No sólo eso, sino que le dimos la misma imagen a Géminis entender, y también se equivocó.

Los modelos comprenden los elementos individuales de la imagen y tienen una comprensión superficial de la comedia; aunque muy analítico. Sin embargo, no entienden la cuestión que el artista tiene que discutir con los científicos que son tan duros a la hora de corregir a las personas en los detalles más finos del habla. No estamos seguros de cómo las empresas podrán enseñar esto a los modelos de IA.

Fuente: Android Headlines

Grok ahora puede entender imágenes

¿Significa esto que Grok es malo?

Deja un comentario Cancelar respuesta