Hay varios modelos que dan AI un par de ojos, y el modelo PaliGemma de Google es uno de ellos. Este es el modelo de lenguaje de visión de la empresa que es capaz de identificar objetos y texto en imágenes. Google acaba de lanzar el nuevo modelo PaliGemma 2y ya está disponible para su uso.
El primer modelo PaliGemma es una herramienta útil. Es útil para identificar objetos en imágenes junto con subtítulos de imágenes. De hecho, también puede subtitular vídeos cortos. Una de las características más útiles de PaliGemma es la capacidad de responder preguntas sobre imágenes. Por lo tanto, es un modelo potente en general con muchísimo uso.
Google anunció el nuevo modelo PaliGemma 2
Google nos presentó oficialmente el modelo PaliGemma en mayo. La empresa pretende que PaliGemma 2 sea un sustituto directo del primer modelo. Entonces, si estás usando PaliGemma versión 1, te recomendamos que cambies.
Google ofrece PaliGemma 2 en varios sabores. Existen variantes de parámetros de 3 mil millones, 10 mil millones y 28 mil millones. Además, hay resoluciones de 224, 448 y 896 píxeles.
En cuanto a otras especificaciones, PaliGemma 2 cuenta con subtítulos largos. Además, Google dice que irá más allá de simplemente identificar objetos. Parece que el modelo podrá identificar personas e interpretar sus emociones. Entonces, si una persona está feliz, triste, etc., entonces PaliGemma 2 podrá darse cuenta de eso.
Además, parece que el modelo identificará más de lo que sucede en la escena para poder contar toda la narrativa. Google dice que PaliGemma es mejor cuando se trata de reconocer partituras musicales, reconocer fórmulas químicas, identificar profundidad y realizar informes de radiografías de tórax.
En general, parece que Google entregó algunas actualizaciones bastante notables a PaliGemma. Si desea usarlo, puede obtener el código en abrazando la caraKaggle y Ollama.
Hay otro gran modelo de Google.
Google también lanzó la vista previa privada de su modelo de generación de video llamado Veo. La compañía lo anunció durante Google I/O este año y la gente lo estaba esperando. Si está utilizando la plataforma en la nube Vertex de Google, podrá probarla. Puede generar videos con una resolución de hasta 1080p.
Fuente: Android Headlines