Google defiende el uso de contenido web gratuito para la formación en IA

Desde el comienzo del auge de la IA, un debate ha estado siempre presente: la propiedad del contenido. Para desarrollar sus servicios, las empresas de IA utilizan enormes cantidades de datos disponibles en Internet. Sin embargo, muchos editores sienten que se les ha perjudicado injustamente al no recibir una compensación justa. Como novedad, existe una controversia sobre la postura de Google sobre entrenamiento de IA pago tal como fue objeto de escrutinio durante una audiencia con el Comité Digital y de Comunicaciones de Lords del Reino Unido.

Roxanne Carter, ejecutiva de asuntos públicos de Googleaclaró que la empresa no cree que deba pagar por el contenido «disponible gratuitamente» utilizado para entrenar sus modelos de IA.

Google defiende su postura de no pagar a los editores por formación en IA sobre datos públicos

El caso de Google se basa en una definición específica de cómo funciona la IA. Carter dice que los modelos de IA como Gemini no son bases de datos ni sistemas para encontrar información. En lugar de ello, analizan enormes cantidades de datos para encontrar vínculos estadísticos y patrones entre ideas y palabras. Google dice que el objetivo final es utilizar estos patrones para crear «contenido completamente nuevo». Afirman que su IA no se limita a copiar lo que han hecho los editores o creadores.

Google no pagará por la formación en la web abiertapero sí distinguen entre web scraping general y acceso especializado. La empresa está cerrando activamente acuerdos para contenido de archivo y conjuntos de datos especializados que no están disponibles para el público. En resumen, la empresa está dispuesta a pagar por el “acceso” a datos que no se encuentran en su propia plataforma. Pero no lo hacen para entrenar a la IA en lo que consideran el dominio público de Internet.

Resúmenes de IA de Google: el dilema de la exclusión voluntaria

Para los editores, la situación es más compleja. Google destaca una herramienta llamada «Google Extended», que permite a los propietarios de sitios web permanecer en la Búsqueda de Google y al mismo tiempo optar por no utilizar su contenido para entrenar modelos de IA como Gemini. Esto suena como un compromiso justo sobre el papel. Pero persiste una importante zona gris con respecto a “Resúmenes de IA“—los resúmenes que aparecen en la parte superior de los resultados de búsqueda.

Cuando se les preguntó si los editores podían optar por no participar en las descripciones generales de IA en particular, los representantes de Google fueron vagos. Usar algunas etiquetas específicas parece una forma de no aparecer en estos resúmenes en este momento. Desafortunadamente, agregar estas etiquetas también podría dificultar que las personas encuentren un sitio en los resultados de búsqueda habituales. Esto pone a los editores más pequeños en una situación difícil: pueden dejar que la IA resuma su trabajo (lo que podría reducir la cantidad de clics directos) o correr el riesgo de perder por completo su ranking de búsqueda.

Los actores más pequeños podrían ser los más afectados

A los funcionarios del gobierno les preocupa que las grandes empresas de medios puedan hacer acuerdos lucrativos con gigantes tecnológicospero las empresas más pequeñas a menudo se quedan fuera. A la gente le preocupa que los resúmenes de IA puedan competir con los artículos que resumen. Esto significa que los resúmenes de IA podrían utilizar el propio trabajo del creador para mantener a las personas en la página de búsqueda en lugar de enviarlas a la fuente original.

Los órganos reguladores siguen realizando consultas sobre estas cuestiones. Mientras tanto, la definición de “uso legítimo” en la era de la IA sigue siendo la cuestión fundamental. Por ahora, Google mantiene la firme idea de que la web abierta es un aula gratuita para su IA, incluso cuando los creadores de ese contenido argumentan que su información “gratuita” es lo que hace que la IA sea valiosa en primer lugar.

Fuente: Android Headlines

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *