Reddit quiere un mejor trato de Google por sus datos de alimentación de AI

El uso de datos sigue siendo un tema controvertido en el mundo de inteligencia artificial. En un intento por calmar las aguas, los principales actores de la industria han llegado a los acuerdos de las plataformas sociales o de contenido. Uno de esos casos es la asociación entre Reddit y Google. Ahora, en un desarrollo relacionado, Reddit está en conversaciones con Google para revisar su acuerdo de intercambio de contenido para la capacitación de IA, que originalmente se estableció hace más de un año por un anual de $ 60 millones reportados.

Las conversaciones entre las dos compañías se centran en dos áreas clave (reportadas por Bloomberg). Primero, según los informes, Reddit está proponiendo una estructura de New Deal que se alejaría de un pago fijo hacia un modelo de precios dinámicos. Según este modelo, la compensación de Reddit se determinaría con la frecuencia con la que se cita o se usa su contenido como fuente de respuestas generadas por plataformas de IA como las descripciones de IA de Google. Los ejecutivos de Reddit creen que los términos actuales no reflejan adecuadamente el valor de sus datos a las compañías de IA.

Reddit quiere un acuerdo de IA con Google que les brinde más tráfico y usuarios

Segundo, Reddit está buscando Un tipo diferente de asociación que alentaría más del tráfico que recibe de Google para convertirse en miembros activos de la comunidad. Este esfuerzo tiene como objetivo abordar un desafío en la relación actual: los usuarios que encuentran respuestas del contenido de Reddit en Google a menudo no visitan la plataforma misma. Esto limita la capacidad de Reddit para hacer crecer su base de usuarios y generar un nuevo contenido para la futura capacitación de IA. Al encontrar una manera de profundizar la participación del usuario, la asociación podría proporcionar una fuente más consistente de datos de alta calidad para los modelos de IA.

Las discusiones se están llevando a cabo porque los datos de Reddit son un recurso valioso para las empresas de IA. Los modelos de idiomas grandes obtienen vastas conjuntos de datos raspados de Internet. El formato único de Reddit, con sus conversaciones en profundidad impulsadas por el usuario en una amplia gama de temas, es una fuente frecuentemente citada. Los datos sugieren que Reddit es el dominio más citado para herramientas de IA como Perplexity y las propias descripciones de IA de Google.

Otros editores y plataformas que buscan una compensación justa

Esta situación no es exclusiva de Reddit. Otros proveedores de contenido, incluidos los editores de noticias, también han abordado cómo se utiliza su trabajo para capacitar a los modelos de IA. El New York Times, por ejemplo, ha demandado tanto a Openai como a Google. La plataforma de medios alega que su trabajo fue utilizado incorrectamente. En un caso similar, Reddit también ha demandado al rival rival de Operai. En este caso, el redes sociales Platform alegó que la startup de IA raspó ilegalmente sus datos para capacitar a sus modelos.

El resultado de Reddit y Google Talks aún está pendiente. Sin embargo, las discusiones destacan cómo las plataformas de contenido buscan establecer nuevas formas de obtener una compensación justa por su contenido.

Fuente: Android Headlines

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *