• 23/11/2024

The New York Times prohíbe usar su contenido para entrenar modelos de IA

The New York Times ha tomado medidas preventivas para evitar que su contenido se utilice para entrenar modelos de inteligencia artificial. Según lo informado por Adweek, el NYT actualizó sus Términos de servicio el 3 de agosto para prohibir que su contenido, incluido el texto, las fotografías, las imágenes, los clips de audio/video, el “aspecto y la sensación”, los metadatos o las compilaciones, se use en el desarrollo. de “cualquier programa de software, incluido, entre otros, el entrenamiento de un sistema de aprendizaje automático o inteligencia artificial (IA)”.

Los términos actualizados ahora también especifican que las herramientas automatizadas como los rastreadores de sitios web diseñados para usar, acceder o recopilar dicho contenido no se pueden usar sin el permiso por escrito de la publicación. El NYT dice que negarse a cumplir con estas nuevas restricciones podría resultar en multas o sanciones no especificadas. A pesar de introducir las nuevas reglas en su política, la publicación no parece haber realizado ningún cambio en su archivo robots.txt, el archivo que informa a los rastreadores de los motores de búsqueda a qué URL se puede acceder.

La medida podría ser en respuesta a una actualización reciente de la política de privacidad de Google que revela que el gigante de las búsquedas puede recopilar datos públicos de la web para entrenar sus diversos servicios de IA, como Bard o Cloud AI. Muchos modelos de lenguaje grande que impulsan los servicios populares de IA, como ChatGPT de OpenAI, están entrenados en grandes conjuntos de datos que podrían contener materiales con derechos de autor o protegidos de otro modo extraídos de la web sin el permiso del creador original.

Dicho esto, el NYT también firmó un acuerdo de $100 millones con Google en febrero que le permite al gigante de las búsquedas presentar contenido del Times en algunas de sus plataformas durante los próximos tres años. La publicación dijo que ambas compañías trabajarán juntas en herramientas para distribución de contenido, suscripciones, marketing, anuncios y “experimentación”, por lo que es posible que los cambios en los términos de servicio del NYT estén dirigidos a otras compañías como OpenAI o Microsoft. Semafor informó el domingo que el Times se había retirado de una coalición de medios que intentaba negociar conjuntamente con empresas de tecnología sobre datos de capacitación de IA, lo que significa que si llega a acuerdos con empresas, podría ser más probable caso por caso.

OpenAI anunció recientemente que los operadores de sitios web ahora pueden bloquear su rastreador web GPTBot para que no raspe sus sitios web. Microsoft también agregó algunas restricciones nuevas a sus propios T&C que prohíben que las personas usen sus productos de IA para “crear, entrenar o mejorar (directa o indirectamente) cualquier otro servicio de IA”, además de prohibir a los usuarios raspar o extraer datos de sus herramientas de IA.

A principios de este mes, varias organizaciones de noticias, incluidas The Associated Press y el Consejo Europeo de Editores, firmaron una carta abierta en la que pedían a los legisladores mundiales que introdujeran reglas que exigirían transparencia en los conjuntos de datos de capacitación y el consentimiento de los titulares de derechos antes de usar los datos para la capacitación.

0 Comments

Leave a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *