The Guardian has joined other media outlets in blocking OpenAI's bot activity to prevent their content from being used to train generative AI capabilities without permission. Over 15% of the top 1,000 websites globally have chosen to block access to their content by OpenAI's bot. There are suspicions that OpenAI has used copyrighted content without revealing its sources, leading to legal actions from creative industries.
The Guardian, al igual que The New York Times, Bloomberg o Reuters, ha decidido unirse a la lista de medios que bloquean la actividad del bot de OpenAI, la empresa creadora de ChatGPT. Esta medida busca evitar que su contenido sea utilizado para entrenar capacidades en inteligencia artificial generativa o como base en derivados.
“La extracción de propiedad intelectual del sitio web de The Guardian es, y siempre ha sido, contraria a nuestros términos de servicio”, señaló un portavoz del periódico británico. Además, recordó que la compañía cuenta con un equipo de licencias que ha establecido acuerdos "de beneficio mutuo" con desarrolladores de todo el mundo a lo largo de los años y espera construir más relaciones similares en el futuro.
La extracción de propiedad intelectual del sitio web de The Guardian es, y siempre ha sido, contraria a nuestros términos de servicio”
A finales de agosto, más del 15% de las 1.000 páginas web más populares a nivel mundial habían elegido la opción de utilizar piezas creadas mediante procesos automáticos, según el análisis realizado por Originality.ai, una empresa especializada en la detección de este tipo de contenido. Entre estas páginas se encuentran las de medios muy importantes como The New York Times, The Washington Post, CNN, Bloomberg y Reuters. Estos medios consideran que OpenAI ha utilizado su trabajo de décadas sin licencia en mayor o menor medida.
Hace algunas semanas, esa compañía implementó una solución técnica para que los propietarios de cualquier sitio web puedan bloquear el acceso a sus contenidos por parte de su bot rastreador, con el fin de evitar posibles acciones legales en el futuro. Actualmente, es la única empresa que ofrece esta opción, ya que tanto Google como Microsoft no permiten distinguir entre sus bots de inteligencia artificial y aquellos que rastrean para posicionar en sus buscadores. Estos dos gigantes tecnológicos son los principales competidores en el campo de la inteligencia artificial generativa, que se centra en mejorar la experiencia de búsqueda de información.
Los propietarios de cualquier sitio web puedan bloquear el acceso a sus contenidos por parte de su bot rastreador
En los últimos tiempos, ha surgido una creciente sospecha de que OpenAI ha estado utilizando información cuyo origen no revela para entrenar ChatGPT. Se cree que parte de esta información proviene de fuentes con contenido protegido por derechos de autor. Hasta ahora, solo se ha confirmado un importante acuerdo entre OpenAI y Associated Press en relación a este tema. Sin embargo, varios actores de las industrias creativas han iniciado acciones legales contra OpenAI o están en proceso de hacerlo.