En su propuesta para la revisión en curso del marco regulador australiano de la IA, Google ha pedido leyes de copyright más laxas para los datos de entrenamiento de IA.
En los últimos meses, Australia ha acelerado el ritmo al que intenta regular el uso de la IA dentro de sus fronteras. Ha iniciado una revisión de la marco regulador de la IA en junio y uno de los puntos de debate es cómo se utilizan los datos en línea para entrenar modelos de IA.
Google apoya desde hace tiempo un enfoque de "uso justo" en lugar de leyes de derechos de autor más estrictas que bloquearían por completo los raspadores de datos de IA. Un ejemplo de uso justo es la forma en que Google rastrea Internet para ofrecer resultados de búsqueda válidos.
El rastreador web de Google copia parte del contenido de un sitio web y luego lo muestra en los resultados de búsqueda. En la mayoría de los casos, nadie lo considera una infracción de los derechos de autor. Si no quieres que Google rastree tu sitio, puedes bloquear su rastreador web.
En su propuesta a las autoridades australianas, Google sugiere que se permita a empresas como ella raspar material publicado para entrenar sus modelos de IA, a menos que los editores opten activamente por no hacerlo. OpenAI también seguirá este debate con interés después de que recientemente liberando su rascador GPTbot.
En un entrada del blog en julioGoogle sugirió a los editores que tal vez podrían utilizar un enfoque similar a la forma en que los sitios web utilizan sus archivos robots.txt. Estos archivos contienen instrucciones que permiten o impiden a Google rastrear el sitio para su motor de búsqueda.
Los derechos de autor no funcionan así
Sin embargo, la solución que propone Google es contraria al principio de los derechos de autor.
La doctora Kayleen Manwaring, profesora titular de Derecho y Justicia de la UNSW, declaró a The Guardian: "Si quieres reproducir algo que está en manos de un titular de derechos de autor, tienes que obtener su consentimiento, no un tipo de acuerdo de exclusión voluntaria... lo que están sugiriendo es una renovación total del funcionamiento de las excepciones".
Eso tiene sentido. Si quieres copiar y utilizar el trabajo de alguien tienes que pedirle permiso. Google te lo sugiere si no le has dicho expresamente que no lo haga, entonces sus datos deben ser juego limpio.
Los creativos de diversos géneros denuncian la consumo al por mayor de su trabajo por las IA generativas, Google puede estar nadando a contracorriente en esta cuestión.
A sus problemas se añade la restricción de la forma en que Google raspa y utiliza actualmente los contenidos de los editores de noticias.
En última instancia, los usuarios quieren disponer de herramientas de IA útiles, y eso requiere que los modelos de IA se entrenen con muchos contenidos generados por humanos. Encontrar una forma equitativa de hacerlo no va a ser fácil.