Dans sa contribution à l'examen en cours du cadre réglementaire australien en matière d'IA, Google a demandé un assouplissement des lois sur le droit d'auteur pour les données d'apprentissage de l'IA.
Ces derniers mois, l'Australie a accéléré le rythme de ses efforts pour réglementer l'utilisation de l'IA à l'intérieur de ses frontières. Elle a entamé un examen de la le cadre réglementaire de l'IA en juin et l'un des points de discussion est la façon dont les données en ligne sont utilisées pour former des modèles d'intelligence artificielle.
Google soutient depuis longtemps l'approche du "fair use" plutôt que des lois plus strictes sur les droits d'auteur qui bloqueraient complètement les racleurs de données d'IA. Un exemple d'utilisation équitable est la manière dont Google explore l'internet pour fournir des résultats de recherche valables.
Le robot d'exploration de Google copie une partie du contenu d'un site web et l'affiche ensuite dans les résultats de recherche. Dans la plupart des cas, personne ne considère qu'il s'agit d'une violation du droit d'auteur. Si vous ne souhaitez pas que Google explore votre site, vous pouvez bloquer son moteur de recherche.
Dans sa présentation aux autorités australiennes, Google suggère que les entreprises comme la sienne soient autorisées à récupérer du matériel publié pour entraîner ses modèles d'intelligence artificielle, à moins que les éditeurs ne s'y opposent activement. L'OpenAI suivra également cette discussion avec intérêt après avoir récemment publie son scraper GPTbot.
Dans un article de blog en juilletGoogle a suggéré que les éditeurs pourraient peut-être utiliser une approche similaire à celle utilisée par les sites web pour leurs fichiers robots.txt. Ces fichiers contiennent actuellement des instructions qui autorisent ou non Google à explorer le site pour son moteur de recherche.
Ce n'est pas ainsi que fonctionne le droit d'auteur
La solution proposée par Google va cependant à l'encontre du principe du droit d'auteur.
Kayleen Manwaring, maître de conférences à l'UNSW Law and Justice, a déclaré au Guardian : "Si vous voulez reproduire quelque chose qui est détenu par un propriétaire de droits d'auteur, vous devez obtenir son consentement, et non pas un arrangement de type opt-out ... ce qu'ils suggèrent est une révision complète de la façon dont les exceptions fonctionnent".
C'est logique. Si vous souhaitez copier et utiliser le travail de quelqu'un, vous devez lui en demander l'autorisation. C'est ce que suggère Google si vous ne lui avez pas expressément demandé de ne pas le faire, alors vos données devraient être prises en compte.
Les créateurs de tous les genres ont décrié la la consommation en gros de leur travail par les IA génératives, Google nage peut-être à contre-courant sur cette question.
La restriction de la manière dont Google récupère et utilise actuellement le contenu des éditeurs de presse ne fait qu'ajouter à ses difficultés.
En fin de compte, les utilisateurs veulent disposer d'outils d'IA utiles, ce qui suppose que les modèles d'IA soient formés à partir d'un grand nombre de contenus générés par l'homme. Il ne sera pas facile de trouver un moyen équitable d'y parvenir.