Premier round judiciaire aux US : les IA génératives prennent l’avantage sur les artistes

Une première ordonnance a été rendue par le Tribunal californien dans le cadre de l’action de groupe qui oppose Midjourney, Stable Diffusion et DeviantArt à trois artistes notamment pour violation de leur copyright lors de l’entraînement et de l’utilisation des programmes d’IA génératives. Le verdict ne semble pas surprenant et opte pour un statu quo en faveur des développeurs des IA génératives.

Le 30 octobre 2023, une première ordonnance a été rendue dans l’affaire Sarah Andersen. Le juge californien a statué sur les motions de rejet et de radiation introduites par Stability AI Ltd., et Stability AI, Inc., DeviantArt, Inc. et Midjourney, Inc.

Les trois géants de l’intelligence artificielle (IA) générative ont été attraits devant la justice américaine à l’occasion d’une action de groupe initiée par trois artistes américains en janvier 2023.

Il est notamment reproché à Stability AI, DeviantArt et Midjourney d’avoir entraîné leurs programmes d’IA génératives sur les bases de données LAION (Large-scale Artificial Intelligence Open Network), qui incluent les œuvres des trois artistes et d’avoir permis aux utilisateurs des IA génératives de générer des œuvres « dans le style » des trois artistes grâce à des prompts incluant leurs noms et prénoms.

Plus précisément, les demandeurs allèguent que « chaque image produite par le système est dérivée exclusivement des images latentes, qui sont des copies d’images protégées par le copyright », ce qui a pour effet de qualifier les productions générées par IA d’« œuvres dérivées », pour la production desquelles le consentement des auteurs des œuvres préexistantes est nécessaire.

Les artistes ont fondé leur action contre les géants de l’IA génératives sur des violations directes et indirectes du copyright, le non-respect du DMCA (Digital Millenium Copyright Act), des violations de leur droit de publicité ainsi que des manquements contractuels et des actes de concurrence déloyale. Nous allons revenir sur les fondements qui ont attiré notre attention.

Artistes en demande : pour une place dans la chaîne de valeur des IA génératives

Dans le contexte actuel de captation de la valeur de la création par les IA génératives, les demandes des artistes, bien que formulées en des termes juridiques, semblent claires : ils réclament leur part du gâteau.

Pour cela, trois principaux fondements juridiques sont éprouvés par les artistes, le fondement de la violation du copyright, le fondement de la responsabilité contractuelle et le fondement de la concurrence déloyale.

Concernant le fondement de la violation du copyright, afin de prouver l’entraînement des programmes d’IA génératives sur leurs œuvres, les demandeurs se réfèrent aux déclarations publiques respectives de développeurs de ces IA, au sujet des bases de données sur lesquelles les IA sont entraînées. Stability AI avait déclaré sans ambiguïté que son programme d’IA générative était entraîné sur les bases de données LAION. Le CEO de Midjourney était quant à lui resté beaucoup plus vague, indiquant que son programme d’IA générative s’entraînait sur la base « d’une grande exploration de l’internet, nous utilisons les ensembles de données ouvertes qui sont publiées et nous nous entraînons à travers elles ». DeviantArt, qui est principalement une galerie en ligne, aurait quant à lui grandement contribué à alimenter les bases de données LAION. À titre de preuve, les artistes ont également utilisé l’outil Have I been Trained, qui permet de détecter si une œuvre est intégrée au sein des bases de données LAION.

Mais prouver que leurs œuvres sont incluses dans les bases de données LAION, alimentées par DeviantArt, sur lesquelles s’entraînent les programmes d’IA génératives de Stability AI et Midjourney ne suffit pas, les artistes doivent également prouver des actes de reproduction non autorisés de leurs œuvres dans le cadre de l’entraînement et/ou de l’utilisation des IA générative. Pour ce faire, les demandeurs allèguent que Stability AI et Midjourney entraînent leurs programmes d’IA générative sur des copies compressées de leurs œuvres. En dépit de preuves tangibles concernant le fonctionnement des algorithmes et programmes utilisés par Stability AI et Midjourney, les demandeurs proposent des « théories » concernant les actes de reproduction non autorisés de leurs œuvres par les IA génératives.

Concernant le fondement de la responsabilité contractuelle, les demandeurs soulèvent un manquement à ses propres Conditions de service de la part de DeviantArt. Lesdites Conditions de service restreignent la licence sur les œuvres des artistes octroyée à DeviantArt aux seules fins de présentation des œuvres au sein de la galerie du site web. Dès lors, les artistes soutiennent qu’en proposant le service de génération d’images DreamUp (développé par Stability AI et entraîné sur les bases de données LAION) au sein de ses offres, DeviantArt a violé les termes de la licence stipulés dans ses Conditions de service.

Enfin, l’intégration du programme d’IA générative DreamUp au sein des offres de DeviantArt est assimilée par les artistes à un manquement contractuel entraînant une situation de concurrence déloyale à leur détriment, car leurs œuvres sont utilisées à des fins commerciales sans leur consentement.

Défense des développeurs d’IA génératives : retranchement attendu derrière les lacunes du droit

La lecture de cette ordonnance a le mérite de ne pas surprendre, toutes les lacunes du droit face au développement des IA génératives, pointées depuis des mois par les auteurs, y sont allégrement exploitées par les développeurs d’IA génératives. À commencer par les défaillances du cadre légal actuel vis-à-vis de la preuve de la violation de droits de propriété intellectuelle dans le contexte de l’entraînement et/ou de l’utilisation de programmes d’IA générative.

En réponse aux allégations des demandeurs, Midjourney et DeviantArt rétorquent que ceux-ci ne rapportent aucune preuve de l’entraînement de leurs programmes d’IA générative sur les bases de données LAION. Et pour cause, ces derniers ont toujours cultivé la plus grande opacité concernant les données sur lesquelles ils entraînent leurs programmes d’IA générative. Seul Stability AI, faisant spontanément preuve de transparence (ce qu’il semble payer aujourd’hui), avait publiquement déclaré entraîner son programme d’IA générative sur les bases de données LAION.

Le même retranchement derrière la charge de la preuve est à l’œuvre lorsqu’au sujet de la présence « de copies compressées » [des œuvres] sur les bases de données qui entraînent les programmes d’IA générative, les développeurs de ces IA soutiennent que « ces affirmations ne sont pas plausibles étant donné que les plaignants affirment que les bases données d’entraînement sont composées de cinq milliards d’images ; cinq milliards d’images ne pourraient pas être comprimées dans un programme actif ». Ou encore que « les allégations de « copies compressées » sont contredites par les descriptions du processus de diffusion faites par les demandeurs, puisque ces descriptions admettent que le processus de diffusion n’implique pas la copie d’images, mais plutôt l’application d’équations mathématiques et d’algorithmes pour capturer les concepts des images d’entraînement ». Autrement dit, le processus actuellement utilisé par la plupart des programmes d’IA génératives d’images, consistant à dégrader une image, notamment grâce à l’ajout de bruit, pour la rendre méconnaissable et entraîner le programme d’IA générative à recomposer l’image d’origine à partir de l’image dégradée, constitue-t-il un acte de reproduction non-autorisé d’une œuvre ?

Les défendeurs balaient également l’argument relatif à la qualification « d’œuvre dérivée » des productions générées par les IA, faute de similarité substantielle entre les données sortantes et les données d’entraînement des IA génératives.

Sur le volet de la responsabilité contractuelle de DeviantArt pour manquement à ses propres Conditions d’utilisation, il est allégué par le défendeur que la licence dont il est question ne restreint que les utilisateurs du site web concernant l’usage commercial des images et ne restreint pas DeviantArt lui-même, qui avait donc toute la latitude pour céder sa base de données afin d’entraîner des programmes d’IA génératives.

Verdict californien : statu quo tendant vers les développeurs d’IA générative

L’ordonnance du juge californien semble opter pour le statu quo en faveur des développeurs d’IA génératives. C’est sans opposer de résistance qu’il écarte les arguments relatifs à la violation du copyright des demandeurs à l’encontre de DeviantArt et Midjourney, faute de preuves, pour ne conserver que les demandes sur ce fondement à l’encontre de Stability AI. Il convient de noter que le juge laisse la possibilité aux demandeurs de clarifier les allégations de violation du copyright [rapporter des preuves] à l’encontre de DeviantArt et Midjourney. La capacité d’opérer une telle clarification pour les demandeurs semble bien compromise et cela donne un exemple concret de l’intérêt d’imposer une obligation de transparence sur les bases de données d’entraînement des IA génératives, mesure qui est actuellement à l’étude devant le Parlement européen.

La juridiction californienne fait peu de cas de la violation alléguée de leur droit à la publicité par les artistes, autrement dit le fait qu’il soit possible d’utiliser leurs noms et prénoms dans des « prompts » afin d’obtenir une production générée par IA dans un style artistique imitant le leur, ainsi que des demandes visant à requalifier les productions générées par IA en « œuvre dérivée ». Ces demandes sont rejetées avec possibilité pour les demandeurs de les clarifier. Au sujet de la qualification des productions générées par IA en « œuvres dérivées », le juge ajoute cependant que, « même si la clarification est apportée, je ne suis pas convaincu que les revendications basées sur la théorie des œuvres dérivées puissent aboutir en l’absence d’allégations de « similitude substantielle » [concernant les productions générées par IA et les images d’entraînement] ».

Les demandes fondées sur la responsabilité contractuelle et la concurrence déloyale sont également rejetées sous réserve de clarification. À l’issue de cette ordonnance, le juge semble indiquer qu’en l’état, seule la question de savoir si Stability AI [dont la base d’entraînement est publiquement dévoilée] a violé le copyright des artistes en demande dans le cadre de l’entraînement et/ ou de l’utilisation de son programme d’IA générative, sous réserve cependant d’obtenir des clarifications quant à la présence ou non de « copies compressées » au sein de son programme d’IA générative.

Inspirés par le schéma des données personnelles que les utilisateurs donnent volontiers en échange de services gratuits (notamment de réseaux sociaux), les géants de la Tech semblent vouloir appliquer une doctrine similaire aux œuvres qui entraînent les IA génératives. Mais comment justifier que des auteurs contribuent gratuitement via leurs œuvres au fonctionnement de services d’IA générative payants ?

Affaire à suivre donc, nous porterons une attention toute particulière aux questions qui se dessinent en creux, qui sont celles de savoir si les auteurs pourront être intégrés à la chaîne de valeur des IA génératives et si oui sur quel fondement et de quelle manière ?

 

© Lefebvre Dalloz