Fair use et intelligence artificielle : enseignements de l’ordonnance Anthropic c/ Auteurs

Par une ordonnance du 23 juin 2025, la District Court du Nord de la Californie s’est prononcée sur l’usage non autorisé de millions de livres par Anthropic, à la fois pour entraîner son IA Claude et pour constituer une bibliothèque numérique interne.

Une entreprise d’intelligence artificielle, Anthropic PBC, est poursuivie par des auteurs pour avoir téléchargé, sans autorisation, des millions de livres protégés par le droit d’auteur afin, d’une part, de créer une bibliothèque numérique centrale interne, et, d’autre part, d’entraîner son modèle d’IA « Claude », générateur de revenus estimés à plus d’un milliard de dollars par an.

Pour ce faire, Anthropic a combiné deux méthodes : le téléchargement massif d’ouvrages depuis des sites pirates, et la numérisation de livres papier (incluant des doublons avec les œuvres piratées).

L’enjeu du litige est de déterminer si les usages faits par Anthropic peuvent être qualifiés de fair use, une exception au droit d’auteur américain prévue par la Section 107 du Copyright Act. Cette exception repose sur l’appréciation des quatre critères suivants :

  1. le but et le caractère de l’usage, notamment sa finalité commerciale ou éducative ;
  2. la nature de l’œuvre protégée (factuelle ou expressive) ;
  3. la quantité et la substance de l’œuvre utilisée ;
  4. l’effet de l’usage de la copie sur le marché ou sur la valeur de l’œuvre.

Dans son appréciation, la Cour distingue les usages selon leur finalité – entraînement des IA ou constitution d’une bibliothèque numérique – et dans ce second cas, selon la provenance des œuvres : bases pirates ou sources licites.

L’usage non autorisé d’œuvres pour l’entraînement des IA

Pour apprécier la licéité de l’usage non autorisé des œuvres dans le cadre de l’entraînement de son IA par Anthropic, la Cour choisit de ne pas distinguer selon que les œuvres proviennent de sources licites ou illicites, et procède directement à l’analyse des critères du fair use.

À cet égard, la Cour rappelle qu’aucun contenu généré contrefaisant n’a été constaté. Ces éléments ne font d’ailleurs pas l’objet du litige, le service Claude intégrant notamment un système de filtrage visant à empêcher toute sortie contrefaisante. Ce qui est reproché à Anthropic par les auteurs c’est l’usage non autorisé de leurs œuvres pour l’entraînement de l’IA.

Ainsi, s’agissant du premier critère (le but de l’usage), la Cour estime qu’interdire l’entrainement des IA reviendrait à prohiber toute lecture ou réutilisation intellectuelle d’une œuvre. Si l’accès initial peut être monétisé, il serait inapplicable – pour un humain comme pour une machine – de facturer chaque relecture ou influence ultérieure. De même qu’ils ne peuvent reprocher aux IA de mémoriser des éléments créatifs de leurs œuvres alors que le droit d’auteur protège seulement la forme de l’expression de l’œuvre, et non les idées, concepts ou principes qu’elle contient.

Dès lors, la Cour estime que l’entraînement d’une IA à partir d’œuvres existantes constitue un usage transformateur, analogue au processus par lequel un lecteur devient écrivain et relève du fair use au regard du premier critère de l’analyse.

Il en va de même, selon la Cour, pour le critère de la quantité et de l’importance de la partie utilisée. La Cour précise que ce qui importe n’est pas la quantité d’œuvres ingérées par le modèle, mais la quantité rendue accessible au public – soit en l’espèce, aucune. Une position qui peut sembler contestable, bien qu’elle s’aligne sur certains précédents cités par la juridiction, et qui trahit déjà un certain parti pris.

Pareillement, selon la Cour le critère de l’effet sur le marché ou la valeur des œuvres ne s’oppose pas davantage au fair use. Elle retient à cet égard que les copies utilisées pour l’entraînement n’ont pas remplacé ni ne remplaceront la demande pour les œuvres originales.

Enfin, concernant la nature des œuvres, la Cour reconnaît qu’il ne s’agit pas d’œuvres factuelles mais d’œuvres expressives, ce qui rend leur reproduction moins facilement justifiable.

Ainsi, selon la Cour, qui choisit de ne pas tenir compte de la provenance illicite de certaines copies, l’appréciation globale des critères conduit à reconnaître que l’entraînement d’une IA relève bien de l’exception de fair use, dès lors qu’un seul critère y fait obstacle.

Toutefois, s’agissant des copies illicites, la Cour indique ultérieurement que : 

« Un tel piratage de copies pourtant accessibles légalement constitue en lui-même une contrefaçon incontestable et irrémédiable, même si les copies sont immédiatement utilisées dans le cadre d’un usage transformateur et aussitôt supprimées »
« Cependant, cette ordonnance n’a pas besoin de trancher l’affaire sur la base de cette seule règle. En effet, Anthropic n’a pas utilisé ces copies uniquement pour entraîner ses modèles de langage. L’entreprise a conservé les copies piratées, y compris après avoir décidé qu’elles ne seraient plus jamais utilisées – ni elles ni leurs dérivés – pour l’entraînement de ses IA. Elles ont été acquises et conservées dans l’objectif de constituer une bibliothèque centrale regroupant tous les livres du monde ». (p. 18)

Autrement dit, une lecture a contrario laisse entendre que l’entrainement des IA sur la base d’œuvres pirates serait bien illicite mais que la Cour n’a pas été saisie de cette question ou n’a pas jugé nécessaire d’y répondre, les œuvres en question ayant ensuite été stockées, usage dont la licéité est appréciée séparément par la Cour.

La constitution d’une bibliothèque numérique permanente

La Cour procède ensuite à la même analyse point par point pour l’usage des œuvres dans le cadre d’une bibliothèque centrale interne numérisée permanente, à la différence près que dans le cadre de cette appréciation, elle distingue cette fois pour chaque critère selon que la source de la copie provient d’une numérisation de livres achetés licitement ou d’une base de données pirate.

Les copies issues des achats de livres papier

S’agissant de la numérisation de livres acquis licitement, la Cour examine le premier critère du fair use, relatif au but de l’usage. Les auteurs ne contestent ni l’achat ni l’usage interne, mais critiquent le changement de format, qu’ils jugent attentatoire à leurs droits.

Toutefois, au lieu de prendre en considération la finalité commerciale de la démarche qui relève précisément du critère, la Cour estime que l’essentiel est de déterminer si cette conversion, sans revente ni diffusion, porte réellement atteinte au droit d’auteur, et conclut que la copie numérique équivaut juridiquement à l’exemplaire papier initial, simplement transféré dans la bibliothèque sous un autre format et relève donc du fair use s’agissant du premier critère.

De même, s’agissant du critère de la quantité utilisée, bien que les œuvres aient été reproduites intégralement – ce qui, en principe, s’oppose au fair use – la Cour estime que l’usage demeure circonscrit et proportionné : chaque version numérique ayant remplacé un exemplaire papier détruit, sans production de copies excédentaires. Cette logique plaide, selon elle, en faveur du fair use. Pourtant, le raisonnement peine à convaincre, la copie numérique se distinguant précisément par sa capacité à être démultipliée à l’infini, contrairement à une copie papier.

Pour le troisième critère, relatif à l’effet sur le marché de l’œuvre, la Cour estime qu’il penche également en faveur du fair use, car les copies numériques ne remplacent pas selon elle la demande pour les œuvres des auteurs. Pourtant, un exemplaire papier ne peut être consulté que par une personne à la fois, tandis qu’une version numérisée dans une bibliothèque centrale accessible à l’ensemble du personnel d’Anthropic peut l’être simultanément par plusieurs employés. La numérisation permet ainsi un usage collectif à partir d’un seul exemplaire, évitant l’achat de plusieurs copies. Même sans appliquer une logique strictement française, le raisonnement de la Cour reste donc ici également peu convaincant.

Enfin, le critère de la nature des œuvres qui sont expressives et non factuelles s’oppose au fair use comme précédemment indiqué.

Ainsi, la Cour conclut que la conversion de livres papier acquis licitement en copies numériques internes, sans diffusion, à des fins de recherche et de conservation, relève du fair use. Une conclusion toutefois contestable en ce qu’elle repose sur un postulat de départ biaisé, à savoir que d’un point de vue pratique comme économique, une copie numérique vaudrait une copie papier.

Pourtant, la copie numérique présente de nombreux avantages sur la copie papier : fouille de texte, consultation simultanée par plusieurs utilisateurs, possibilité de téléchargement illimité, accessibilité depuis n’importe quel terminal… Autant de fonctionnalités qui lui confèrent une valeur propre, bien supérieure à la simple détention d’un exemplaire imprimé. Conscients de cet écart, les acteurs du marché de l’édition encadrent strictement la diffusion des livres numériques grâce à des garde-fous techniques (DRM) et juridiques (licences d’utilisation), qui limitent notamment le nombre d’appareils autorisés, interdisent le copier-coller ou encore bloquent le partage de fichiers. Or, en numérisant elle-même des livres papier pour constituer sa propre bibliothèque numérique, Anthropic s’est affranchie de l’ensemble de ces restrictions habituellement imposées aux utilisateurs légitimes.

Les copies issues des bases pirates

S’agissant des œuvres obtenues illicitement, la Cour relève tout d’abord qu’Anthropic a téléchargé plus de sept millions de copies piratées de livres, sans rien payer, et qu’elle a conservé ces copies, y compris après avoir décidé qu’elles ne seraient pas utilisées pour entraîner ses modèles d’intelligence artificielle.

La Cour relève ensuite que l’ensemble des critères du fair use s’oppose à la licéité de l’usage de sorte qu’un procès aura lieu concernant l’usage de ces copies piratées pour la constitution de la bibliothèque centrale d’Anthropic.

Pour aller plus loin…

La lecture de la décision, d’apparence très didactique avec une appréciation méthodique de chacun des critères du fair use américain, laisse pourtant sceptique, tant elle semble adoptée dans une posture particulièrement favorable aux développeurs d’intelligence artificielle.

En effet, tout d’abord si la Cour prend soin de distinguer, dans le cadre de la constitution d’une bibliothèque numérique, selon que la source des copies est licite ou illicite, elle ne procède à aucune distinction de la sorte s’agissant de l’entraînement des IA. Elle évite ainsi de trancher la question centrale de la licéité de l’entraînement réalisé à partir d’œuvres acquises illicitement, dès lors que les copies sont ensuite détruites. En éludant cette question, la Cour laisse donc planer une insécurité juridique majeure.

Par ailleurs, on peut comprendre – sans nécessairement y souscrire – le raisonnement de la Cour quant à l’application du fair use à l’entraînement des IA dans la mesure où elle s’en tient à une lecture littérale des critères. Toutefois, cette analyse fait abstraction d’un élément essentiel : le profit considérable tiré par Anthropic de l’utilisation, sans contrepartie, de millions d’œuvres protégées par le droit d’auteur. En validant un tel modèle économique, la Cour consacre donc une captation de valeur au détriment des ayants droit, privés de toute rémunération équitable. En droit français, si la qualification de contrefaçon pour ce type d’usage reste incertaine, une telle appropriation pourrait sans doute néanmoins a minima être sanctionnée sur le terrain du parasitisme, en raison du profit indûment tiré de la création d’autrui.

Enfin et surtout, la décision apparaît juridiquement, économiquement et éthiquement contestable en ce qu’elle valide la constitution d’une bibliothèque numérique interne sans autorisation des ayants droit. Une telle décision rompt en effet avec l’ensemble des mécanismes économiques construits par le secteur de l’édition pour encadrer les usages numériques et en limiter la reproductibilité sans contrepartie pour les ayants droit. Elle fragilise ainsi tout un écosystème économique fondé sur la distribution contrôlée des œuvres et le respect de la chaîne de valeur et pourrait donc avoir un impact profond sur l’équilibre du marché de l’édition.

 

US District Court, Northern district of California, 23 juin 2025, n° C 24-05417

par Agathe Zajdela, Avocat of counsel, cabinet DTMV

© Lefebvre Dalloz