"Copyright and AI", une consultation anglaise en cours
La consultation présentée par le gouvernement anglais en décembre dernier (Copyright and AI. Consultation presented to Parliament by the Secretary of State for Science, Innovation and Technology by Command of His Majesty, IPO, December 2024) intervient alors que se tiendra à Paris, le 10 février prochain, le sommet pour l’action sur l’IA et le contre-sommet de l’IA au Théâtre de la Concorde.
 
                            Cette consultation est justifiée par la volonté du gouvernement de définir un cadre relatif au copyright et à l’IA permettant de récompenser la créativité humaine, d’encourager l’innovation et d’offrir la sécurité juridique nécessaire à la croissance à long terme de ces deux secteurs.
Le copyright est à la base de l’industrie créative que le gouvernement entend préserver et développer, tout autant que le secteur de l’IA. Il permet aux créateurs de contrôler l’utilisation de leurs créations et d’être rémunérés en conséquence. Si la question de la qualification des productions générées par « les intelligences artificielles » – objets protégés en tant qu’œuvre ? – est posée par cette consultation, c’est parce que le droit anglais prévoit une protection spéciale pour les œuvres générées par ordinateur. Mais l’essentiel du débat proposé porte sur la question du respect des droits du titulaire de copyright et spécialement lors de l’entraînement des systèmes d’intelligence artificielle.
Les questions posées par l’entraînement des modèles d’IA
Les modèles d’IA sont entraînés sur des volumes de « données » de plus en plus importants. S’agissant des IA génératives, ces données ou contenus constituent, pour nombre d’entre elles, des œuvres ou objets protégés par le copyright. Or, comme le souligne le gouvernement pour expliquer l’objet de la consultation, les créateurs et autres titulaires ont le droit d’autoriser ou d’interdire certains actes, spécialement la reproduction et la communication au public de leurs œuvres, ce qui leur permet d’être rémunérés pour l’utilisation de leurs créations le cas échéant.
L’exploration de données nécessaire à l’entraînement de ces modèles d’IA implique, selon le gouvernement anglais, une reproduction devant par principe être autorisée, sous réserve de l’application d’une exception. Or, comme la consultation en fait état, si certaines œuvres sont concédées sous licence aux développeurs d’IA à cette fin ou que d’autres peuvent être disponibles sous « licence ouverte », dans de nombreux cas, les modèles d’IA sont entraînés à l’aide d’œuvres mises à la disposition du public sur l’internet.
Faute d’une licence expresse pour un tel apprentissage, leurs créateurs ne sont pas rémunérés pour une telle utilisation de leurs créations. D’ailleurs, en général, faute d’informations sur les œuvres ou autres objets protégés par le copyright utilisés pour former les modèles d’IA, les créateurs ne savent pas que leurs œuvres sont ainsi utilisées. Alors que les fournisseurs et les utilisateurs d’IA bénéficient de l’utilisation de leurs créations, les auteurs et autres titulaires de droits ne partagent pas la valeur générée.
La mise en œuvre du droit d’autoriser et d’interdire la reproduction et la communication au public des œuvres et autres objets protégées par le copyright dans le cadre de l’entraînement des modèles d’IA est ainsi au cœur des travaux du gouvernement et des interrogations soumises à consultation.
La nécessité d’une consultation
Le constat fait par le gouvernement d’actes de reproduction d’œuvres et autre objets protégés, sans autorisation, aux fins de l’exploration nécessaire à l’entraînement des modèles d’IA – qui n’est pas démontré ou explicité dans la consultation – implique de s’interroger sur l’existence d’une exception prévue par la loi anglaise et qui pourrait s’appliquer ou sur la nécessité de créer une nouvelle exception.
Certains développeurs d’IA soutiennent que les exceptions existantes dans la loi anglaise (Copyright Designs and Patent Act, ci-après CDPA) et plus précisément l’exception de reproduction temporaire et l’exception de fouille de texte et de données à finalité non commerciale, leur permettent d’utiliser des œuvres protégées aux fins d’entraînement des IA au Royaume-Uni et que si leurs activités se déroulent dans d’autres pays, ils ne sont pas soumis à cette loi.
Ces arguments sont contestés par les titulaires de droits, qui estiment que leurs droits leur permettent de contrôler de telles utilisations et, le cas échéant, d’être rémunérés à ce titre. Le gouvernement relevant ainsi, d’une part, une discussion et partant une incertitude et, d’autre part, les difficultés exprimées par ces acteurs de respecter le droit, considère que la législation sur le droit d’auteur devrait permettre aux créateurs et aux titulaires de droits d’exercer un contrôle sur l’utilisation de leurs œuvres pour l’entraînement des modèles d’IA et de demander une rémunération pour cette utilisation. Mais la loi doit également garantir aux développeurs d’IA un accès facile à « un large éventail de contenus créatifs de haute qualité ».
Pour le gouvernement, les développeurs d’IA devraient faire preuve de transparence quant aux « données » (nous ajoutons les guillemets pour souligner que l’on vise ici aussi des œuvres et autres objets protégés par le copyright) utilisées pour former les modèles génératifs et aux résultats qu’ils produisent, afin de permettre aux créateurs de comprendre quand et comment leurs créations ont été utilisées.
Si des contentieux sont en cours devant les juridictions anglaises, le gouvernement estime que le fait d’attendre la résolution de ces affaires n’apportera pas les solutions, la sécurité juridique dont les industries créatives et de l’IA ont besoin maintenant, raison pour laquelle la consultation est menée.
Les objectifs et les options possibles
Le gouvernement, excluant de ne rien faire, identifie trois options en regard des objectifs qu’il fixe en termes de contrôle (des titulaires de droits), d’accès (des développeurs d’IA) et de transparence (entre les deux) pour résoudre cette situation, et garantir la sécurité juridique.
La première consisterait à renforcer la protection du copyright en considérant qu’une autorisation est requise dans tous les cas. Elle répondrait à l’exigence de sécurité juridique nécessaire pour permettre et encourager les investissements notamment et surtout préserver la fonction du copyright ainsi que le développement des modèles d’IA. Mais le droit de l’Union ou le droit américain ayant retenu des solutions plus équilibrées, plus souples, un tel choix pose un problème de compétitivité. Une telle option ne permettant pas d’encourager l’industrie de l’IA, elle est également écartée.
La seconde option est de reconnaître une « large » exception de fouille de textes et de données (ci-après exception TDM). Mais le gouvernement considère qu’elle risquerait de freiner la croissance du secteur culturel et serait sans doute incompatible avec les obligations internationales du Royaume-Uni.
À cette solution radicale, est préférée la troisième option : reconnaître une nouvelle exception TDM (la loi anglaise a déjà consacré une telle exception à des fins de recherche, section 29A du CDPA) avec un système d’opt-out et des mesures de transparence. La réservation des droits pourrait être individuelle ou collective et les moyens de cet opt-out devraient être clairs, effectifs et standardisés en collaboration avec l’Union européenne notamment. Une telle exception encouragerait le marché des licences. Dans cette perspective, la consultation tend à explorer les meilleures pratiques contractuelles, la solution de la licence collective et la possible implication d’autres structures que les organismes de gestion collective.
Quant à l’indispensable transparence, d’ailleurs envisagée également pour les outputs, le gouvernement semble l’envisager en termes de compliance, et d’exigences variables en fonction de la taille des entreprises notamment. Le gouvernement souligne l’importance d’une pratique commune au niveau européen et même international en matière de transparence. Si une telle exception résulte d’une approche similaire à celle adoptée par l’Union européenne avec l’exception de fouille de textes et de données, prévue par l’article 4 de la directive sur le droit d’auteur du marché unique numérique (Dir. [UE] 2019/790), le gouvernement entend aller plus loin ou mieux en ce qui concerne l’opt-out et la transparence.
La consultation pose par ailleurs la question d’une nécessaire clarification sur l’applicabilité de l’exception existante de « temporary copies ». Le gouvernement, qui entend encourager la recherche et l’innovation s’interroge aussi sur l’exception TDM pour usage non commercial existante (CDPA, section 29A). Il souligne que si le débat public actuel s’est concentré sur les grands modèles commerciaux d’IA générative, les modèles d’IA et l’exploration de données ont de nombreuses autres applications, dont les résultats ne risquent pas d’affecter les industries créatives dans la même mesure. Ainsi en est-il d’applications dans le domaine de la recherche comme par exemple, l’utilisation de l’IA pour identifier des candidats à des médicaments ou des voies de traitement. Soulignant les différences entre l’exception anglaise et celle consacrée par le droit de l’Union (Dir. [UE] 2019/790, art. 3), la première bénéficiant non seulement aux institutions mais également aux chercheurs individuels, la seconde s’étendant notamment, à l’inverse du droit anglais, aux bases de données, le gouvernement cherche donc à déterminer si l’exception anglaise demeure pertinente.
Au-delà de l’entraînement des modèles d’IA, la possible protection par le copyright des outputs
La consultation ne se limite pas aux questions soulevées par l’apprentissage des modèles d’IA. Elle se saisit également des interrogations liées aux « outputs ». La catégorie des « computer-generated works » est discutée quant à sa mise en œuvre en matière d’IA, à son utilité et à son opportunité.
Trois objectifs dictent ici les questions soumises pour trouver une solution : la clarté de la loi en premier lieu ; la fonction du copyright, qui doit encourager et récompenser les outputs créatifs et ne pas mettre de barrières inutiles et enfin, l’équilibre, considérant que le copyright devrait encourager l’effort humain sans entraver le développement technologique.
La possibilité d’une protection des productions de l’IA par le copyright anglais est constatée. La consultation détaille les trois types de protection pouvant s’appliquer, en fonction du type de résultat et de la manière dont elles ont été générées. Une production générée par IA (dans la consultation, le terme « work » est utilisé) peut être considérée comme une œuvre littéraire, dramatique, musicale ou artistique (constituant ce qui est appelé en droit anglais une « œuvre d’auteur »), en vertu de l’article 1(1)(a) du CDPA.
Elle sera protégée si elle est originale, en ce sens qu’elle est la création intellectuelle de son auteur et qu’elle reflète sa personnalité et ses choix créatifs. Tel est le cas pour les productions réalisées à l’aide de l’IA en tant qu’outil, mais dont l’essence créative provient d’un créateur humain (« AI-assisted works »). D’autres « productions de l’IA » peuvent être un enregistrement sonore, un film, une émission ou une édition publiée. Ces « œuvres entrepreneuriales » au sens du droit anglais comme le relève le gouvernement, n’ont pas besoin d’être originales pour bénéficier de la protection. Ainsi, un enregistrement de musique générée par l’IA bénéficiera d’une protection quel que soit le degré de contribution humaine à cette musique. Le titulaire des droits sur une telle œuvre est la personne qui a « pris des dispositions » pour qu’elle soit produite. Enfin l’article 9(3) du CDPA prévoit une protection spécifique pour les « œuvres générées par ordinateur ». Cette protection, d’une durée de cinquante ans, s’applique aux œuvres littéraires, dramatiques, musicales ou artistiques qui sont « générées par ordinateur dans des circonstances telles qu’il n’y a pas d’auteur humain » (sic) de l’œuvre. L’exemple donné est celui d’une IA qui génère une sortie en réponse à un « prompt » de l’utilisateur qui sera considéré comme l’« auteur » d’une telle production.
Le paradoxe étant qu’une telle production n’est protégée qu’à la condition d’être originale. Or, ce critère est très largement associé aux qualités humaines… Si cette contradiction conduit certains à s’interroger sur l’application en pratique de cette disposition, le gouvernement relève l’absence de jurisprudence. Cette protection est également critiquée pour son effet délétère, d’un point de vue économique pour son peu ou pas d’effet incitatif positif et, plus fondamentalement parce que seules les œuvres créées par l’homme mériteraient d’être protégées et qu’une telle protection se fait au détriment de la création humaine.
Là encore, trois options sont identifiées : ne rien faire – solution exclue a priori ; réformer pour clarifier – si des éléments valident l’utilité de la protection ; supprimer la catégorie – l’option avait déjà été discutée en 2021.
Responsabilité, labellisation, deepfakes et autres questions
La consultation interroge également sur le régime actuel de responsabilité s’agissant des productions générées par l’IA et le respect du copyright et sur mesures que les fournisseurs d’IA devraient prendre pour éviter les atteintes à cette protection. Au-delà, la labellisation de ces productions de l’IA est proposée, afin notamment de permettre au public informé de choisir entre écouter par exemple une musique générée par IA ou non. Le gouvernement consulte sur l’opportunité d’une telle obligation, sur ses modalités et relève que le « Bureau de l’IA » a été chargé de publier des lignes directrices et d’encourager les codes de pratique afin d’assurer une mise en œuvre efficace de cette obligation pour préciser les points de vigilance qu’il soumet à discussion.
La consultation propose encore une réflexion sur les deepfakes.
Enfin, conscient du rythme des progrès technologiques, le gouvernement invite aux points de vue sur les nouveaux développements en matière d’innovation dans le domaine de l’IA qui soulèvent de nouvelles questions juridiques en rapport avec le copyright et qui pourraient nécessiter une attention particulière. Il s’interroge ainsi notamment sur les implications de l’utilisation de données synthétiques pour former des modèles d’IA.
La consultation lancée en décembre 2024 se termine le 25 février prochain. Les réponses aux quarante-sept questions posées, que le gouvernement invite à justifier et documenter, lui permettront sans aucun doute de prendre des mesures éclairées.
Copyright and AI consultation, 17 déc. 2024 (en anglais)
© Lefebvre Dalloz