La consolidation de la position française du droit sui generis : enfin une limite pour le scraping de données ?
Pour prononcer l’interdiction prévue par l’article L. 342-1 du code de la propriété intellectuelle, le juge doit, dans le cas d’une extraction et d’une réutilisation du contenu d’une partie substantielle d’une base de données, vérifier si cette exploitation caractérise un risque pour l’amortissement des investissements du producteur de la base de données.
Dans son ouvrage Nexus – Une brève histoire des réseaux d’information, Yuval Noah Harari décrit la lutte pour le contrôle de l’information comme le moteur de l’histoire. Cette lutte s’incarne aujourd’hui juridiquement dans la confrontation entre producteurs de données et agrégateurs. Alors que la technique du web scraping (extraction automatisée) est devenue la norme pour alimenter les intelligences artificielles génératives et les comparateurs, la Cour de cassation vient poser une limite ferme par un arrêt du 15 octobre 2025.
Cette décision est la synthèse et parfois le dépassement de deux décennies de jurisprudence européenne et française (British Horse Racing Board, Ryanair, Leboncoin, CV-Online), la Cour de cassation réussissant à mettre en œuvre le droit sui generis là où d’autres avaient échoué : comment prouver l’investissement quand on ne crée pas la donnée ? Le moteur de recherche est-il un parasite ou un facilitateur ?
Le contexte : la bataille des annonces automobiles
Dans cette affaire, le groupe La Centrale, acteur historique des petites annonces automobiles, a assigné la société ADS4ALL, éditrice du site leparking.fr. Le modèle économique de La Centrale repose sur la confiance : elle permet aux vendeurs de déposer des annonces, qu’elle vérifie et enrichit, pour les proposer aux acheteurs. Le modèle d’ADS4ALL repose sur l’exhaustivité par agrégation : son site leparking.fr fonctionne comme un métamoteur qui « scrape » (aspire) les annonces de multiples sites, dont La Centrale, pour les restituer sur sa propre interface. La Cour d’appel de Paris avait condamné ADS4ALL pour atteinte au droit sui generis des bases de données. L’agrégateur s’est pourvu en cassation, invoquant les grandes jurisprudences passées pour contester la protection de La Centrale.
Qu’est-ce qu’un investissement substantiel ? (De BHRB à La Centrale)
Pour bénéficier de la protection, le producteur doit prouver un investissement substantiel dans la constitution, la vérification ou la présentation de la base. C’est ici que l’histoire jurisprudentielle est cruciale. Par le passé, dans l’arrêt fondateur British Horse Racing Board (BHRB) du 9 novembre 2004 (CJCE 9 nov. 2004, aff. C-203/02, RTD com. 2005. 90, obs. F. Pollaud-Dulian
), la Cour de justice avait refusé la protection aux organisateurs de courses hippiques. La Cour estimait que l’investissement servait à la création des données (organiser la course) et non à leur constitution. De même, dans l’affaire Ryanair c/ Opodo (Com. 10 févr. 2015, n° 12-26.023, Dalloz actualité, 10 mars 2015, obs. J. Daleau ; D. 2015. 908
, note T. Lancrenon
; ibid. 2214, obs. J. Larrieu, C. Le Stanc et P. Tréfigny
; ibid. 2016. 396, obs. J.-P. Clavier, N. Martial-Braz et C. Zolynski
; JT 2015, n° 173, p. 16, obs. X. Delpech
), la compagnie aérienne avait échoué à protéger ses horaires de vols, faute de pouvoir distinguer l’investissement lié à son activité commerciale de celui lié à la base de données. ADS4ALL tentait d’utiliser cette brèche : les annonces sont créées par les utilisateurs (vendeurs), donc La Centrale ne serait pas un producteur légitime.
Cependant, la Cour de cassation confirme ici le revirement amorcé par l’arrêt Leboncoin c/ Entreparticuliers du 5 octobre 2022 (Civ. 1re, 5 oct. 2022, n° 21-16.307, Dalloz actualité, 14 nov. 2022, obs. O. Wang ; D. 2022. 1753
; ibid. 2023. 357, obs. A. Bensamoun, S. Dormont, J. Groffe-Charrier, J. Lapousterle, P. Léger et P. Sirinelli
; ibid. 2150, obs. A. Mendoza-Caminade, C. Le Stanc et P. Tréfigny
; AJDI 2022. 853
; Légipresse 2022. 707, étude C. Alleaume
). Elle écarte la jurisprudence BHRB en se concentrant non pas sur la création, mais sur la vérification. La Cour valide l’analyse selon laquelle La Centrale a réalisé des investissements spécifiques a posteriori pour la vérification des données des vendeurs.
La Cour détaille une liste précise de dépenses qui constituent, selon elle, un investissement substantiel indépendant de l’activité commerciale simple :
• l’acquisition de la licence de la base SIVIN (Système d’immatriculation des véhicules) : Il s’agit ici d’un coût externe objectif. En payant pour accéder aux données officielles de l’État (cartes grises), La Centrale ne se contente pas de stocker l’information du vendeur, elle la croise avec une source administrative fiable. Cet investissement financier direct permet de « nettoyer » la base en rejetant les véhicules inexistants ou mal renseignés. C’est la preuve d’un effort d’obtention de données de vérification ;
• le déploiement du service « auto-visa » pour l’historique : au-delà de l’état civil du véhicule, La Centrale investit dans la transparence technique. Ce service agrège des données sur l’historique (kilométrage, accidents, contrôles techniques). Juridiquement, cela démontre que la plateforme apporte une plus-value informationnelle par rapport à la simple déclaration du vendeur. Elle enrichit la base de données brute avec des métadonnées de confiance coûteuses à produire ;
• les personnels dédiés au contrôle et les logiciels anti-fraude : c’est souvent le point le plus difficile à prouver (v. jurisprudence Ryanair, Com. 10 févr. 2015, n° 12-26.023, préc.). Ici, la Cour reconnaît que la modération n’est pas seulement une nécessité commerciale, mais un investissement pour le producteur de la base. L’utilisation d’algorithmes de détection de fraude et d’équipes humaines pour valider les annonces constitue un « investissement humain et technique substantiel ». Ces coûts visent spécifiquement à maintenir la qualité intrinsèque de la base de données, la distinguant d’un simple « mur d’annonces » non modéré.
Ainsi, la Cour de cassation envoie un message clair : contrairement aux précédentes jurisprudences qui n’avaient pas suffisamment documenté les investissements, La Centrale a réussi à isoler comptablement les dépenses pour les traitements susmentionnés (comparaison avec la base SIVIN, vérification avec le service auto-visa, contrôle anti-fraude), et elle a ainsi pu démontrer son investissement au regard du droit sui generis. La documentation des investissements est donc un élément crucial pour démontrer l’existence du droit des producteurs de bases de données.
Quand l’indexation devient-elle illicite ? (l’application stricte de CV-Online)
Le second débat portait sur la licéité de l’activité du métamoteur. ADS4ALL s’appuyait sur l’arrêt récent de la Cour de justice, CV-Online c/ Melons (CJUE 3 juin 2021, aff. C-762/19, RTD com. 2022. 535, obs. F. Pollaud-Dulian
; ibid. 547, obs. P. Gaudrat
; RTD eur. 2022. 817, obs. E. Treppoz
). Dans cette affaire lettone, la Cour européenne avait jugé que l’activité d’un moteur de recherche spécialisé n’était pas par principe interdite, car elle pouvait favoriser l’accès à l’information sans nuire à l’investissement du producteur.
ADS4ALL se voyait donc comme le « Melons » français, un simple indexeur bénéfique. La Cour de cassation livre ici une interprétation pragmatique et sévère de CV-Online. Elle rappelle que l’exception tombe si l’extraction crée un risque pour l’amortissement de l’investissement. La Cour a relevé que leparking.fr ne se contentait pas d’indexer, mais offrait :
• un formulaire de recherche aux fonctionnalités identiques à celles de La Centrale ;
• une restitution des « informations essentielles » dispensant l’utilisateur de cliquer. Là où Melons pouvait arguer d’un apport de trafic, ADS4ALL est sanctionnée pour l’effet inverse.
Pour la Cour, lorsque l’outil tiers devient un substitut parfait, permettant à l’internaute de consommer la donnée sans visiter le site source, le parasitisme est avéré. En d’autres termes, le moteur de recherche de ADS4ALL ne redirige plus le flux, il le capte. Ce faisant, il créé un préjudice pour La Centrale.
Comment prouver l’atteinte économique ?
C’est l’apport décisif de l’arrêt sur le terrain probatoire. Dans les affaires précédentes, et notamment la jurisprudence Ryanair (Com. 10 févr. 2015, n° 12-26.023, préc.), la preuve du préjudice restait souvent théorique ou difficile à rapporter, les producteurs peinant à isoler le préjudice spécifique lié aux investissements sur la base de données.
Dans cette décision, la Cour de cassation ancre son raisonnement dans la réalité économique pour caractériser le « risque pour l’amortissement » exigé par l’arrêt européen CV-Online. Elle ne se contente pas de suppositions sur un potentiel détournement de clientèle, mais valide la décision d’appel fondée sur deux indicateurs tangibles qui transforment l’extraction en faute :
• une perte de trafic significative sur la page d’accueil de La Centrale : la Cour analyse le comportement de l’internaute. Le modèle économique d’un site d’annonces repose sur l’audience (publicité, options de mise en avant). En proposant un moteur de recherche offrant les mêmes fonctionnalités et les « informations essentielles », le site leparking.fr ne joue pas le rôle d’apporteur d’affaires (qui redirige le trafic), mais celui de substitut (qui retient le trafic). La baisse de fréquentation sur le site source démontre que l’utilisateur final n’a plus besoin de consulter la base d’origine, privant le producteur de sa « matière première » : l’audience ;
• une baisse de chiffre d’affaires directement corrélée : c’est la conséquence comptable du point précédent. La Cour note que l’hémorragie de trafic s’est traduite par une perte financière réelle. C’est un point crucial : pour amortir les lourds investissements de vérification (SIVIN, équipes de modération, etc.), le producteur a besoin de revenus. Si l’agrégateur siphonne l’audience sans contrepartie, il brise le cycle de rentabilité. Le risque pour l’amortissement n’est plus hypothétique, il est consommé.
Ainsi, la Cour a conclu que l’activité d’ADS4ALL mettait concrètement en péril la rentabilité des investissements de vérification. La balance des intérêts, chère à la Cour de justice (liberté d’entreprendre vs protection de l’investissement), penche ici définitivement en faveur du producteur.
Le métamoteur d’ADS4ALL n’est plus vu comme un outil de « découvrabilité » vertueux, mais comme un concurrent déloyal dont le modèle d’affaires repose sur la captation de la valeur créée par autrui. Le « parasitisme » économique est ici chiffré, rendant la sanction incontestable.
Conclusion
La décision du 15 octobre 2025 de la Cour de cassation marque la maturité du droit sui generis en France par la condamnation du scraping réalisé par ADS4ALL. Elle synthétise les leçons du passé pour offrir une grille de lecture claire :
• elle contourne l’écueil de l’arrêt BHRB en valorisant l’investissement de vérification (dans la lignée de la jurisprudence Leboncoin) ;
• elle applique le critère de l’arrêt CV-Online mais en durcit la portée : le scraping est illégal dès qu’il devient substitutif et impacte les investissements économiques.
Cette jurisprudence consolide une position française de protection des investissements dans les données. Pour les entreprises, la leçon est double : documentez vos investissements de vérification pour être protégés (leçon de Ryanair apprise), et si vous agrégez des données, assurez-vous de ne jamais assécher le trafic de votre source, sous peine de voir votre modèle qualifié de parasitaire.
Mais au-delà des simples comparateurs, cet arrêt pourrait bien fournir la munition juridique manquante dans la guerre contre le scraping des intelligences artificielles (IA) génératives. Jusqu’à présent, les éditeurs de contenus tentent souvent de s’opposer à l’entraînement des IA sur le terrain du droit d’auteur. Cette voie est périlleuse : elle oblige à prouver l’originalité des contenus et subit la « torsion artificielle » d’un droit conçu pour les œuvres de l’esprit, mal adapté aux masses de données factuelles ou techniques.
À l’inverse, le droit sui generis, tel que revitalisé par cet arrêt, apparaît comme l’outil idoine. Il ne protège pas la créativité, mais l’investissement. Si les éditeurs parviennent à démontrer que l’aspiration massive de leurs bases par les IA crée un risque de substitution. Par exemple, si une IA répond directement à l’utilisateur sans le renvoyer vers la source, générant une baisse de trafic, alors la contrefaçon de base de données pourrait devenir le véritable talon d’Achille des géants de l’IA. La Cour de cassation vient peut-être, sans le nommer, de signer l’acte de naissance de la régulation économique de l’IA par le droit privé.
Civ. 1re, 15 oct. 2025, FS-B, n° 23-23.167.
par Gaëtan Lassere, Associé du Groupe IPSILON, CPI Brevet et Mandataire européen des brevets
© Lefebvre Dalloz