Web scraping : attention aux droits du producteur de base de données !

De nombreux sites web connaissent aujourd’hui un immense succès grâce aux bases de données qu’ils ont été capables de constituer. On pense notamment à des sites comme leboncoin.fr, veepee.com, Facebook, LinkedIn, et beaucoup d’autres comme les sites comparateurs de prix. Dans des secteurs où la concurrence est rude, il est parfois tentant, pour les nouveaux entrants, de s’inspirer, voire… d’aspirer de telles données grâce à des logiciels de web scraping pour les réutiliser. Mais, est-ce légal ?

– Qu’est ce que le web scraping ?


C’est en effet en utilisant ce que l’on appelle des robots aspirateurs de sites web (ou web scraping) que certains acteurs du web réalisent des copies de sites web appartenant à d’autres. 

Ce faisant, ils peuvent prendre connaissance de l’intégralité de leur contenu (texte, images, structure, données) et le stocker sur leurs propres outils. Cet usage peut être tout à fait légal dès lors, par exemple, qu’il s’agit d’organiser une veille concurrentielle (analyser l’évolution des prix ou des offres des concurrents). La pratique est en revanche plus discutable lorsqu’il s’agit de réutiliser les données pour son propre compte et pour développer sa propre activité. 

– La protection juridique des bases de données 

Les bases de données sont définies à l’article L. 112-3 du CPI. Elles sont protégées de deux façons différentes par le droit.

Le droit d’auteur 

Elles sont tout d’abord protégées par le droit d’auteur, dès lors que le critère d’originalité est satisfait. C’est-à-dire qu’il faut démontrer un effort personnalisé dépassant la mise en œuvre d’une logique automatique et contraignante dans la conception et l’écriture de la base (plan original, forme, structure, composition, langue). Une action en contrefaçon pourrait être menée par l’auteur de la base contre les utilisateurs non autorisés. 

Le droit du producteur de bases de données 

Elles sont ensuite protégées par le « droit sui generis du producteur de bases de données », (CPI, art. L. 341-1 et s.). Le producteur de base de données est défini comme la personne ayant pris l’initiative et le risque des investissements correspondants, pour le contenu de la base de données lorsque la constitution, vérification ou la présentation de celui-ci atteste un investissement financier, matériel ou humain substantiel (moyens consacrés à la recherche d’éléments à rassembler, rassemblement dans la base, vérification des éléments, fonctionnement de la base, mise à jour de la base, etc.). 

Le producteur de base de données a notamment le droit d’interdire :

  • l’extraction temporaire ou permanente de la totalité ou d’une partie qualitativement ou quantitativement substantielle du contenu de la base de données ; 
  • sa réutilisation par la mise à disposition du public de la totalité ou d’une partie qualitativement ou quantitativement substantielle du contenu de la base. 

Il peut recourir à des mesures techniques propres à empêcher ou à limiter les utilisations d’une base de données qu’il n’a pas autorisées. Il dispose de la faculté de transmettre, céder ou accorder une licence d’exploitation de la base.  

La protection qui en résulte est temporaire : les droits reconnus au producteur de base de données prennent effet à compter de l’achèvement de la fabrication de la base de données et expirent 15 ans après le 1er janvier de l’année civile qui suit celle de cet achèvement. Si une base de données est mise à disposition du public avant l’expiration de ce délai, les droits expirent le 1er janvier de l’année civile suivant celle de la première mise à disposition. Enfin, un nouvel investissement substantiel sur la base de données protégée permet de faire courir à un nouveau délai de 15 ans à compter de cet investissement. 

Les atteintes aux droits du producteur font l’objet de sanctions spécifiques, dont principalement : 3 ans d’emprisonnement et 300 000€ d’amende ; 7 ans d’emprisonnement et 750 000€ si le délit est commis en bande organisée. Des dommages et intérêts peuvent également être accordés (préjudices d’image, préjudice financier, manque à gagner).

En outre, les sites web mettent très souvent en place des dispositifs visant à bloquer l’accès aux robots ou prévoient des CGU qui interdisent l’aspiration ou la réutilisation des données à des fins commerciales. Dans ces cas, l’extraction ou l’utilisation des données n’est donc pas autorisée. 

– Deux exemples récents de violation du droit des producteur de bases de données

Le mieux est encore donner quelques exemples. Plusieurs illustrations peuvent être tirées de la jurisprudence, à l’occasion de conflits entre sites web produisant des petites annonces. 

<leboncoin.fr>/<entreparticuliers.com>

Par exemple, un conflit a opposé entreparticuliers.com et leboncoin.fr (société LBC). Afin de maintenir un certain volume d’annonces, le site entreparticuliers.com a souscrit auprès d’un sous-traitant un service lui fournissant les dernières annonces immobilières publiées par les particuliers (via la technique de web scraping), dont notamment celles publiées sur leboncoin.fr, sans autorisation. 

La société LBC a assigné alors entreparticuliers.com pour contrefaçon sur le droit d’auteur et du droit sui generis du producteur de base de données. Elle  s’est vue reconnaître la qualité de producteur de base de données, compte tenu de la nature, du volume des investissements réalisés pour la constitution, la vérification et la présentation des données de la base. 

Les juges ont ensuite observé que les données extraites étaient destinées à être intégralement reproduites sur le site entreparticuliers.com, ce qui excédait manifestement les conditions d’utilisation normale de la base de données. entreparticuliers.com a été condamnée à 70 000 euros de dommages et intérêts en réparation de l’atteinte constituée au droit sui generis de producteur de base de données (50 000€ au titre du préjudice financier / 20 000€ au titre du préjudice d’image). Elle a également été interdite de procéder à l’extraction ou réutilisation répétée et systématique de parties qualitativement ou quantitativement non substantielles du contenu de la base de données de la société LBC et ce sous astreinte de 100 euros par violation constatée. (TGI Paris 1er sept. 2017, Sté LBC France c. Sté entreparticuliers.com  ; confirmation par CA Paris, 2 févr. 2021, pôle 5, ch. 1).

<lacentrale.fr>/<leparking.fr>

Un autre exemple est donné dans une décision rendue le 8 juillet 2021 par le TJ de Paris : l’éditeur du site Leparking.fr a été condamné pour avoir réutilisé (à l’aide de robots aspirateurs) une partie quantitativement substantielle du contenu de la base de données du site d’annonces de véhicules d’occasion lacentrale.fr. Lacentrale.fr a démontré sa qualité de producteur de base de données et prouvé ses investissements substantiels tant du point quantitatif (nombre très importants d’annonces) que qualitatif (annonces finalisées, pratiques, complètes, contrôlées). Des investissements matériels et humains ont permis de développer son système de dépôt d’annonces, la conclusion de contrat de fournitures de services informatiques, la création de moyens de contrôles des informations contenues dans les annonces. L’éditeur du site leparking.fr, qui avait quasiment extrait et réutilisé la totalité des annonces publiées sur le site lacentrale.fr a été condamné à 50 000€ de dommages et intérêts en réparation du préjudice subi. Une astreinte de 1000€ par jour de retard assortissait la décision.

Dans les deux cas, on observe deux points importants : 

  • D’une part, il est nécessaire pour le producteur de bases de données d’apporter la preuve qu’il peut bien se prévaloir de se régime spécial. Il est donc indispensable de conserver tous les éléments factuels permettant de démontrer les investissements substantiels, et l’existence d’une base.
  • D’autre part, les juges apprécient ensuite de façon très concrète l’ampleur de la violation (nombre et qualité des informations récupérées et utilisées), en quantité ou en qualité avant de prononcer une éventuelle sanction. Là encore, il faudra s’employer à apporter les éléments de preuve. 

Autrement dit, si vous voulez extraire ou réutiliser des bases de données de façon substantielle, il peut être préférable d’en parler avec leur producteur et de négocier un contrat de licence. Dans tous les cas, la consultation d’un avocat vous permettrait certainement de mesurer et limiter votre risque juridique sur cette question. N’hésitez pas à nous appeler pour en parler avec nous

A noter : Le web scraping est parfois aussi utilisé pour des motifs de prospection commerciale. En effet, cette technique permet notamment de récupérer des informations sur des clients potentiels (coordonnées téléphoniques, mails) apparaissant sur des sites web (par exemple sur des sites de petites annonces ou des annuaires en ligne). Pour être valable, cette pratique doit respecter les exigences du RGPD. Il peut être utile de consulter la page web de la CNIL consacrée à cette question.