Résultats de recherche pour: moteur de recherche

Responsabilité du fait des moteurs de recherche

Les moteurs de recherche :

Les moteurs de recherche utilisent un ou des logiciels qui visitent les pages web et leurs liens de manière. Le contenu est indexé de façon automatique, en résumant de manière automatique le contenu de la page,en utilisant l’indice de popularité des sites, leurs url, les metas s’y trouvant etc …

 

Les annuaires de sites :

Les annuaires sont très différents. L’auteur d’un site demande son inscription dans l’annuaire. Il choisit les mots clés qui sont attribués au site et éventuellement la catégorie dans laquelle il figurera dans l’annuaire. L’annuaire, en tant qu’éditeur, a la possibilité de modifier parfois ces choix.

 

I. Responsabilité des moteurs de recherche

A) La question des droits de propriété intellectuelle

Les règles de la propriété intellectuelle s’appliquent aux moteurs de recherche, en fonction de l’étendue de la reproduction effectuée par le moteur de recherche : mots clés, titres, extraits et/ou œuvre intégrale.

1) Les mots clés :

Les mots clés relatifs à un site peuvent-ils être protégés par les droits de propriété intellectuelle ?

La réponse est négative si on s’inspire d’une jurisprudence « le monde c/ Microfor » qui ne s’appliquait, pas à l’époque, aux moteurs de recherche.

La Cour de cassation avait décidé dans cette affaire, que la protection du droit d’auteur ne s’appliquait pas à l’édition d’un index d’œuvres permettant de les identifier par des mots clés.

L’auteur peut-il contester l’utilisation de mots clés par le moteur de recherche ou des rubriques choisies par l’annuaire ?

Cette demande semble recevable, mais limitée à l’hypothèse ou ce classement porte atteinte à son honneur, ce qui constitue un droit moral attaché à l’œuvre. L’action engagée devant les tribunaux compétents pourra donc être une action dans le but de voir modifier la donnée litigieuse et de se voir attribuer éventuellement des dommages et intérêts.

2) Les titres

La plupart des moteurs de recherche présentent dans le résultat de leur recherche, le titre des sites.

Or la jurisprudence classique du droit de la propriété intellectuelle admet que le titre, s’il a un caractère suffisamment original, peut faire l’objet d’une protection.

On peut donc se demander si l’utilisation de ces titres par les moteurs de recherche constitue une violation des règles de la propriété intellectuelle.

La doctrine était majoritairement favorable à un assouplissement de ces règles, afin des les considérer au même titre que des références bibliographiques dans un catalogue, index, … La jurisprudence a validé cette position dans l’affaire « Le Monde contre Microfor » :  » si le titre d’un journal ou d’un des ses articles est protégé comme l’œuvre elle-même, l’édition à des fins documentaires, par quelque moyen que se soit, d’un index comportant la mention de ces titres en vue d’identifier les œuvres répertoriées ne porte pas atteinte au droit exclusif d’exploitation de l’auteur « .

3) Les extraits

Certains moteurs de recherche, pour faciliter à l’utilisateur la recherche de sites pertinents, proposent un extrait de la page web( en général les premières phrases).

Ceci constitue une reproduction partielle de l’œuvre.

La loi française autorise le droit de citation. Il s’agit de savoir, si en l’espèce ce droit est utilisable par les moteurs de recherche. La cour de cassation dans l’affaire « Le Monde contre Microfor » a reconnu un droit de citation des producteurs de base de données.

Elle a considéré comme licite au regard de l’article 42 de la loi du 11 mars 1957 le fait de constituer une base de données à partir de court extraits d’œuvres d’autrui et de les référencer à l’intérieur d’un index, sous réserve que soient mentionnés le nom de l’auteur et la source utilisée, et que les informations rassemblées ne dispensent pas le lecteur de lire l’œuvre elle-même.

4) La reproduction d’œuvres intégrales

Les moteurs de recherche qui reprennent intégralement des œuvres protégées par la propriété intellectuelle doivent obligatoirement obtenir l’autorisation des auteurs.

Bon nombre de journaux se sont vu condamnés pour avoir mis en ligne des articles déjà parus dans le journal papier, la représentation sur un support différent impose une autorisation différente.

Pour les œuvres visuelles, la reproduction sous formes de  » vignettes  » ne peut pas être assimilée à un droit de citation qui ne s’applique pas selon la jurisprudence aux œuvres plastiques.

B) La responsabilité pénale :

Un lien vers un site illicite peut engager la responsabilité de son auteur, les moteurs de recherche n’échappent pas à la règle. Cependant on peut noter un régime différent selon qu’il s’agit de moteur de recherche ou d’annuaires

1) Les moteurs de recherche

L’indexation étant automatique, il est évident que des sites illicites peuvent être indexés, d’où la mise en place de divers contrôles : dénonciations en ligne, possibilités de filtrage des mots clés définis sur une liste noire, …

Cependant s’agissant de professionnels, on pourrait faire un parallèle avec les règles concernant les fournisseurs d’hébergement qui ont une obligation de moyen. On pourrait penser qu’un moteur de recherche qui met en place différents moyens de contrôle ne verrait pas sa responsabilité engagée.

2) Les annuaires

La situation est ici beaucoup plus claire, la responsabilité en cause est une responsabilité éditoriale. Lors de la demande d’inscription d’un site, les annuaires doivent avoir une connaissance suffisante de celui-ci pour se voir reconnu responsables s’ils ont accepté de répertorier un site illégal. On pourra leur appliquer les mêmes règles de responsabilité que celle des liens vers des sites illicites. ( cf. mon article sur les liens hypertextes)

ARTICLES EN RELATION :

Moteurs de recherches et annuaires

Les moteurs de recherche :

Les moteurs de recherche utilisent un ou des logiciels qui visitent les pages web et leurs liens de manière. Le contenu est indexé de façon automatique, en résumant de manière automatique le contenu de la page,en utilisant l’indice de popularité des sites, leurs url, les metas s’y trouvant etc …

Les annuaires de sites :

Les annuaires sont très différents. L’auteur d’un site demande son inscription dans l’annuaire. Il choisit les mots clés qui sont attribués au site et éventuellement la catégorie dans laquelle il figurera dans l’annuaire. L’annuaire, en tant qu’éditeur, a la possibilité de modifier parfois ces choix.

Pour lire la suite, cliquez sur ce lien

Articles connexes :

 

Peut-on nourrir une IA avec des œuvres protégées ? Le cas Thomson Reuters contre Ross

Depuis quelques années, les juridictions américaines se retrouvent confrontées à une problématique émergente : comment concilier la montée en puissance de l’intelligence artificielle, particulièrement gourmande en données, avec les exigences du droit d’auteur qui protège une partie importante de ces ressources ?

NOUVEAU : Utilisez nos services pour faire retirer un contenu dénigrant ou de contrefaçon en passant par le formulaire !

La question est d’autant plus sensible que les acteurs de l’IA s’appuient fréquemment sur des corpus textuels de grande ampleur pour entraîner leurs systèmes, au risque de se heurter aux droits des éditeurs et producteurs de contenu.

C’est dans ce contexte qu’intervient le litige Thomson Reuters c. Ross Intelligence, jugé le 11 février 2025 par le tribunal fédéral du district du Delaware. L’affaire oppose l’éditeur juridique Thomson Reuters, propriétaire de la base de données Westlaw, à la jeune entreprise Ross Intelligence, qui développait un moteur de recherche juridique fondé sur l’apprentissage automatique. Refusant d’accorder une licence à Ross, Thomson Reuters a accusé la startup d’avoir contourné l’obstacle en recourant à des intermédiaires pour accéder indirectement à ses contenus protégés, notamment les headnotes et le système de classification juridique qui structurent Westlaw.

La décision rendue par le juge Stephanos Bibas retient particulièrement l’attention : elle reconnaît le caractère protégeable des headnotes au regard du copyright américain et, surtout, écarte la défense de fair use avancée par Ross. Le tribunal estime que l’utilisation litigieuse ne présentait pas de caractère transformateur suffisant, qu’elle poursuivait un but commercial et qu’elle risquait de porter gravement atteinte au marché de Thomson Reuters.


Besoin de l’aide d’un avocat pour un problème de contrefaçon ?

Téléphonez – nous au : 01 43 37 75 63

ou contactez – nous en cliquant sur le lien


Ce jugement, bien qu’intermédiaire et limité à certains aspects du dossier, constitue un signal fort. Il s’agit de l’une des premières décisions américaines qui applique directement l’analyse du fair use à l’entraînement d’une IA, et ce en dehors du champ de l’IA générative.

Les enseignements tirés dépassent ainsi le secteur juridique : ils concernent potentiellement toutes les entreprises développant des systèmes d’IA nourris de données protégées. La question de l’accès aux corpus, des conditions de licence et des risques de concurrence déloyale devient centrale, dans un paysage où le droit d’auteur sert de garde-fou mais peut aussi freiner l’innovation.

I. Fondements juridiques de la décision Thomson Reuters v. Ross Intelligence

A. Les critères retenus pour établir l’infraction au droit d’auteur

  • Originalité (Copyrightability)

Le tribunal se réfère à la jurisprudence classique, en particulier Feist Publications, Inc. v. Rural Telephone Service Co., qui pose que le seuil d’originalité est très bas : un travail doit simplement être « indépendamment créé » et contenir « une certaine étincelle minimale de créativité ».

Dans le cas présent, les headnotes éditoriales de Westlaw et le Key Number System sont reconnus comme remplissant ce critère. Le juge estime que les choix d’édition, de sélection, d’arrangement etc., impliquent assez de créativité pour protéger ces éléments.

  • Copie effective / Substantial similarity

Il faut prouver que Ross a copié effectivement les headnotes, ou que ses Bulk Memos sont matériellement similaires aux headnotes (et non simplement proches des opinions judiciaires, qui ne sont pas protégeables). Le juge a examiné les textes comparativement : les Bulk Memos reprennent le langage des headnotes de manière très proche, plutôt que celui des opinions, ce qui montre une similitude substantielle.

Le tribunal avait identifié un lot spécifique de headnotes — environ 2 243 — pour lesquels la similitude et la validité du droit étaient manifestes, de sorte qu’aucune question factuelle raisonnable n’existe à ce sujet.

  • Refus de licence / contexte concurrentiel

Le fait que Ross avait sollicité une licence à Thomson Reuters, et s’est vu refuser parce qu’il était concurrent, joue un rôle important dans la motivation du tribunal. Cela montre que Ross ne se contente pas d’une utilisation secondaire isolée mais cherche à concurrencer directement le titulaire du droit.

  • Défenses rejetées

Ross a invoqué plusieurs défenses : innocent infringement, merger doctrine, scènes à faire, copyright misuse. Le juge a rejeté chacune, notamment parce que :

  • Innocent infringement ne limite pas la responsabilité dès lors qu’il y a copie.
  • Merger (idée-expression) ne s’applique pas ici, car il existe plusieurs manières d’exprimer les idées de droit, donc l’expression (headnotes) ne fusionne pas avec l’idée.
  • scènes à faire (éléments dictés par la nature de l’œuvre) non applicable ici.

B. L’analyse du fair use : application des quatre facteurs et prise de position

La partie centrale du jugement porte sur la défense de fair use, qui constitue une exception essentielle au droit d’auteur aux États-Unis. Le tribunal procède à l’examen des quatre facteurs posés par l’article 107 du Copyright Act.

Le premier facteur, relatif au but et au caractère de l’usage, est déterminant. Le juge relève que l’utilisation opérée par Ross était pleinement commerciale, destinée à alimenter un produit concurrent de Westlaw. En outre, l’usage n’est pas transformateur : il ne se limite pas à un enrichissement ou à une analyse critique des données de Thomson Reuters, mais consiste à exploiter directement les headnotes pour bâtir un service similaire. Ainsi, la fonction finale du produit demeure très proche de celle du contenu protégé, ce qui pèse lourdement contre Ross.

Le deuxième facteur, qui porte sur la nature de l’œuvre protégée, est plus nuancé. Certes, les headnotes s’appuient sur des décisions de justice qui, elles, sont dans le domaine public. Toutefois, la mise en forme, la sélection des passages, et l’angle éditorial introduisent une dimension créative. Le juge reconnaît que ces contenus ne sont pas des œuvres d’imagination pure, mais qu’ils dépassent néanmoins le simple recueil d’informations factuelles. Ce facteur n’est donc pas entièrement favorable à Ross, même s’il n’a pas l’importance décisive des autres.

Concernant le troisième facteur, relatif à la quantité et à la substantialité de l’extrait utilisé, Ross soutenait que les utilisateurs finaux de son outil n’avaient pas directement accès aux headnotes copiés. Néanmoins, l’examen montre que les Bulk Memos reprennent une partie significative de ces résumés, en substance et parfois en formulation. Le tribunal estime donc que la quantité prélevée est loin d’être négligeable, et que cette reproduction porte sur l’essence même de l’expression protégée.

Enfin, le quatrième facteur — l’effet de l’usage sur le marché de l’œuvre protégée — s’avère crucial. L’exploitation des contenus de Westlaw par Ross menace directement le marché principal de Thomson Reuters, à savoir la fourniture de services de recherche juridique aux professionnels. En outre, le tribunal souligne que ce type d’usage non autorisé pourrait priver l’éditeur d’un marché secondaire potentiel : celui des licences pour l’entraînement de modèles d’IA. Même si ce marché n’était pas encore entièrement développé, il est légitime de prendre en compte sa possible émergence. L’effet de substitution et la concurrence frontale apparaissent donc manifestes.

Dans la mise en balance finale, le juge considère que les deux premiers facteurs (caractère de l’usage et effet sur le marché) l’emportent nettement sur les autres. Le fair use est donc rejeté, et la violation du copyright est confirmée.

II. Conséquences et limites pratiques de la décision

A. Conséquences pour les acteurs de l’IA / implications

  • Renforcement du besoin de licences

Les entreprises qui veulent entraîner des modèles d’IA ou utiliser des données éditoriales protégées devront sérieusement envisager d’obtenir des licences, même si les œuvres semblent « informatives ». Ce jugement montre que même des résumés ou des annotations, si suffisamment originaux, sont protégés, et que l’argument du fair use est risqué si l’usage commercial ou concurrent est apparent.

  • Effet dissuasif pour usages commerciaux concurrents

Ce cas met en garde les startups ou entreprises qui cherchent à concurrencer directement des titulaires de droits en utilisant leurs contenus protégés comme source d’entraînement, sous prétexte de fair use. Les tribunaux pourraient comparer le service final, la clientèle, le type d’usage, pour voir s’il y a substitution de marché.

  • Impact sur l’écosystème des données d’entraînement

Le marché potentiel de données d’entrainement pour l’IA (datasets, licences, marchés secondaires) est mis en lumière. Les titulaires de droit pourraient exiger paiement ou contrôle plus strict, et les acheteurs / utilisateurs de données devront diligenter leurs acquisitions : vérifier la provenance, s’assurer que ce qui est utilisé est non protégé ou bien sous licence, etc.

  • Répercussions pour la recherche, les universités, l’IA open source

Bien que ce cas concerne une entreprise commerciale, il va aussi influencer les pratiques dans la recherche, dans les universités, dans les projets open source / académiques. Ceux-ci devront veiller à distinguer les usages non commerciaux, éducatifs, transformateurs ou critiques, pour ne pas être pris au piège du précédent.

  • Influence sur décisions futures, y compris dans les cas de IA générative

Ce jugement sera cité dans les litiges actuels et à venir concernant l’IA générative (modèles de langage, etc.), car beaucoup de ces affaires invoquent fair use pour la formation des modèles sur des textes protégés. Même si les faits diffèrent (génératif vs non génératif, quantité de copie, nature des œuvres, etc.), la logique de l’importance des facteurs 1 et 4, et l’examen minutieux de la similitude substantielle, sont des guides.

B. Limites et points d’incertitude

  • Spécificité des faits

Le cas porte sur une IA de recherche juridique, non générative, avec bulk memos, headnotes, etc. D’autres technologies d’IA peuvent varier fortement : modèles de langage génératifs, apprentissage non supervisé, plus grande part de génération et moins de restitution verbatim, etc. Les décisions dans d’autres contextes pourraient pencher différemment.

  • Non décision sur tous les éléments

La décision ne règle pas tous les headnotes, ni tous les aspects revendiqués par Thomson Reuters, ni le Key Number System de façon complète, ni certaines œuvres dont le droit d’auteur pourrait avoir expiré ou ne pas avoir été valablement enregistré. Certaines questions factuelles restent à trancher en procès.

  • Caractère non génératif de l’IA comme facteur

Ici, Ross n’est pas une IA générative dans le sens de génération de texte neuf à partir de prompts, mais un moteur de recherche qui restitue des opinions connues. Ce type d’usage est plus proche du cas traditionnel de recherche / compilation que certains usages innovants de l’IA générative. Les tribunaux pourraient, dans des cas de IA générative, trouver l’usage plus transformateur (selon la façon dont le modèle utilise les données) ou peser différemment le facteur de caractère transformateur.

  • Évolution du droit, appels potentiels, jurisprudence variable selon les circuits

Ce jugement est d’un tribunal de district (District of Delaware). Il peut être sujet à appel devant le Third Circuit, et potentiellement devant la Cour suprême. D’autres tribunaux dans d’autres circuits pourraient interpréter les facteurs de fair use différemment. Il n’y a pas encore de règle uniforme fédérale sur tous les aspects de l’utilisation d’IA.

  • Équilibre entre innovation et protection des droits

La tension demeure : protéger les titulaires de droits est légitime, mais ne pas étouffer l’innovation. Ce cas montre qu’il y a des limites claires à ce que l’on peut faire sans autorisation, mais il ne dit pas qu’aucun usage de données protégées dans l’IA n’est possible sous fair use — juste que dans ce cas précis, les défenses échouent. Les innovations futures devront soigner la nature de l’usage, le degré de transformation, la quantité de données utilisées, etc., pour avoir une chance de succès sous fair use.

Pour lire une version plus complète de cet article sur la contrefaçon et les IA, cliquez

Sources :

  1. 20-613_5.pdf
  2. La décision de ROSS AI donne une indication précoce des forces et des faiblesses de la défense contre l’utilisation équitable | Aperçus | Mayer Brown
  3. Un tribunal rejette la défense de l’utilisation équitable dans une affaire de droit d’auteur sur l’IA | Perspectives et ressources | Goodwin

Condamnation de Doctrine.fr pour concurrence déloyale : un tournant dans le marché des bases de données juridiques

Le 7 mai 2025, la cour d’appel de Paris a rendu un arrêt déterminant qui pourrait redéfinir les règles du jeu dans le secteur des bases de données juridiques en France.
NOUVEAU : Utilisez nos services pour faire retirer un contenu dénigrant ou de contrefaçon en passant par le formulaire !

La société Forseti, éditrice de la plateforme Doctrine.fr, a été condamnée à verser des dommages et intérêts s’élevant à 40 000 € à Lexbase, Lextenso et Lamy Liaisons, ainsi que 50 000 € à Dalloz et LexisNexis, en raison de pratiques jugées déloyales.

Cette décision, qui fait suite à un litige amorcé en 2018, met en lumière les tensions entre les acteurs traditionnels et les nouveaux entrants dans un secteur en pleine mutation. L’émergence de Doctrine.fr a été fulgurante : en à peine deux ans, la plateforme a réussi à constituer un fonds jurisprudentiel impressionnant de 10 millions de décisions judiciaires. Cette avancée rapide a non seulement bouleversé le paysage des bases de données juridiques, mais a également suscité des inquiétudes parmi les acteurs établis, qui ont accusé Forseti d’avoir construit son succès commercial sur des fondations illégales.

Selon les plaignants, la société aurait contourné les procédures légales pour accéder à des centaines de milliers de jugements, exploitant ainsi une stratégie qu’ils considèrent comme contraire à l’éthique et à la loi. Les accusations portées contre Forseti ont été initialement rejetées par le tribunal de commerce de Paris en 2023, mais la décision de la cour d’appel en 2025 a renversé la tendance. Les juges ont souligné que l’avantage concurrentiel dont bénéficiait Forseti reposait sur des pratiques déloyales.


Besoin de l’aide d’un avocat pour un problème de contrefaçon ?

Téléphonez – nous au : 01 43 37 75 63

ou contactez – nous en cliquant sur le lien


Ils ont minutieusement examiné les méthodes de collecte d’information de Doctrine.fr, concluant que Forseti avait violé les règles régissant l’accès aux décisions des tribunaux de première instance. Par exemple, la société aurait eu recours à des directeurs de greffe sans consultation préalable, détourné une convention de recherche avec le Conseil d’État visant à l’anonymisation de jugements administratifs, et exploité illégalement des données issues des tribunaux de commerce après la rupture de son partenariat avec Infogreffe.

Ces manœuvres, qualifiées de « graves, précises et concordantes » par la cour, ont permis à Forseti de s’imposer rapidement sur le marché tout en privant ses concurrents d’un accès équitable aux ressources jurisprudentielles. Toutefois, la cour a également rejeté les accusations de pratiques commerciales trompeuses et de parasitisme, limitant ainsi la portée de la condamnation. Ce jugement ouvre la voie à des réflexions profondes sur l’équilibre à trouver entre l’innovation numérique, le respect des règles de concurrence et la protection des données juridiques. Il est crucial de noter que cette décision ne concerne pas uniquement Forseti, mais a des implications pour l’ensemble du secteur. Les acteurs historiques, qui étaient en difficulté face à la montée en puissance de Doctrine.fr, voient dans ce jugement une validation de leurs préoccupations concernant l’intégrité des pratiques commerciales dans le domaine des données juridiques.

Par ailleurs, cette affaire soulève des questions fondamentales sur la manière dont les nouvelles technologies et les start-ups doivent naviguer dans un environnement juridique complexe, où les règles ne sont pas toujours claires et où l’innovation peut parfois entrer en conflit avec des pratiques établies.

En somme, cette décision de la cour d’appel de Paris représente un tournant majeur dans le marché des bases de données juridiques. Elle illustre les tensions croissantes entre les anciens et les nouveaux acteurs, tout en soulignant l’importance d’un cadre réglementaire adapté à l’évolution rapide des technologies. Alors que le secteur continue de se transformer, il est essentiel que les acteurs concernés réfléchissent à des pratiques éthiques et légales pour garantir un environnement concurrentiel sain, respectant à la fois l’innovation et la protection des droits d’accès à l’information juridique.

I. Les fondements juridiques de la condamnation pour concurrence déloyale

A. Une collecte illicite de décisions de justice

  1. Violation des règles d’accès aux tribunaux judiciaires

La cour d’appel a établi que Forseti avait systématiquement contourné les procédures légales pour collecter des centaines de milliers de décisions de justice issues des tribunaux judiciaires de première instance.

Selon l’article R.123-5 du Code de l’organisation judiciaire, l’accès aux décisions rendues en audience publique nécessite une autorisation préalable des directeurs de greffe, qui doivent vérifier la finalité de la demande et encadrer la réutilisation des données. Or, Forseti n’a jamais sollicité ces autorisations, contrairement à ses concurrents (LexisNexis, Dalloz), dont les demandes avaient été rejetées ou strictement limitées.

Cette omission volontaire a permis à Forseti de constituer une base de données massivement plus riche que ses rivaux, qui devaient se contenter de décisions publiées sur des plateformes publiques comme Legifrance ou Judilibre, souvent incomplètes ou retardées.

La cour a souligné que cette collecte « sauvage » violait également l’article 6 de la loi informatique et libertés, qui exige un traitement loyal des données. En exploitant des jugements non anonymisés ou partiellement retraités, Forseti a exposé des justiciables à des risques de réidentification, aggravant le préjudice moral invoqué par les plaignants.

  1. Détournement de la convention avec le Conseil d’État

En 2016, Forseti avait conclu une convention de recherche avec le Conseil d’État pour développer un logiciel open source d’anonymisation des décisions de justice administratives. Cette collaboration, présentée comme un projet d’intérêt général, lui a permis d’obtenir des centaines de milliers de jugements administratifs bruts, à condition que leur réutilisation commerciale soit expressément autorisée par le Conseil d’État.

Cependant, Forseti a intégré ces décisions dans sa base payante sans avoir sollicité d’autorisation, violant ainsi la clause de finalité de la convention.

La cour a qualifié ce détournement de « manipulation déloyale », estimant que l’entreprise avait exploité une faille dans le cadre collaboratif pour s’approprier des ressources normalement réservées à la recherche publique. Ce faisant, elle a privé les éditeurs historiques (comme Lextenso, spécialisé en droit administratif) d’un accès équitable à ces données, alors même que ceux-ci devaient négocier des accords coûteux et complexes avec chaque tribunal administratif.

  1. Exploitation post-rupture du partenariat avec Infogreffe

Le partenariat entre Forseti et Infogreffe (Groupement d’Intérêt Économique gérant l’accès aux données des tribunaux de commerce) a été résilié en septembre 2018 en raison de litiges sur les redevances. Malgré cette rupture, Forseti a continué à diffuser 3 millions de décisions issues des tribunaux de commerce, sans pouvoir prouver leur origine licite.

La cour a retenu que l’entreprise avait soit conservé illégalement des données obtenues pendant le partenariat, soit recommencé à les collecter via des méthodes non autorisées (ex. : scraping de sites publics non prévus à cet effet). Ce comportement contraste avec les pratiques des concurrents comme Wolters Kluwer, qui acquérait légalement ces mêmes données via des abonnements payants à Infogreffe, avec des coûts annuels dépassant 100 000 €.

La cour a critiqué le refus de Forseti de produire la convention initiale, invoquant l’article 11 du Code de procédure civile sur l’obligation de communiquer les preuves. Ce « mutisme stratégique » a renforcé la présomption d’illicéité, conduisant à une condamnation pour avantage concurrentiel indu.

B. Un avantage concurrentiel indu et ses conséquences

  1. Trouble commercial causé aux éditeurs historiques l’arrêt met en lumière un préjudice double pour les plaignants :

– Un préjudice économique direct : La base de données de Doctrine.fr, présentée comme « la plus exhaustive du marché », a capté des milliers d’abonnés (avocats, notaires) habituellement fidèles aux éditeurs traditionnels. Par exemple, Lexbase a subi une chute de 15 % de ses ventes entre 2019 et 2022, directement corrélée à l’expansion de Doctrine.fr.

– Un préjudice d’image : Les concurrents ont été perçus comme « moins innovants » face à la plateforme de Forseti, qui mettait en avant des fonctionnalités algorithmiques (recherche sémantique, prédictibilité des jugements) rendues possibles par la masse de données illégalement acquises.

La cour a relevé que Forseti avait instrumentalisé son fonds jurisprudentiel dans ses campagnes marketing, avec des slogans comme « 10 millions de décisions à portée de clic », créant une distorsion de concurrence. Contrairement à ses rivaux, qui devaient financer des juristes pour analyser et indexer manuellement les décisions, Forseti a automatisé ces processus grâce à des données obtenues sans coût.

  1. Distorsion du marché par des méthodes déloyales

L’analyse économique de la cour révèle un déséquilibre structurel :

– Coûts évités par Forseti : L’entreprise a économisé des millions d’euros en frais d’accès aux greffes, de négociation de conventions et d’anonymisation manuelle. Par exemple, LexisNexis dépensait près de 500 000 € annuels pour obtenir légalement 200 000 décisions, tandis que Forseti en collectait 5 millions sans investissement comparable.

– Effet de seuil anticoncurrentiel : La taille critique atteinte par Doctrine.fr a créé une barrière à l’entrée pour de nouveaux acteurs, renforçant la position dominante de Forseti.

Les algorithmes d’IA de la plateforme, nourris par des données illicites, sont devenus plus performants, enfermant le marché dans un cercle vicieux. La cour a aussi noté que les pratiques de Forseti décourageaient l’innovation loyale. Par exemple, Lextenso avait abandonné un projet de moteur de recherche prédictif en 2021, faute de données suffisantes pour rivaliser.

II. Les implications et les limites de l’arrêt

A. Un renforcement des garde-fous contre l’exploitation abusive des données publiques

  1. Clarification des règles post-décret de 2020

Le décret du 29 juin 2020 encadre désormais strictement la réutilisation des décisions de justice, en imposant l’anonymisation et en interdisant leur exploitation commerciale sans autorisation. Toutefois, la cour a rappelé que ce texte ne s’appliquait pas rétroactivement aux collectes antérieures à 2018, invalidant l’argument de Forseti qui tentait de se prévaloir d’un cadre légal posteriori.

Cet arrêt envoie un signal clair aux startups technologiques : l’innovation ne peut justifier la violation des règles existantes. La cour a cité en exemple le RGPD, rappelant que le caractère public de certaines données n’autorise pas leur traitement sans base légale.

  1. Impact sur le marché des éditeurs juridiques

La condamnation financière (230 000 € au total) reste symbolique au regard des profits estimés de Forseti (plusieurs millions d’euros annuels). Cependant, l’arrêt crée une jurisprudence dissuasive :

– Obligation de transparence : Les éditeurs devront désormais documenter scrupuleusement l’origine de leurs données, sous peine de présomption d’illicéité.

– Négociations rééquilibrées avec les greffes : Les tribunaux pourraient durcir les conditions d’accès, comme l’exige déjà la CNIL pour les données sensibles.

B. Le rejet des autres griefs : pratiques trompeuses et parasitisme

  1. Absence de preuves sur les pratiques commerciales trompeuses

Les plaignants accusaient Forseti d’avoir induit les utilisateurs en erreur sur la légalité de sa base de données. La cour a estimé que les mentions légales de Doctrine.fr, bien que vagues, ne constituaient pas une tromperie active. Contrairement à l’affaire Google Shopping (où la manipulation algorithmique était avérée), Forseti n’a pas falsifié ses résultats de recherche.

  1. Parasitisme non retenu : la frontière avec l’inspiration légitime

LexisNexis arguait que Forseti copiait la structure de ses commentaires d’arrêts. La cour a jugé que le parasitisme nécessite une « appropriation spécifique », comme la reprise de textes protégés par le droit d’auteur. Or, les analyses de Doctrine.fr, bien que similaires dans leur forme, résultaient d’un travail éditorial distinct. Ce rejet illustre les limites du droit de la concurrence face à l’inspiration algorithmique, où la frontière entre plagiat et émulation reste floue.

Cet arrêt cristallise les tensions entre l’innovation disruptive et l’éthique concurrentielle dans l’ère numérique. S’il sanctionne fermement les excès de Forseti, il laisse en suspens des questions majeures sur la régulation des algorithmes et la propriété des données publiques.

Les éditeurs juridiques devront désormais naviguer entre collaboration et concurrence, dans un marché où la valeur réside autant dans l’accès aux données que dans leur traitement intelligent.

Pour lire une version plus complète de cet article sur la protection des bases de données et le site doctrine, cliquez

Sources :

  1. Legalis | L’actualité du droit des nouvelles technologies | Cour d’appel de Paris, Pôle 5 – Ch. 1, arrêt du 7 mai 2025
  2. Legalis | L’actualité du droit des nouvelles technologies | Doctrine.fr condamné pour concurrence déloyale
  3. Article R123-5 – Code de l’organisation judiciaire – Légifrance
  4. https://www.cnil.fr/fr/le-cadre-national/la-loi-informatique-et-libertes#article6