Le 24 septembre dernier, le Tribunal régional de Hambourg a rendu la première décision européenne concernant les exceptions de fouille de textes et de données (également connues sous l’acronyme « TDM » pour « Text and datamining »), dans le contexte de leur mise en œuvre pour la phase, très discuté en droit d’auteur, d’entrainement des systèmes d’intelligence artificielle (« IA »).
Pour rappel, les exceptions de fouille de textes et de données ont été consacrées par la DAMUN (la directive du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique[1]) et font aujourd’hui l’objet de nombreux débats pour leur mise en œuvre dans le contexte de l’intelligence artificielle, et plus particulièrement des systèmes d’IA générative (tels que ChatGPT ou Midjourney).
En effet, la DAMUN a introduit deux exceptions au droit d’auteur :
- L’article 3 permet la reproduction et l’extraction de données sur des œuvres protégées par le droit d’auteur, accessibles de manière licite par des organismes de recherches et des institutions du patrimoine culturel, dans un but circonscrit à la recherche scientifique;
- L’article 4 permet quant à lui une telle reproduction pour tout bénéficiaire, sans restriction concernant l’objet des activités réalisées, mais en introduisant une limite par la possibilité donnée aux titulaires de droits de s’y opposer (mécanisme d’ opt-out).
Ces exceptions européennes ont été transposées en droit français, à l’Article L. 122-5-3 du Code de la propriété intellectuelle, ainsi qu’en droit allemand. Dans le cas d’espèce, elles ont été invoquées devant le Tribunal de Hambourg à la suite d’une utilisation de contenus visuels protégés pour entrainer un système d’IA générative.
Plus précisément, l’organisme à but non lucratif allemand LAION, qui a pour activité la mise à disposition publique et gratuite d’une banque de données d’entrainements pour les IA, a publié un set de données (ou dataset) particulièrement dense nommé LAION-5B, utilisé pour entraîner certains systèmes d’IA génératives (notamment, Stable Diffusion).
LAION-5B comprenait un lien hypertexte conduisant vers une image mise en ligne et vendue sur le site internet Bigstockphoto du photographe Robert Kneschke. Ce dernier a reproché à LAION d’avoir téléchargé une copie d’une de ses photographies en basse qualité, dotée par ailleurs d’un tatouage numérique, alors que les conditions d’utilisation du site interdisaient l’utilisation des images par des « programme automatisés ». LAION a invoqué, pour sa défense, les deux exceptions TDM et le tribunal a considéré que les reproductions opérées par LAION avaient bien été effectuées à des fins scientifiques, et étaient donc couvertes par l’exception posée par l’article 3 de la DAMUN, concluant à une absence de violation des droits d’auteur du photographe.
Cette décision donne une première interprétation de l’exception TDM dans le cadre de l’IA.
Tout d’abord sur l’exception de l’article 3 prévue à des fins de recherches scientifiques, retenue ici, le tribunal a précisé que celle-ci ne doit pas être entendue d’une manière trop restrictive. En effet, les juges ont reconnu que, bien que la création du dataset ne puisse pas être en tant que telle considérée comme un gain de connaissance (critère associé à la recherche scientifique), cette base de données en constituait une étape essentielle. En ce sens, le tribunal a considéré que le fait que le dataset soit publié gratuitement et ouvertement, et donc sans objectif commercial, pouvait permettre à des chercheurs d’en bénéficier et donc de créer un gain de connaissance. Ce raisonnement sur la mise à disposition des données à des fins scientifiques a ici suffit à utiliser l’exception TDM pour justifier de l’absence d’une violation du droit d’auteur.
Dans une autre mesure, cette décision a également précisé l’autre exception TDM posée à l’article 4 et plus particulièrement en ce qui concerne l’expression de l’opt-out. La DAMUN mentionne que cette réserve peut être exprimée notamment dans le cadre de conditions générales d’utilisation mais « au moyen de procédés lisibles par machine »[2]. En l’espèce, l’opt-out était inscrit dans les conditions générales du site internet sur lequel la photographie était reproduite, sous la forme d’un texte et non d’un procédé technique particulier, ce que les juges ont trouvé suffisant pour que l’opt-out soit considéré comme valablement manifesté. L’exception de l’article 4 ne pouvait donc pas s’appliquer en l’espèce car l’opt-out avait été suffisamment exprimé.
Sur ce dernier point, la décision allemande est également intéressante en ce sens qu’elle rappelle l’obligation pour les fournisseurs de systèmes d’IA de mettre en place un mécanisme particulier pour identifier les réserves de droits revendiquées par les auteurs dans le cadre de ces exceptions posées par la DAMUN, explicitement « y compris au moyen de technologies de pointe », obligation introduite par le récent règlement sur l’IA[3].
Les juges ont donc ici considéré que le scraping opéré par LAION pouvait être considéré comme une opération de TDM à des fins de recherches scientifiques et ainsi être utilisé pour les phases d’entraînement des IA, sans violation du droit d’auteur. Une première décision favorable au développement de l’IA générative en gardant toutefois à l’esprit qu’elle a été prise dans le contexte particulier d’une utilisation faite par un organisme à but non lucratif pour alimenter un dataset dont le tribunal allemand a retenu que cette activité participait à la recherche scientifique.
________________________________________________
[1] Directive (UE) 2019/790 du Parlement européen et du Conseil du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique
[2] Considérant 18 de la DAMUN
[3] Règlement (UE) 2024/1689 du Parlement européen et du Conseil du 13 juin 2024 établissant des règles harmonisées concernant l’intelligence artificielle, Article 53.1,c