Le Conseil supérieur de la propriété littéraire et artistique (CSPLA), instance chargée de conseiller la ministre de la Culture en matière de propriété littéraire et artistique, a lancé une mission relative à la mise en œuvre du règlement européen établissement des règles harmonisées sur l’intelligence artificielle[1] (« règlement IA »)[2].
Il a été annoncé que la mission, présidée par Madame Alexandra Bensamoun, devait soumettre à l’approbation du CSPLA (en plénière) son projet de rapport provisoire le 9 décembre.
Très attendu, ce rapport, pour l’heure à l’état de projet, doit délivrer un état des lieux sur la question épineuse de l’entrainement des systèmes d’IA (« SIA ») à usage général[3], qui comprennent notamment les SIA génératifs tels que Chat GPT, à partir de données protégées par le droit d’auteur. Il doit se positionner sur l’établissement d’un premier modèle du « résumé », l’outil prévu dans le règlement IA pour contrôler le respect de la législation en matière de droit d’auteur par les fournisseurs de SIA.
Le règlement IA (article 53) a créé une obligation de transparence pour les fournisseurs de SIA à usage général qui leur impose de mettre en place une politique visant à se conformer à la législation de l’Union européenne en matière de droit d’auteur et de droit voisin[4], et notamment de la DAMUN (la directive du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique[5]) qui prévoit notamment le mécanisme de l’opt-out[6], très discuté en matière d’intelligence artificielle[7].
Concrètement, cette obligation se concrétise par la mise à disposition du public d’un « résumé suffisamment détaillé du contenu utilisé pour entrainer le modèle d’IA à usage général »[8], dont un modèle devra être fourni par le Bureau de l’IA (instance de régulation de la Commission européenne créée par le règlement IA).
Le rapport de la mission du CSPLA est donc très attendu car il fera état de la position de la France, dans la perspective des prochains débats européens, sur le contenu du résumé à établir.
On retrouve donc dans ce document des recommandations sur la mise en place de cet outil de transparence inédit, outil déterminant dans l’établissement de la preuve en cas de contentieux entre les titulaires de droits et les fournisseurs d’IA.
A ce stade du projet de rapport, la mission du CSPLA propose de retenir un type de résumé se fondant sur une approche par type de contenus récupérés pour l’entrainement des IA, avec « un degré de détail croissant en fonction de leur sensibilité au droit »[9] : les contenus libres de droit pourraient se contenter d’informations génériques, du fait du faible enjeux en matière contentieuse ; en revanche pour les autres données protégées, le rapport énonce comme essentielles certaines précisions telles que les URLs des sites internet dans lesquels les données ont été récupérées ainsi que la date de ces opérations de récupération. Les bases d’entrainements devraient aussi être suffisamment documentées (notamment sur les identifiants uniques) et le résumé contenir des informations pratiques telles que le contact de référence ou l’existence d’accord commerciaux le cas échéant.
Certaines informations plus poussées seraient en revanche couvertes par le secret des affaires, mais le rapport provisoire insiste sur la nécessité de rendre ces informations protégées accessibles « en cas de réclamation ou d’action judiciaire pour rendre au droit son effectivité »[10].
En outre, le rapport provisoire encourage de manière plus générale un dialogue direct entre les titulaires de droits et les fournisseurs de SIA et propose de déléguer à une autorité nationale la mission de traiter les réclamations qui découleront de ce mécanisme (qui pour l’instant revient au Bureau de l’IA[11]).
_____
[1] Règlement (UE) 2024/1689 du Parlement européen et du Conseil du 13 juin 2024 établissant des règles harmonisées concernant l’intelligence artificielle
[2] La ministre de la Culture Rachida Dati souhaite que le CSPLA expertise la portée de l’obligation de transparence prévue par le règlement européen et établisse la liste des informations paraissant devoir nécessairement être communiquées, selon les secteurs culturels concernés, pour permettre aux auteurs et aux titulaires de droits voisins d’exercer leurs droits.
[3] Selon la CNIL, un SIA à usage général est un SIA qui peut être utilisé et adapté à un large éventail d’applications pour lesquelles il n’a pas été conçu intentionnellement et spécifiquement ; il est destiné à exécuter des fonctions génériques telles que la reconnaissance d’images et de paroles, la génération d’images audio et vidéo, la détection de formes, la réponse à des questions, la traduction, etc, ce qui comprends les IA génératives.
[4] Article 53,1,d du règlement IA
[5] Directive (UE) 2019/790 du Parlement européen et du Conseil du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique
[6] La DAMUN a introduit deux exceptions au droit d’auteur : l’article 3 permet la reproduction et l’extraction de données sur des œuvres protégées par le droit d’auteur, accessibles de manière licite par des organismes de recherches et des institutions du patrimoine culturel, dans un but circonscrit à la recherche scientifique; l’article 4 permet quant à lui une telle reproduction pour tout bénéficiaire, sans restriction concernant l’objet des activités réalisées, mais en introduisant une limite par la possibilité donnée aux titulaires de droits de s’y opposer (mécanisme d’ opt-out).
[7] Article 3 et 4 de la DAMUN : sur ce point, voir notre dernière brève dans la LAJ du 14 novembre 2024 n° 162 « Intelligence artificielle et exception de fouille de textes et de données : une première décision rendue en Europe »
[8] Article 53,1,c du règlement IA
[9] Page 6 du rapport provisoire commenté
[10] Page 27 du rapport provisoire commenté
[11] Voir notre dernière brève dans la LAJ du 29 août 2024 n° 159 « Les codes de bonnes pratiques pour les intelligences artificielles à usage général, un outil nécessaire à la mise en œuvre du récent règlement européen sur l’intelligence artificielle »