Le débat sur la légalité des données d'entraînement de l'intelligence artificielle a fini par évoluer en une tempête juridique qui secoue Silicon Valley. Le tribunal de Californie aux États-Unis a récemment accepté un procès qui place Meta, le géant technologique mondial, au centre de l'attention publique. L'action en justice conjointe déposée par deux entreprises de production de films pour adultes, Strike3 et Counterlife Media, révèle non seulement les dessous du piratage de données derrière l'entraînement de l'IA, mais aussi un montant de réclamation de 359 millions de dollars, mettant en garde l'industrie technologique sur la protection des droits d'auteur.
Les accusations centrales de ce procès sont choquantes. Selon les documents judiciaires, Meta a téléchargé volontairement des contenus protégés par le droit d'auteur provenant de sources piratées depuis 2018, impliquant au moins 2 396 œuvres. Ces vidéos obtenues illégalement ont été utilisées pour entraîner plusieurs systèmes d'IA, y compris le modèle de génération vidéo Meta Movie Gen et le grand modèle linguistique LLaMA, fournissant ainsi un soutien important pour le développement technique de l'IA de Meta.
Plus surprenant encore, la manière dont Meta a obtenu ces contenus est particulièrement inquiétante. Les documents judiciaires détaillent que Meta n'a pas simplement téléchargé ces contenus piratés, mais qu'il a activement utilisé la technologie de partage de fichiers BitTorrent pour obtenir massivement des contenus illégaux. Cette méthode P2P a une particularité : les personnes qui téléchargent deviennent également des diffuseurs de contenus, transmettant les mêmes fichiers à d'autres utilisateurs via la technologie de « seed ».
Le choix de cette méthode de téléchargement par Meta n'est pas accidentel. Le principal avantage du protocole BitTorrent réside dans son mécanisme de téléchargement distribué, qui permet d'améliorer significativement la vitesse de transmission des grands fichiers, ce qui est particulièrement pertinent pour les projets d'entraînement d'IA nécessitant des quantités massives de vidéos. Cependant, cela signifie que Meta n'est pas seulement un destinataire passif de contenus, mais aussi un diffuseur actif de contenus piratés, rendant ainsi sa conduite encore plus grave.
Le cabinet d'avocats des plaignants souligne dans leur plainte que Meta avait la capacité de recourir à des voies légales pour obtenir les données d'entraînement nécessaires. Que ce soit en achetant directement les licences de droits d'auteur ou en modifiant les paramètres de leurs outils de téléchargement pour éviter tout comportement de diffusion, Meta disposait de plusieurs options conformes. Cependant, l'entreprise a choisi la méthode la plus controversée pour continuer à télécharger et diffuser illégalement, illustrant clairement son intention d'infraction.
Ce procès n’est pas un événement isolé, mais représente un point culminant récent des conflits liés aux droits d’auteur dans les entreprises d’IA. Plusieurs auteurs célèbres ont déjà porté des actions en justice similaires contre Meta, l’accusant d’avoir utilisé, sans autorisation, des œuvres littéraires protégées par le droit d’auteur pour entraîner ses modèles d’IA. Il convient de noter que lors de ces procès, Meta a déjà reconnu publiquement avoir effectivement obtenu des contenus d’entraînement à partir de sources piratées. Cette admission fournit une base juridique importante pour ce procès actuel et place Meta dans une position plus défavorable dans ce nouveau cas.
Le rôle de la société Strike3 dans ce procès revêt une importance symbolique particulière. En tant qu’une des institutions les plus actives de défense des droits d’auteur aux États-Unis, Strike3 s’est longtemps concentrée sur le poursuite des utilisateurs individuels de piratage, en déposant de nombreux procès civils pour défendre les intérêts légitimes des titulaires de droits. Cependant, cette fois-ci, elle vise directement Meta, un géant technologique, marquant ainsi l’extension des frontières de la protection des droits d’auteur vers un niveau supérieur, et montrant comment les stratégies traditionnelles de défense des droits d’auteur commencent à s’adapter aux nouveaux défis de l’ère de l’IA.
Le montant de 359 millions de dollars de réclamation, bien qu’important, est calculé de manière claire. Selon les dispositions de la loi américaine sur les droits d’auteur, la compensation forfaitaire maximale par œuvre contrefaite peut atteindre 150 000 dollars, et le montant total des dommages-intérêts pour les 2 396 films concernés approche précisément ce chiffre. Cette méthode de calcul basée sur le nombre d'œuvres illustre pleinement la sévérité de la loi sur les droits d'auteur face aux infractions en série.
Pour Meta, l'impact de ce procès dépasse largement les pertes économiques. En tant que société technologique de premier plan, Meta investit énormément dans l'intelligence artificielle, et la compétitivité de ses produits d'IA dépend largement de l'accès à des données d'entraînement de haute qualité. Si le tribunal conclut finalement que la manière dont Meta a obtenu ses données est illégale, cela affectera non seulement la situation financière de l'entreprise, mais pourrait aussi l'obliger à reconsidérer entièrement sa stratégie d'obtention de données d'entraînement.
La portée plus profonde de ce procès réside dans le fait qu’il pourrait devenir un point tournant important pour la réglementation des droits d’auteur dans l’industrie de l’IA. Avec le développement rapide de la technologie d’intelligence artificielle, la demande en données d’entraînement augmente exponentiellement, alors que le cadre juridique actuel sur les droits d’auteur semble encore insuffisant pour répondre à ces nouvelles technologies. Le résultat du procès Meta risque de poser un précédent juridique important pour les normes d'utilisation des données dans tout le secteur.
Aujourd'hui, Meta n’a pas encore réagi officiellement à ce procès, mais l'industrie considère généralement que ce sera un combat juridique prolongé. Quel que soit le résultat final, ce cas a déjà envoyé un signal clair à toutes les entreprises d'IA : pendant qu'ils recherchent l'innovation technologique, ils doivent strictement respecter les lois sur les droits d'auteur, autrement ils encourent de grands risques juridiques et économiques.
Avec l'intelligence artificielle devenue de plus en plus un pilier de la compétitivité dans tous les domaines, comment équilibrer l'innovation technologique et la protection des droits d'auteur est devenu une question cruciale que la société doit affronter. Le procès de Meta sera certainement une référence pratique importante pour résoudre cette question complexe.