Lors d'un récent procès, Mark Zuckerberg, PDG de Meta, a utilisé la lutte de YouTube contre le contenu piraté pour défendre l'utilisation par sa société de données protégées par des droits d'auteur pour l'entraînement de l'IA. L'affaire, Kadrey c. Meta, fait partie des nombreux procès pour violation de droits d'auteur intentés contre des entreprises d'IA aux États-Unis. Les plaignants incluent les auteurs célèbres Sarah Silverman et Ta-Nehisi Coates.

Copyright (1)(1)

Selon des extraits de témoignages de Zuckerberg récemment rendus publics, il a indiqué que, bien qu'il puisse y avoir du contenu piraté sur YouTube, la plateforme s'efforce de le supprimer. « La plupart des contenus sur YouTube devraient être légaux, ils disposent des licences nécessaires », a déclaré Zuckerberg. Cette déclaration suggère sa position concernant l'utilisation par Meta de l'ensemble de données de livres électroniques protégés par des droits d'auteur, LibGen, pour l'entraînement de l'IA.

LibGen est un site web d'agrégation de liens qui propose des œuvres protégées par des droits d'auteur de plusieurs éditeurs, notamment Cengage Learning, McGraw-Hill et Pearson Education. Ce site a été poursuivi à plusieurs reprises pour violation de droits d'auteur et a été condamné à des amendes de plusieurs dizaines de millions de dollars. Des documents judiciaires montrent que, bien que l'équipe IA de Meta ait exprimé des inquiétudes quant aux risques juridiques liés à l'utilisation de LibGen, Zuckerberg a néanmoins approuvé son utilisation comme ensemble de données d'entraînement.

Lors de son interrogatoire, Zuckerberg a affirmé ne pas connaître LibGen, mais a déclaré qu'il serait déraisonnable d'interdire l'utilisation de plateformes comme YouTube. « Non, je ne souhaiterais pas imposer de politique concernant l'utilisation de YouTube par les gens, car certains contenus peuvent être protégés par des droits d'auteur », a-t-il déclaré. Il a également reconnu que Meta devait faire preuve de prudence lorsqu'elle utilisait du matériel protégé par des droits d'auteur pour l'entraînement.

Selon les dernières accusations des avocats des plaignants, Meta aurait recoupé certaines œuvres piratées de LibGen avec des œuvres protégées par des droits d'auteur disponibles sous licence pour déterminer si des accords de licence devaient être conclus avec les éditeurs. En outre, les plaignants accusent Meta d'avoir utilisé l'ensemble de données LibGen pour entraîner son dernier modèle Llama et d'avoir téléchargé des livres électroniques à partir d'une autre source de piratage, Z-Library, à des fins d'entraînement.

Z-Library a également fait l'objet de plusieurs actions en justice pour violation de droits d'auteur, et ses administrateurs ont été inculpés en 2022 pour violation de droits d'auteur, fraude informatique et blanchiment d'argent.

Points clés :

📚 Zuckerberg utilise l'exemple de YouTube en cour pour défendre l'utilisation par Meta de matériel protégé par des droits d'auteur pour l'entraînement de l'IA.

🔍 Les plaignants accusent Meta d'avoir utilisé l'ensemble de données de livres piratés LibGen pour entraîner le modèle Llama et de dissimuler des informations.

⚖️ Meta fait face à plusieurs poursuites pour violation de droits d'auteur, et les risques juridiques associés ont suscité des discussions et des préoccupations internes.