Récemment, les pratiques de Meta en matière d'entraînement de l'intelligence artificielle ont fait l'objet d'un examen minutieux. Selon une plainte déposée, la société est accusée d'avoir téléchargé illégalement une quantité massive de livres électroniques et d'articles piratés pour entraîner ses modèles d'IA, sans autorisation.

Copyright, piratage

Au cœur de l'affaire se trouvent plusieurs e-mails divulgués qui fournissent des preuves supplémentaires des agissements de Meta. Ces e-mails révèlent que Meta a admis avoir téléchargé un vaste jeu de données controversé appelé LibGen, contenant des dizaines de millions de livres piratés. Selon les documents judiciaires déposés par les plaignants, Meta a téléchargé au moins 81,7 To de données via le site Anna's Archive, provenant de plusieurs bibliothèques obscures, dont au moins 35,7 To provenant de Z-Library et de LibGen. De plus, Meta aurait précédemment téléchargé 80,6 To de données depuis LibGen. Ces chiffres illustrent l'ampleur de cette activité illégale.

Les plaignants soulignent que, bien que d'autres actes de piratage à plus petite échelle aient déjà fait l'objet de poursuites judiciaires, l'ampleur des actions de Meta est considérablement plus importante. Les e-mails montrent également que des employés de Meta ont exprimé leurs inquiétudes quant aux risques juridiques liés à leurs actions. En avril 2023, Nikolaï Bachlikoff, ingénieur de recherche chez Meta, a déclaré : « Télécharger des torrents avec l'ordinateur portable de l'entreprise ne me semble pas approprié. » En septembre 2023, ses objections étaient plus franches, et il a consulté l'équipe juridique. Il a souligné que « l'utilisation de torrents implique le « seeding » des fichiers, c'est-à-dire le partage de contenu. Ceci est illégal. » Cependant, malgré ces avertissements, Meta semble avoir décidé de dissimuler ses activités de téléchargement et de partage, et a essayé de minimiser la traçabilité du « seeding » en modifiant les paramètres.

Meta aurait également tenté de réduire le risque d'être retracé jusqu'à ses serveurs en téléchargeant les jeux de données sur des serveurs externes à Meta. Cette série d'actions soulève de sérieuses questions sur les pratiques de Meta en matière d'utilisation des données et de respect des droits d'auteur.

Points clés :

📚 Meta est accusée d'avoir illégalement téléchargé 81,7 To de livres piratés, apparemment pour l'entraînement de son IA.

⚖️ Des employés ont exprimé leurs inquiétudes quant aux risques juridiques, avertissant que les téléchargements pouvaient être illégaux.

🔍 Meta a tenté de se soustraire à ses responsabilités juridiques en dissimulant ses actions et en utilisant des serveurs externes.