Actualités IA

Ne manquez aucun moment de l'innovation mondiale en IA

IA Quotidien

Tendances quotidiennes de l'industrie de l'IA en trois minutes

Chronologie de l'IA

Jalons de l'industrie de l'IA

Al hardware

liste tous les produits de matériel AI.

Guide de monétisation de l'IA

Derniers cas

Partage de cas de monétisation de l'IA

Collection d'images

Cas de monétisation de la création d'images par l'IA

Collection de vidéos

Cas de monétisation de la création de vidéos par l'IA

Collection audio

Cas de monétisation de la création audio par l'IA

Collection de contenu

Cas de monétisation de la rédaction de contenu par l'IA

Tutoriels IA

Derniers tutoriels

Partage gratuit des derniers tutoriels IA

Classements des produits IA

Classement des produits IA

Affiche le classement du nombre total de visites des sites web d'IA

Classement de la croissance du trafic IA

Suit les sites web d'IA à la croissance la plus rapide en termes de trafic

Classement de la baisse du trafic IA

Se concentre sur les sites web d'IA avec des baisses de trafic importantes

Classement hebdomadaire de l'IA

Affiche le classement hebdomadaire des visites des sites web d'IA

Classements des pays populaires

États-Unis

Sites web d'IA les plus populaires auprès des utilisateurs américains

Chine

Sites web d'IA les plus populaires auprès des utilisateurs chinois

Inde

Sites web d'IA les plus populaires auprès des utilisateurs indiens

Brésil

Sites web d'IA les plus populaires auprès des utilisateurs brésiliens

Classements des catégories populaires

Génération d'images

Classement du nombre total de visites des sites web de génération d'images par l'IA

Assistant personnel

Classement du nombre total de visites des sites web d'assistants personnels d'IA

Génération de personnages

Classement du nombre total de visites des sites web de génération de personnages par l'IA

Génération de vidéos

Classement du nombre total de visites des sites web de génération de vidéos par l'IA

Classements des données Open Source populaires

Classement des projets IA

Projets IA populaires sur GitHub par nombre total d'étoiles

Classement de la croissance des projets IA

Projets IA populaires sur GitHub par taux de croissance

Classement des développeurs IA

Classement des développeurs IA populaires sur GitHub

Classement des organisations IA

Classement des organisations IA populaires sur GitHub

Catégories Open Source populaires

Deepseek

Projets Open Source Deepseek populaires sur GitHub

TTS

Projets Open Source TTS populaires sur GitHub

LLM

Projets Open Source LLM populaires sur GitHub

ChatGPT

Projets Open Source ChatGPT populaires sur GitHub

Bibliothèque de projets Open Source IA

Aperçu

Aperçu des projets Open Source IA populaires sur GitHub

Bibliothèque de produits Navigation de l'outil MCP

Reddit intenté une action en justice contre Anthropic pour scraping illégal de données utilisé pour former Claude : demande la suppression de tous les modèles d'IA contenant du contenu de Reddit

AIbase基地

Publié leActualités IA · 8 minutes de lecture · Jun 5, 2025

18.6k

Reddit a intenté une action en justice contre la société d'intelligence artificielle Anthropic devant le tribunal de district de San Francisco, l'accusant d'avoir systématiquement scrapé des publications de Reddit pour former le modèle linguistique Claude sans autorisation, en violation des accords d’utilisation de la plateforme et des règles d'utilisation commerciale.

Ce litige souligne les controverses juridiques liées à l'acquisition de données pour l'entraînement des IA, ainsi que les tensions croissantes entre les plateformes de contenu et les entreprises d'IA. Reddit demande au tribunal d'ordonner à Anthropic de supprimer tous les modèles et ensembles de données IA contenant du contenu de Reddit et d'interdire toute utilisation commerciale des modèles IA formés à partir de données Reddit.

Contournement des mesures techniques de protection

Conformément aux documents du procès, Anthropic a ignoré les dispositions des accords d’utilisation de Reddit, contournant des fichiers robots.txt et des limites de fréquence basées sur l'adresse IP. Ce qui est encore plus préoccupant, Anthropic n’a jamais utilisé l’API conforme de Reddit – un outil qui informe les parties autorisées lorsqu'un article est supprimé afin de garantir que ce contenu soit retiré du système d’entraînement.

Le procès révèle qu'Anthropic a publiquement admis utiliser des données de Reddit dans ses recherches, en citant plus de 40 sous-forums de qualité, tels que r/science, r/IAmA et r/relationship_advice, comme sources pour former Claude. Reddit affirme que cette collecte de données s'est faite sans consentement, en violation des mesures de protection de la plateforme.

Anthropic, Claude

Contradiction entre les déclarations publiques et les actions réelles

La contradiction la plus problématique réside dans les déclarations des porte-parole d’Anthropic et leurs actions concrètes. En juillet 2024, un porte-parole d’Anthropic a affirmé que Reddit avait été ajouté à la liste noire de ClaudeBot depuis mai. Cependant, les journaux internes de Reddit montrent que des robots d'Anthropic ont continué d’accéder aux serveurs de Reddit plus de 100 000 fois après cette déclaration.

Cette découverte remet directement en question les engagements publics d’Anthropic et constitue une preuve centrale dans le procès intenté par Reddit.

Menaces pesant sur la vie privée des utilisateurs et les intérêts commerciaux

Dans sa plainte, Reddit souligne que les actions d’Anthropic menacent à la fois les intérêts commerciaux de la plateforme et la vie privée des utilisateurs. Sans licence ou connexion à l'API conforme, il est impossible de vérifier si des articles supprimés ou sensibles restent intégrés dans le modèle Claude.

« Si des tiers comme Anthropic collectent des données de Reddit sans accord, les utilisateurs de Reddit ne bénéficient plus de la moindre protection des politiques de contenu public ou de confidentialité, car ils ne peuvent pas savoir quels tiers collectent et récupèrent leurs données », indique le document de la plainte.

Cette argumentation touche au cœur du problème central concernant l'utilisation des données d'entraînement IA : les utilisateurs ont-ils le droit de contrôler l'utilisation ultérieure de leur contenu, notamment dans des systèmes IA commerciaux ?

Un contraste avec le chemin suivi par Google

Reddit souligne également que d'autres entreprises IA ont opté pour des voies différentes. Selon les rapports, Google verse annuellement 60 millions de dollars à Reddit pour obtenir l'autorisation d'utiliser les données d'entraînement, un partenariat qui a considérablement amélioré la visibilité de Reddit dans les résultats de recherche de Google ces derniers mois.

Ce contraste met en lumière la division actuelle dans l'industrie IA en matière d'acquisition de données : certaines entreprises choisissent de payer pour obtenir des autorisations légales, tandis que d'autres tentent de contourner les restrictions via des méthodes techniques.

Réclamations juridiques et impact industriel

Reddit accuse Anthropic de violation de contrat et de concurrence déloyale dans son procès, demandant des dommages pour compenser les pertes de revenus liés aux licences. Plus important encore, Reddit demande au tribunal d'émettre une injonction interdisant à Anthropic d'utiliser Claude ou tout autre modèle IA formé à partir de données Reddit à des fins commerciales.

Si Reddit gagne, cela pourrait établir un précédent pour d'autres plateformes de contenu dans leurs procès similaires contre des entreprises d'IA, redéfinissant ainsi les limites légales de l'acquisition des données d'entraînement IA. Le résultat de ce cas aura un impact direct sur les pratiques d'utilisation des données dans l'industrie IA et sa structure de coûts.

Le différend actuel reflète le conflit fondamental entre la vitesse rapide de développement de l'IA et les mécanismes traditionnels de protection des droits d'auteur et de confidentialité. L'affaire Reddit c. Anthropic pourrait devenir un arrêt clé pour définir ce point d’équilibre.

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily