Conformément à un rapport récent publié par l'équipe de recherche de l'Université de Stanford dans la revue « Patterns » de Cell Press, les modèles linguistiques de grande taille (LLM) sont désormais largement utilisés dans diverses situations de communication écrite formelle. Cette étude a analysé des textes en anglais provenant de plateformes telles que Newswire, PRWeb et PRNewswire, et a constaté qu'un grand nombre d'entre eux présentaient des traces évidentes d'IA.

L'équipe de recherche a utilisé un modèle statistique appelé « cadre de quantification distribuée des LLM » (Distributional LLM Quantification Framework), qui estime la proportion de textes ayant des caractéristiques générées par l'IA pendant une période donnée, en analysant la distribution globale des caractéristiques linguistiques du corpus. Il convient de noter que cette méthode est actuellement applicable uniquement aux corpus en anglais, donc les résultats reflètent uniquement la proportion de textes en anglais présentant des caractéristiques d'IA, et ne signifie pas que l'article entier a été "entièrement rédigé par l'IA".
Les données du rapport montrent que l'équipe de recherche a analysé un total de 687 000 plaintes de consommateurs, 537 000 communiqués de presse d'entreprises, 304 millions d'offres d'emploi et 16 000 communiqués de presse des Nations Unies, avec des résultats inquiétants :
Communiqués de presse d'entreprises : environ 24 % des documents présentent des traces d'IA.
Plaintes des consommateurs : environ 18 % des textes de plainte présentent des caractéristiques d'IA.
Communiqués de presse des Nations Unies : environ 14 % du contenu est considéré comme "presque entièrement généré directement par un grand modèle d'IA, ou réécrit de manière importante."
Offres d'emploi : près de 10 % du contenu des offres présente des traces d'IA.
Les chercheurs soulignent que les LLM ont pénétré profondément le texte écrit formel dans tous les domaines de la société et deviennent progressivement un outil important pour l'expression écrite quotidienne. Dans les domaines spécifiques, l'étude a découvert que la proportion d'utilisation d'IA pour rédiger des plaintes est de 19,9 % dans les régions où le niveau d'éducation est faible, ce qui est nettement plus élevé que les 17,4 % observés dans les régions plus éduquées. Concernant les offres d'emploi, les petites entreprises ou les startups privilégient davantage l'utilisation de grands modèles pour générer du contenu, avec environ 10 à 15 % des annonces d'emploi contenant des traces évidentes d'IA.
Les chercheurs soulignent également que, avec l'amélioration continue des technologies d'IA générative, leur style d'écriture devient de plus en plus proche de celui des humains. Ainsi, il deviendra de plus en plus difficile d'identifier précisément le rôle de l'IA dans la création de textes à l'avenir.