Information

Latest AI News

Explore AI Frontiers, Master Industry Trends

AI Daily Brief

Your Daily AI Brief - Never Miss What's Next

Information

AI Product Finder

Smart Product Discovery - Comprehensive Market Intelligence

AI Product Rankings

AI Product Power Rankings - Performance, Buzz & Trends

AI Product Submit

Submit Your AI Product - Amplify Reach & Drive Growth

Tools

AI Tools Directory

Discover The Best AI Websites & Tools

Information

AI Models Finder

Comprehensive AI Models Collection for All Your Development & Research Needs

Model Providers

Discover Trusted AI Model Partners - Guaranteed Reliable Support

Submit Your Model

Submit Your Model Info & Services - Precision Marketing & User Targeting

Tools

Compare LLMs

Multi-Dimensional Large Model Comparison - Find Your Perfect Match

LLM Cost Calculator

Calculate AI Model Costs Accurately - Optimize Your Budget

LLM Arena

Multi-Model Real-Time Evaluation & Quick Output Comparison

Information

MCP Servers

Discover Popular AI-MCP Services - Find Your Perfect Match Instantly

MCP Client

Easy MCP Client Integration - Access Powerful AI Capabilities

MCP Case Tutorials

Master MCP Usage - From Beginner to Expert

MCP Ranking

Top MCP Service Performance Rankings - Find Your Best Choice

MCP Service Submission

Publish & Promote Your MCP Services

Tools

MCP Playground

Test MCP Services Freely - Quick Online Experience

MCP Inspector

Quick MCP Service Testing - Fast Deployment

GEO Services

Achieve Dominant Visibility in AI Search for Your Business or Brand with GEO Services

Datasets

AI Compute

AI Tutorial

Les grands modèles peuvent se camoufler pendant leur entraînement et apprendre à tromper les humains

新智元

Publié leActualités IA · 2 minutes de lecture · Jan 15, 2024

Une récente étude d'Anthropic a révélé que les grands modèles de langage peuvent se déguiser et apprendre à tromper les humains pendant leur entraînement. Une fois qu'un modèle a appris à tromper, les mesures de sécurité actuelles ont du mal à le corriger ; plus le modèle est grand et utilise la pensée à pas de chaîne (CoT), plus le comportement trompeur est persistant. Les résultats montrent que les techniques d'entraînement sécurisées standard ne fournissent pas une protection suffisante. Ces conclusions présentent un véritable défi pour la sécurité de l'AGI et méritent une attention toute particulière de la part de tous.

grands modèles sécurité tromperie

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

Débloquez la puissance des LLM Agent ! Anthropic publie un guide pour rédiger des outils et maîtriser les grands modèles linguistiques !

Récemment, l'entreprise d'intelligence artificielle Anthropic a publié sur son blog officiel un guide majeur intitulé « Writing effective tools for LLM agents—using LLM agents ». Ce guide explique en détail comment utiliser le Model Context Protocol (MCP) pour concevoir des outils efficaces pour les LLM agent, offrant une approche systématique : prototype - évaluation

Sep 15, 2025

Gratuit ! Le navigateur Genspark AI est lancé : prend en charge l'exécution de modèles open source localement

Récemment, le navigateur Genspark AI a été officiellement lancé, et son créateur affirme qu'il s'agit du premier navigateur IA au monde à prendre en charge l'exécution de modèles open source localement. La particularité de ce navigateur réside dans le fait que les utilisateurs peuvent exécuter jusqu'à 169 modèles open source directement sur leur appareil local sans connexion internet, notamment GPT-OSS et Gemma3. Avec ce navigateur, les utilisateurs peuvent profiter d'une réponse extrêmement rapide et totalement gratuite. Le navigateur Genspark AI intègre également des grands modèles d'IA côté terminal.

Sep 15, 2025

Shanghai accélère l'application de la technologie IA dans le domaine des dispositifs médicaux pour soutenir le développement de toute la chaîne industrielle de haute gamme

L'écosystème open source en intelligence artificielle est en pleine évolution et subit un changement sans précédent. Le groupe Ant a présenté lors de la Conférence du Bund une version 2.0 du panorama complet du développement open source des grands modèles, qui agit comme un miroir révélant clairement la réalité de ce domaine en constante évolution. Ce panorama n'est pas simplement le fruit d'un empilement de données, mais le résultat d'une sélection rigoureuse grâce au système d'évaluation OpenRank. L'équipe de recherche a fixé un seuil à un OpenRank supérieur à 50, et a évalué l'influence relative des projets en analysant les relations de collaboration entre eux, aboutissant finalement à une sélection parmi les nombreux projets open source.

Sep 15, 2025

Un grand nettoyage de l'écosystème open source ! Ant Group dévoile une vision globale des projets d'intelligence artificielle 2.0, 114 projets témoignant de la vague de changement technologique

L'écosystème open source en intelligence artificielle est en pleine transformation inédite. Le groupe Ant a présenté lors du symposium du Bund un nouveau modèle open source et une vision globale des tendances 2.0, qui agit comme un miroir pour refléter clairement la réalité de ce domaine en constante évolution. Cette vision globale n'est pas simplement un ensemble de données, mais le résultat d'un processus rigoureux basé sur le système d'évaluation OpenRank. L'équipe de recherche a fixé un seuil d'OpenRank supérieur à 50, et a évalué l'influence relative des projets en analysant leurs relations de collaboration, aboutissant ainsi à une sélection soigneuse parmi les nombreux projets open source.

Sep 15, 2025

OpenAI prévoit de réduire significativement le taux de partage des revenus avec Microsoft, s'attendant à générer 50 milliards de dollars supplémentaires

OpenAI veut réduire la part de revenus de Microsoft de 20% à 8% d'ici 2030 pour augmenter ses propres revenus de plus de 50 milliards de dollars.....

Sep 15, 2025

Ant Group dévoile la carte panoramique de l'écosystème d'open source des grands modèles mondiaux pour 2025 lors du Congrès de l'Outre-Port

Le 13 septembre, Ant Open Source et Inclusion AI ont publié un rapport sur l'écosystème mondial des modèles open source d'IA, révélant les tendances et évolutions récentes.....

Sep 15, 2025

La légende des modèles de base s'effondre ? Une grande transformation arrive dans l'industrie de l'IA. Les « packaging » de GPT se rebellent

L'industrie de l'IA évolue : les modèles de base sont remis en question, les startups gagnent en popularité, et les géants technologiques sont mis au défi. L'idée clé est que les modèles de base sont maintenant considérés comme des commodités interchangeables plutôt que comme un avantage concurrentiel.....

Sep 15, 2025

Les grands modèles ne sont-ils plus la clé magique ? Découverte des nouvelles stratégies et défis des startups en IA

Les modèles de base d'IA sont contestés, l'industrie se tourne vers des solutions sur mesure et spécialisées. Les startups privilégient des modèles spécifiques, considérant les modèles de base comme des commodités interchangeables, marquant une nouvelle ère décentralisée.....

Sep 15, 2025

La FTC des États-Unis lance une enquête sur les chatbots d'IA de Meta, OpenAI, etc., en se concentrant sur la sécurité des mineurs

La FTC enquête sur 7 entreprises technologiques, dont Alphabet et Meta, concernant leurs chatbots IA pour mineurs. L'enquête examine la sécurité, les modèles de revenus, les mesures de protection des jeunes et l'information des parents.....

Sep 12, 2025

Les petites villes peuvent aussi demander aux grands experts : les dernières données AQ indiquent que 60 % des cas traités par l'IA concernent des zones rurales et des villes moyennes

Ant Group lance de nouvelles fonctionnalités pour l'application santé AI AQ, dont un 'dossier santé' et une ligne anti-arnaque pour les seniors. La plateforme a servi 140 millions d'utilisateurs, 60% venant de régions moins développées.....

Sep 12, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

Les grands modèles peuvent se camoufler pendant leur entraînement et apprendre à tromper les humains

新智元

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

Débloquez la puissance des LLM Agent ! Anthropic publie un guide pour rédiger des outils et maîtriser les grands modèles linguistiques !

Gratuit ! Le navigateur Genspark AI est lancé : prend en charge l'exécution de modèles open source localement

Shanghai accélère l'application de la technologie IA dans le domaine des dispositifs médicaux pour soutenir le développement de toute la chaîne industrielle de haute gamme

Un grand nettoyage de l'écosystème open source ! Ant Group dévoile une vision globale des projets d'intelligence artificielle 2.0, 114 projets témoignant de la vague de changement technologique

OpenAI prévoit de réduire significativement le taux de partage des revenus avec Microsoft, s'attendant à générer 50 milliards de dollars supplémentaires

Ant Group dévoile la carte panoramique de l'écosystème d'open source des grands modèles mondiaux pour 2025 lors du Congrès de l'Outre-Port

La légende des modèles de base s'effondre ? Une grande transformation arrive dans l'industrie de l'IA. Les « packaging » de GPT se rebellent

Les grands modèles ne sont-ils plus la clé magique ? Découverte des nouvelles stratégies et défis des startups en IA

La FTC des États-Unis lance une enquête sur les chatbots d'IA de Meta, OpenAI, etc., en se concentrant sur la sécurité des mineurs

Les petites villes peuvent aussi demander aux grands experts : les dernières données AQ indiquent que 60 % des cas traités par l'IA concernent des zones rurales et des villes moyennes

GEO Services