Bienvenue dans l'émission « AI Daily » ! C'est votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les contenus chauds du domaine de l'IA, en mettant l'accent sur les développeurs, afin que vous puissiez comprendre les tendances technologiques et découvrir des applications innovantes d'outils d'IA.

Produits d'IA nouveaux cliquez pour en savoir plus : https://app.aibase.com/zh

1. Microsoft lance son premier modèle de génération d'images développé en interne, MAI-Image-1, qui se classe parmi les dix premiers sur LMArena

Microsoft AI lance officiellement son premier modèle de génération d'images entièrement développé en interne, MAI-Image-1, qui se classe parmi les dix premiers sur LMArena, démontrant ainsi une capacité exceptionnelle à générer des images. MAI-Image-1 met l'accent sur la valeur pratique, évitant la génération d'images redondantes ou trop similaires. Il excelle notamment dans les effets de lumière et les paysages naturels, combinant vitesse et qualité pour améliorer l'efficacité de la création. L'équipe de Microsoft teste également le modèle sur LMArena pour garantir son utilisation sécurisée et prévoit de l'intégrer à Copilot et Bing Image Creator, offrant aux utilisateurs des outils de création plus puissants.

image.png

【Résumé par AiBase :】

🌟 Premier modèle développé en interne : MAI-Image-1 est le premier modèle de génération d'images entièrement développé par Microsoft AI.

⚡ Qualité élevée et itérations rapides : Ce modèle excelle dans la génération d'images réalistes, combinant vitesse et qualité pour améliorer l'efficacité créative.

🛡️ Utilisation sécurisée : L'équipe de Microsoft teste le modèle sur LMArena pour assurer son utilisation sécurisée et prévoit sa mise en ligne sur davantage de plateformes.

Lien vers les détails : https://microsoft.ai/news/introducing-mai-image-1-debuting-in-the-top-10-on-lmarena/

2. Le « Google World 2025 » aura lieu le 13 novembre : axé sur les technologies de grands modèles, les applications natives d'IA et les stratégies de mondialisation

Le congrès « Google World 2025 » se concentre sur les technologies de grands modèles, les applications natives d'IA et les stratégies de mondialisation, mettant en avant les avantages techniques et les orientations futures de Google dans le domaine de l'intelligence artificielle.

image.png

【Résumé par AiBase :】

🧠 Google présentera ses progrès les plus récents et son expertise dans les technologies de grands modèles.

💡 Explorera la construction d'une écosystème d'applications natives d'IA pour favoriser la transformation numérique.

🌍 Présentera sa stratégie de sortie à l'international et explorera les potentiels de croissance sur les marchés mondiaux.

3. Le laboratoire de super-intelligence de Meta lance une nouvelle technologie, augmentant la vitesse de raisonnement des grands modèles RAG de 30 fois

Meta a lancé un nouveau laboratoire de super-intelligence (MSL) et publié un article important intitulé « REFRAG: Rethinking RAG based Decoding », améliorant significativement la vitesse de raisonnement des grands modèles linguistiques dans les tâches de génération renforcée par la recherche (RAG), avec une augmentation supérieure à 30 fois. Cette étude améliore l'efficacité et la précision du modèle grâce à des méthodes de compression d'information et de pré-entraînement continu, apportant une nouvelle impulsion au développement de l'intelligence artificielle.

image.png

【Résumé par AiBase :】

🧠 Meta a créé un laboratoire de super-intelligence pour accélérer le développement de l'IA.

⚡ Le papier « REFRAG » améliore la vitesse de raisonnement RAG de 30 fois, réduisant la charge de calcul.

🚀 Le cadre REFRAG améliore l'efficacité et la précision des grands modèles linguistiques grâce à la compression d'informations.

Détails : https://arxiv.org/abs/2509.01092

4. Construisez votre propre ChatGPT pour 100 dollars : un outil d'enseignement open source pour les géants de l'IA, transformez un chatbot en 4 heures

Nanochat est un nouveau projet open source qui permet aux développeurs ordinaires et aux amateurs d'IA de construire un système d'IA de chat fonctionnel à un coût extrêmement faible. Ce projet réalise un processus d'une seule touche, allant du traitement des données à la mise en production, réduisant considérablement la barrière technique.

image.png

【Résumé par AiBase :】

🔥 Nanochat fournit un outil pédagogique complet pour aider les utilisateurs à comprendre en profondeur le processus d'entraînement des grands modèles linguistiques.

💡 Le projet couvre les étapes de l'entraînement du modèle, du fine-tuning, de l'évaluation et de la mise en production interactive, supportant un chargement efficace distribué.

🚀 L'utilisateur n'a qu'à lancer un nœud cloud et exécuter un seul script pour terminer l'ensemble du processus en 4 heures.

Détails : https://github.com/karpathy/nanochat

5. Google NotebookLM lance une fonction vidéo en style manga : Nano Banana génère six styles artistiques en un clic, mais le soutien au chinois reste à améliorer

Le dernier outil Google NotebookLM a été mis à jour avec une fonction vidéo en style manga, permettant aux utilisateurs de transformer des documents en vidéos dynamiques grâce au modèle d'images Nano Banana et de choisir plusieurs styles artistiques. Bien que la fonction soit puissante, le soutien au chinois présente encore des lacunes, comme la confusion des dialectes et des problèmes de synchronisation.

image.png

【Résumé par AiBase :】

✨ Google NotebookLM ajoute une fonction vidéo en style manga, enrichissant la créativité.

🎨 Supporte six styles artistiques, y compris l'eau-forte, l'impression vintage et le style animé japonais.

⚠️ Le soutien au chinois présente des problèmes de traitement linguistique, nécessite une optimisation supplémentaire pour s'adapter à un environnement multilingue.

6. L'Université agricole de Chine lance le modèle Shennong 3.0, l'IA soutient le développement rural

L'Université agricole de Chine a lancé le modèle Shennong 3.0 lors de la conférence mondiale sur l'innovation technologique agricole 2025. Ce modèle couvre non seulement les disciplines agricoles nationales, mais marque aussi une nouvelle étape dans le développement de l'IA agricole en Chine. Le modèle Shennong 3.0 propose trois versions : 32B, 7B et 1B, améliorant considérablement l'efficacité de calcul et réduisant l'infrastructure de calcul de 50 %. En outre, l'équipe a lancé la plateforme « Shennong Intelligent Agent », créant un écosystème d'applications d'IA nouveau, poussant ainsi le développement de l'IA agricole vers un « intelligence systémique » supérieur.

image.png

【Résumé par AiBase :】

🌱 Le modèle Shennong 3.0 couvre les disciplines agricoles et les scénarios d'application nationaux, marquant une nouvelle étape dans le développement de l'IA agricole en Chine.

🚀 Le modèle Shennong 3.0 propose trois versions : 32B, 7B et 1B, améliorant l'efficacité de calcul et réduisant l'infrastructure de calcul de 50 %.

🌍 L'équipe de l'Université agricole de Chine lance la plateforme « Shennong Intelligent Agent », construisant un écosystème d'applications d'IA nouveau.

7. Tencent se concentre sur la formation des talents en IA : la bourse Qingyun finance 15 chercheurs de haut niveau, fournissant des ressources de calcul rares

Tencent a annoncé le lancement de la bourse Qingyun, axée sur la recherche fondamentale et l'innovation appliquée dans le domaine de l'intelligence artificielle, visant à soutenir les excellents masters et docteurs dans les domaines informatiques, de l'IA et de leurs intersections. La première phase prévoit de sélectionner 15 lauréats, chacun recevant 500 000 yuans en espèces et des ressources de calcul pour résoudre les problèmes de calcul dans leurs recherches. Cette bourse est une composante importante du plan de recrutement de Tencent, complétant ainsi son système de formation multidimensionnel.

image.png

【Résumé par AiBase :】

🧠 La bourse Qingyun de Tencent se concentre sur le domaine de l'IA, soutenant la recherche des masters et docteurs.

💰 La première phase finance 15 lauréats, chacun recevant 500 000 yuans en espèces et des ressources de calcul.

🚀 La bourse vise à améliorer le système de formation de Tencent, offrant des opportunités de mentorat et de visite de laboratoires.

8. Apple lance un nouveau modèle FS-DFM, l'efficacité de la rédaction de textes longs en IA augmente de 128 fois !

Le modèle FS-DFM, publié par Apple en collaboration avec l'équipe de l'Université d'État de l'Ohio, montre un excellent rendement dans la génération de textes longs. Il suffit de 8 itérations rapides pour générer un texte de haute qualité, avec une vitesse d'écriture pouvant être multipliée par 128, rompant ainsi le plafond d'efficacité des générations de textes longs. Ce modèle optimise le mécanisme d'itération en trois étapes, surpassant d'autres grands modèles sur des indicateurs clés tels que la confusion et l'entropie, démontrant ainsi son potentiel dans le domaine de la rédaction de textes longs en IA.

image.png

【Résumé par AiBase :】

🍎 Le modèle FS-DFM ne nécessite que 8 itérations pour générer un texte de qualité comparable à celui de modèles traditionnels après mille itérations.

🚀 La vitesse d'écriture peut être multipliée par 128, améliorant considérablement l'efficacité de la génération de textes longs.

🔍 Les tests de performance montrent que le FS-DFM dépasse les autres grands modèles sur des indicateurs clés tels que la confusion et l'entropie.

Détails : https://machinelearning.apple.com/research/fs-dfm

9. Google Lens et le mode IA lancent la fonction d'édition d'images Nano Banana

Google a officiellement lancé la fonction d'édition d'images Nano Banana, qui a reçu un bon accueil dans l'application Gemini. Cette fonction est intégrée au mode IA et à Google Lens, permettant aux utilisateurs d'éditionner et de générer des images plus facilement. Actuellement, cette fonction est disponible pour les utilisateurs Android et iOS aux États-Unis et en Inde, et prévue pour être étendue à plus de pays et régions.

image.png

【Résumé par AiBase :】

📱 Le mode IA et Google Lens sont intégrés, améliorant l'expérience de capture et d'édition d'images.

🌍 Nouvelle prise en charge de 35 langues et 40 pays, élargissant la portée du mode IA.

🎨 Les utilisateurs peuvent créer ou modifier des images en utilisant l'emoji banane et incluent un filigrane Gemini.

10. L'Université de Hong Kong et Meituan résolvent un problème mathématique en IA : CodePlot-CoT permet aux grands modèles d'utiliser le code pour penser graphiquement, améliorant les performances de 21 %

Cet article présente la méthode CodePlot-CoT proposée par l'équipe de l'Université de Hong Kong et de Meituan, qui consiste à faire générer aux grands modèles des codes de dessin pour résoudre des problèmes géométriques mathématiques. Cette méthode transforme les problèmes de génération d'images en problèmes de modélisation linguistique, améliorant ainsi les performances des grands modèles dans le raisonnement mathématique.

image.png