Bienvenue dans le programme « Journal de l'IA » ! C'est votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les sujets d'actualité dans le domaine de l'IA, en mettant l'accent sur les développeurs, afin que vous puissiez comprendre les tendances technologiques et découvrir les applications des produits d'IA innovants.
Produits d'IA fraîchement lancés Cliquez pour en savoir plus :https://app.aibase.com/zh
1. Shengshu Technology lance Vidu Q2, qui génère des expressions subtiles pour une interprétation plus réaliste par l'IA !
Le modèle Vidu Q2 développé par Shengshu Technology a réalisé un grand progrès dans le domaine de la génération de vidéos à partir d'images, en particulier dans la génération d'expressions subtiles, offrant ainsi une expérience visuelle plus réelle et vivante pour l'interprétation par l'IA.
【Résumé par AiBase :】
🎭 Vidu Q2 peut capturer avec précision les changements subtils des expressions faciales, améliorant ainsi la nature et l'expression émotionnelle des vidéos générées.
🎥 Il prend en charge plusieurs modes de vidéo, y compris la génération de vidéos à partir d'images, les vidéos avec les premières et dernières images, ainsi qu'une option de durée ajustable, répondant ainsi à divers besoins.
💡 Shengshu Technology s'efforce de promouvoir le développement créatif grâce aux technologies de l'IA, offrant aux utilisateurs une meilleure expérience de création d'images.
2. Volcán Engine lance la plateforme Lumi de Lumi, prenant en charge le fine-tuning des modèles visuels Lora
La plateforme Lumi de Lumi lancée par Volcán Engine prend en charge pour la première fois la fonction de fine-tuning Lora des mêmes modèles visuels que Doubao et Jiemeng, afin d'aider les entreprises à personnaliser efficacement leur propre style visuel et à répondre aux besoins du marché.
【Résumé par AiBase :】
🧠 La plateforme Lumi de Lumi prend en charge la fonction de fine-tuning Lora des modèles visuels, permettant aux entreprises de personnaliser leur propre style visuel.
🚀 Cette plateforme propose un service complet allant de la génération d'images à la génération de vidéos, répondant ainsi aux besoins professionnels des entreprises en matière de AIGC.
💡 La plateforme Lumi de Lumi aide les entreprises à construire efficacement des capacités de production AIGC personnalisées, améliorant ainsi l'expérience utilisateur.
3. Le CTO d'Alibaba Cloud révèle : Tongyi Qianwen a ouvert plus de 300 modèles, le nombre de téléchargements dépasse 6 milliards
Alibaba Cloud a présenté lors de la conférence Cloud栖 2025 les importantes réalisations du projet Tongyi Qianwen, notamment l'ouverture de plus de 300 modèles et le dépassement de 6 milliards de téléchargements. Cela démontre la forte influence et les capacités techniques d'Alibaba Cloud dans le domaine de l'IA, tout en poussant l'innovation technologique et l'application pratique via des modèles open source.
【Résumé par AiBase :】
🚀 Le projet Tongyi Qianwen a ouvert plus de 300 modèles, montrant une solide force technique.
📊 Le nombre total de téléchargements dépasse 6 milliards, ce qui témoigne de la forte reconnaissance des utilisateurs envers les technologies d'IA d'Alibaba Cloud.
🖼️ Tongyi Wanxiang a généré plus de 3,9 milliards d'images et plus de 70 millions de vidéos, soulignant sa capacité à produire du contenu numérique.
4. Baidu lance en open source le modèle Qianfan-VL, soutenu par le chip Kunlun X, pour des avancées nouvelles dans l'IA multimodale
Baidu a lancé officiellement son nouveau modèle de compréhension visuelle Qianfan-VL en open source, comprenant trois versions (3B, 8B et 70B), adaptées à différents scénarios. Ce modèle possède une forte capacité multimodale, en particulier dans les domaines de l'OCR et de l'éducation, et sa formation repose sur le chip Kunlun X P800 développé en interne.
【Résumé par AiBase :】
🧠 Qianfan-VL est un grand modèle multimodal puissant capable de traiter simultanément des informations visuelles et textuelles.
💡 Le chip Kunlun X P800 soutient l'entraînement du modèle, avec une faible consommation d'énergie et une haute efficacité, optimisant ainsi les performances de calcul à grande échelle.
🚀 Les séries Qianfan-VL sont disponibles en open source sur GitHub et Hugging Face, accessibles librement aux développeurs.
Lien supplémentaire : https://github.com/baidubce/Qianfan-VL
5. Microsoft intègre le modèle d'IA d'Anthropic, élargissant les fonctionnalités de Copilot Assistant
Microsoft a annoncé l'intégration du modèle d'IA d'Anthropic dans Copilot Assistant, marquant une nouvelle étape dans sa stratégie de diversification dans le domaine de l'intelligence artificielle générative. Bien que ses collaborations avec OpenAI restent étroites, Microsoft commence à intégrer les technologies d'Anthropic pour répondre aux besoins des clients commerciaux. Les utilisateurs professionnels peuvent désormais utiliser les modèles d'Anthropic pour créer des agents d'IA, et ces modèles fonctionneront sur Amazon et Google Cloud.
【Résumé par AiBase :】
🤖 Microsoft intègre le modèle d'IA d'Anthropic dans Copilot Assistant, favorisant la diversification du produit.
🔄 Même si les relations entre Microsoft et OpenAI restent étroites, Microsoft utilise progressivement les technologies d'Anthropic.
🚀 Les utilisateurs professionnels peuvent choisir les modèles d'Anthropic pour créer des agents d'IA, mais doivent être activés par un administrateur pour les utiliser.
6. OpenAI construit cinq nouveaux centres de données aux États-Unis, accélérant le développement du projet Stargate
OpenAI a annoncé la construction de cinq nouveaux centres de données aux États-Unis afin d'améliorer la capacité de calcul du projet Stargate. Ce projet, initié par plusieurs entreprises, a reçu un financement total de 50 milliards de dollars, visant à promouvoir le développement de l'intelligence artificielle générative.
【Résumé par AiBase :】
🌐 OpenAI construit cinq nouveaux centres de données aux États-Unis, et la capacité de calcul globale du projet Stargate atteindra près de 7 GW.
💼 Oracle assurera la construction de trois nouveaux centres de données, tandis que le centre de données d'Abilene sera agrandi et ajoutera une capacité de calcul de 600 MW.
🚀 OpenAI prévoit d'ajouter 1 GW d'infrastructure d'intelligence artificielle par semaine à l'avenir, afin de pousser davantage le développement des technologies de l'IA.
7. NVIDIA ouvre en open source le modèle Audio2Face, l'IA aidant à la génération de animations faciales en temps réel
NVIDIA a ouvert en open source son modèle d'animation faciale générative Audio2Face, proposant un SDK et un cadre d'entraînement, supportant le traitement hors ligne et en temps réel, adapté à de nombreux domaines tels que les jeux vidéo et le cinéma. Cette technologie a été adoptée par plusieurs studios de jeux vidéo, améliorant ainsi le réalisme et l'immersion des personnages.
【Résumé par AiBase :】
🔊 NVIDIA ouvre en open source le modèle Audio2Face, améliorant ainsi la technologie de génération d'animations faciales virtuelles.
🎮 Il prend en charge le traitement hors ligne et le streaming en temps réel, adapté à plusieurs scénarios.
🌟 Déjà adopté par plusieurs studios de jeux vidéo, il simplifie le processus de fabrication et améliore le réalisme des personnages.
Lien supplémentaire : https://build.nvidia.com/nvidia/audio2face-3d
8. Meta publie le modèle d'univers code CWM : un IA de 32B dotée de capacités de simulation en sandbox
Le Code World Model (CWM) publié par Meta est un système d'IA de 32 milliards de paramètres capable de simuler et de prédire le code via un environnement de sandbox, réduisant ainsi les erreurs et améliorant l'efficacité de la débogage. Ce modèle exige des exigences élevées en matière de matériel, nécessitant deux cartes graphiques H100 et la technologie RDMA.
【Résumé par AiBase :】
🧠 Le CWM effectue une simulation en sandbox avant de générer du code, prédit les conséquences de l'exécution du code.
🔍 Il localise rapidement les erreurs de code, améliorant ainsi l'efficacité de la débogage.
🚨 Il alerte sur les risques potentiels avant d'exécuter les commandes, renforçant ainsi la sécurité.
Lien supplémentaire : https://github.com/facebookresearch/cwm