Bienvenue dans l'émission « Journal de l'IA » ! C'est votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous proposons les actualités les plus pertinentes du domaine de l'IA, en mettant l'accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et découvrir les applications innovantes des produits d'IA.
Produits d'IA frais cliquez ici pour en savoir plus : https://app.aibase.com/zh
1. Tencent lance le modèle 3D Hunyuan 3.0 avec une précision de modélisation trois fois supérieure
Tencent a lancé officiellement le modèle 3D Hunyuan 3.0 lors de la conférence mondiale sur l'écosystème numérique de 2025. La technologie de sculpture par niveaux 3D-DiT a considérablement amélioré la précision de la modélisation. En outre, Tencent a lancé la plateforme Hunyuan 3D Studio et un plan open source pour élargir les frontières de la création 3D.
【Résumé par AiBase :】
🧠 Le modèle 3D Hunyuan 3.0 utilise la technologie de sculpture par niveaux 3D-DiT, améliorant ainsi la précision de la modélisation de trois fois.
🎨 La plateforme Hunyuan 3D Studio fournit des outils professionnels pour la création, augmentant l'efficacité et la qualité de la création artistique 3D.
🚀 Tencent prévoit d'ouvrir le code source du modèle Hunyuan 3D omni, accélérant ainsi l'implémentation de la technologie de génération 3D dans les applications académiques et industrielles.
2. Le plateau de création musicale AI de Kunlun Wanshi Mureka intègre la fonction Agent Studio, rendant la création musicale accessible à tous !
La fonction « Agent Studio » de Mureka permet aux utilisateurs de créer de la musique de manière intuitive. Il suffit d'exprimer simplement une idée, et l'IA génère automatiquement des paroles et de la musique. Cette fonction inclut plusieurs scénarios de création, tels que la production d'albums ou l'écriture de chansons populaires, offrant aux utilisateurs une expérience musicale variée.
【Résumé par AiBase :】
🎧 Mureka lance la fonction « Agent Studio », permettant à tout le monde de créer facilement de la musique.
🤖 Les utilisateurs n'ont qu'à exprimer simplement leurs idées, et l'IA générera des paroles et de la musique complètes.
🎶 Six scénarios de création sont actuellement disponibles, couvrant des fonctions telles que la production d'albums, l'écriture de chansons populaires et l'expression d'émotions.
3. Alibaba Qoder lance un service d'abonnement payant, le mode Pro coûte 20 dollars par mois, aidant au codage autonome par IA
Qoder lance officiellement un plan d'abonnement payant, comprenant les versions Pro et Pro+. Ce service supporte la complétion infinie du code, l'utilisation avancée des modèles, etc., améliorant ainsi l'efficacité du développement. De plus, il optimise le problème de consommation de crédits, améliorant ainsi la capacité de parallélisation des outils d'intelligences artificielles et la précision de la recherche technique.
【Résumé par AiBase :】
🔥 Qoder lance un service d'abonnement payant, soutenant les versions Pro et Pro+, répondant aux besoins des développeurs pour un codage efficace.
💡 La version Pro propose une complétion infinie du code et 2000 crédits, tandis que la version Pro+ offre 6000 crédits et davantage de ressources.
🚀 L'optimisation de la consommation de crédits améliore la capacité de parallélisation des outils d'intelligence artificielle, réduisant ainsi la consommation de tokens.
4. VEED Fabric 1.0 est sorti ! Une image devient une vidéo "parlante"
VEED a lancé Fabric 1.0, un outil révolutionnaire de génération de vidéos par IA capable de produire des vidéos parlantes à partir d'une seule image et d'une entrée vocale. Cet outil se distingue par sa synchronisation labiale, son expression faciale naturelle et sa vitesse de génération, réduisant considérablement les coûts et le temps de production de vidéos, adapté à divers scénarios de création de contenu.
【Résumé par AiBase :】
🖼️ Fabric 1.0 permet de générer des vidéos parlantes à partir d'images statiques, réalisant ainsi un récit dynamique.
⏱️ La vitesse de génération de vidéos est augmentée de 7 fois, les coûts sont réduits de 60 fois, ce qui convient à la production rapide de contenus.
🌐 Intégration de la prise en charge multilingue et de la fonction de sous-titrage automatique, améliorant l'expérience utilisateur mondiale.
Lien détaillé : https://www.veed.io/ai/fabric-1-0
5. OpenAI lance GPT-5-Codex : l'agent de codage IA va radicalement transformer le monde des développeurs
OpenAI a lancé GPT-5-Codex, marquant un grand progrès dans le domaine de l'IA pour le codage d'agents. Son mécanisme de pensée dynamique et sa capacité d'intégration multiplateforme ont considérablement amélioré l'efficacité du développement logiciel.
【Résumé par AiBase :】
🧠 GPT-5-Codex dispose d'un mécanisme de pensée dynamique, capable d'ajuster le temps de traitement selon la complexité de la tâche, améliorant ainsi l'efficacité du codage.
💻 Supporte l'intégration multiplateforme, y compris les extensions IDE, les interfaces Web et les fonctions de revue de code GitHub, renforçant l'écosystème des développeurs.
🚀 Les retours des développeurs montrent que GPT-5-Codex réduit significativement le cycle de développement, améliore la vitesse de génération de code et réduit les commentaires erronés.
Lien détaillé : https://openai.com/index/introducing-upgrades-to-codex/
6. Le cadre de gouvernance de la sécurité de l'intelligence artificielle 2.0 est publié à travers le pays, favorisant la construction d'un écosystème d'IA sécurisé et fiable
Le cadre de gouvernance de la sécurité de l'intelligence artificielle 2.0 a été officiellement publié le 15 septembre 2025, visant à répondre aux nouveaux défis posés par le développement rapide de la technologie de l'IA. Ce cadre, basé sur la version 1.0, a été optimisé en tenant compte des situations pratiques, améliorant ainsi la classification des risques et les mesures de prévention, tout en soulignant l'importance de la coopération mondiale.
【Résumé par AiBase :】
🔐 Le cadre de gouvernance de la sécurité de l'intelligence artificielle 2.0 est officiellement lancé, pour répondre aux nouveaux défis posés par le développement de la technologie de l'IA.
🔍 Le cadre est optimisé sur la base de la version 1.0, améliorant ainsi la classification des risques et les mesures de prévention.
🤝 L'importance de la coopération mondiale est soulignée, favorisant la coopération internationale dans la gouvernance de la sécurité de l'IA.
Lien détaillé : https://www.cac.gov.cn/2025-09/15/c_1759653448369123.htm
7. OpenAI Evals ajoute une fonction d'entrée audio native et d'évaluation
OpenAI a ajouté une fonction d'entrée audio native et d'évaluation à son outil Evals, permettant aux développeurs de charger directement des fichiers audio pour évaluer les performances, ce qui améliore considérablement l'efficacité et la précision du développement des modèles de reconnaissance et de génération vocale.
【Résumé par AiBase :】
🎧 La fonction d'entrée audio native simplifie le processus d'évaluation, améliorant ainsi l'efficacité du développement.
🔍 Aucune transcription en texte n'est nécessaire pour évaluer directement les performances des modèles de reconnaissance et de génération vocale.
💡 Cette nouvelle fonction offre un soutien plus précis pour les assistants vocaux intelligents et la génération de contenus audio.
8. Un changement radical ! Mini-o3, un modèle open source, réalise une réflexion visuelle extrêmement longue, transformant le raisonnement profond en un problème résolu
Mini-o3 est un modèle de raisonnement visuel open source développé par ByteDance en collaboration avec l'Université de Hong Kong. Il peut effectuer des dizaines de tours de raisonnement visuel, améliorant significativement la capacité à traiter des problèmes visuels complexes. Son design principal comprend le jeu de données VisualProbe, le processus de collecte itérative de données et la stratégie de masque de plusieurs tours, offrant une nouvelle direction pour la technologie de raisonnement visuel multi-tours.
【Résumé par AiBase :】
🧠 Mini-o3 réalise une capacité de raisonnement visuel de plusieurs tours, dépassant ainsi la limite précédente de 1 à 2 tours de conversation.
📊 En construisant le jeu de données VisualProbe et le processus de collecte itérative de données, la capacité de raisonnement profond du modèle est améliorée.
🔄 La stratégie de masque de plusieurs tours optimise l'efficacité d'entraînement, permettant au modèle de mieux performer lors des tests.
Lien détaillé : https://arxiv.org/pdf/2509.07969
9. Shanghai AI Lab lance Lumina-DiMOO, ouvrant une nouvelle ère de génération et de compréhension multimodales
Le laboratoire de Shanghai pour l'intelligence artificielle a lancé une nouvelle génération de modèle de génération et de compréhension multimodales, Lumina-DiMOO, en collaboration avec plusieurs universités. Ce modèle utilise une architecture innovante de diffusion discrète complète, intégrant et alignant efficacement des données textuelles, images et audio grâce à la technologie d'apprentissage contrastif, améliorant ainsi significativement la qualité et l'efficacité de la génération, et montrant un potentiel d'application prometteur dans divers scénarios d'application.
【Résumé par AiBase :】
🌟 Lumina-DiMOO est un nouveau modèle de génération multimodal, utilisant une architecture innovante de diffusion discrète complète pour améliorer l'efficacité du traitement des données.
🛠️ Ce modèle utilise la technologie d'apprentissage contrastif pour intégrer et comprendre efficacement des données textuelles, images et autres.
🚀 Lumina-DiMOO se distingue dans la génération et la compréhension d'images, pouvant s'adapter à divers scénarios d'application, montrant un potentiel d'application prometteur.
Lien détaillé : https://github.com/Alpha-VLLM/Lumina-DiMOO
10. Nouvelle mise à niveau de l'art de la peinture IA de Tencent ! La technique de réglage améliore la beauté des images générées de 300%
La technique de réglage introduite par Tencent améliore considérablement la véracité et la note esthétique des images générées par l'IA. Sa méthode innovante inclut « Direct-Align » et « optimisation des préférences sémantiques relatives », résolvant efficacement les problèmes de tricherie dans les récompenses et les limites de réglage hors ligne.
【Résumé par AiBase :】
🧠 La technologie « Direct-Align » réduit les explosions de gradients, améliorant ainsi la capacité d'optimisation du modèle.
🎨 L'« optimisation des préférences sémantiques relatives » (SRPO) permet d'ajuster le style d'image à partir de textes.
📈 Des expériences montrent que les modèles entraînés avec SRPO obtiennent une amélioration significative en termes de véracité et de qualité esthétique.
Lien détaillé : https://arxiv.org/pdf/2509.06942