Bienvenue dans la section 【Journal de l'IA】 ! C'est ici que vous pouvez explorer chaque jour le monde fascinant de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine IA, avec un accent particulier sur les développeurs, afin de vous aider à comprendre les tendances technologiques et à découvrir les applications innovantes d'IA.
Produits d'IA frais, cliquez pour en savoir plus : https://top.aibase.com/
1. Alibaba ouvre Alchemy Wan2.1-VACE, prétendant être le premier modèle uni d'édition vidéo open source
Alchemy Wan2.1 a annoncé l'ouverture de VACE, prenant en charge plusieurs résolutions et tâches, offrant une expérience de création vidéo tout-en-un et réalisant une édition vidéo efficace et flexible grâce à un mécanisme d'entrée multimodale.
【Résumé AiBase:】
✨ Prend en charge la génération de vidéos à partir de texte, la génération d'images par référence, l'édition locale et l'extension de vidéos, augmentant ainsi l'efficacité de la création.
🌟 Capacité puissante de retouche contrôlée, basée sur le contrôle du mouvement des poses humaines et des flux lumineux, prenant en charge les références de sujets et d'arrière-plan.
🔧 Introduction de l'unité de conditionnement vidéo (VCU), unifiée pour l'entrée multimodale, permettant la combinaison libre et l'édition flexible de plusieurs tâches.
Lien détaillé : https://github.com/Wan-Video/Wan2.1
2. OpenAI met à niveau ChatGPT : GPT-4.1 introduit avec des capacités de codage exceptionnelles
OpenAI a publié GPT-4.1 et sa version allégée, GPT-4.1 mini, qui améliore significativement les capacités de codage et l'expérience d'exécution des instructions, tout en optimisant l'expérience utilisateur et le soutien multimodal, consolidant ainsi son leadership dans le domaine de l'IA.
【Résumé AiBase:】
🚀 GPT-4.1 possède des capacités de codage puissantes, plus efficaces pour traiter des besoins complexes de programmation, avec une vitesse de fonctionnement plus rapide, idéal pour les développeurs et les scénarios de traitement d'instructions.
🌐 GPT-4.1 mini est léger et performant, capable de fonctionner en douceur même sur des appareils à ressources limitées, offrant des canaux d'accès largement disponibles aux utilisateurs gratuits et payants.
🌟 ChatGPT ajoute plusieurs fonctionnalités comme la copie prolongée, la copie de tableaux et la transmission en flux, améliorant sensiblement l'expérience utilisateur.
3. Stability AI lance un modèle de conversion texte-voix de 341 millions de paramètres, exécutable sur téléphone portable, générant seulement 8 secondes d'audio !
Stability AI a publié un modèle appelé « Accelerated Rapid Audio Generation via Adversarial Post-Training », un modèle léger de conversion texte-voix avec seulement 341 millions de paramètres. Ce modèle peut générer 12 secondes d'audio en 75 millisecondes sur une carte graphique H100 et accomplir la même tâche en 7 secondes sur le CPU d'un téléphone, offrant des performances exceptionnelles et une diversité impressionnante.
【Résumé AiBase:】
⚡️ Méthode ARC de post-entraînement sans distillation, améliorant la vitesse et la qualité de la génération du modèle.
📱 Conception allégée, compatible avec l'exécution locale sur téléphone, offrant une meilleure expérience de création mobile.
💫 Fonction de transformation audio-audio, permettant la migration de style et stimulant davantage d'inspiration créative.
Lien détaillé : https://arxiv.org/pdf/2505.08175
4. Poe rapporte : les modèles de vidéo générés par Keeling représentent environ 30 % des parts de marché, surpassant Runway
Un rapport récent sur les tendances d'utilisation des modèles d'IA au printemps 2025 montre que les modèles de génération vidéo Keeling de Kuaishou en Chine se distinguent particulièrement dans le domaine de la génération vidéo à partir de texte, avec une part de marché atteignant 30 %. Parmi eux, le modèle Keeling 2.0 a atteint 21 % de la part de marché en seulement trois semaines depuis son lancement en juin dernier. Depuis sa sortie, plus de 22 millions d'utilisateurs mondiaux ont été enregistrés, avec une augmentation de 25 fois du nombre d'utilisateurs actifs mensuels, générant un nombre important de vidéos et d'images.
【Résumé AiBase:】
🌟 Keeling représente 30 % des parts de marché dans le domaine de la génération vidéo à partir de texte, surpassant les concurrents comme Runway.
📈 Le modèle Keeling 2.0 a atteint 21 % du marché de la génération vidéo en seulement trois semaines après son lancement en avril.
👥 Keeling AI compte plus de 22 millions d'utilisateurs globaux, avec une augmentation de 25 fois du nombre d'utilisateurs actifs mensuels, générant un grand nombre de vidéos et d'images.
5. L'équipe de recherche d'intelligence artificielle de Microsoft WizardLM intègre Tencent, intégrée dans le système de modèle hybride Hunyuan
L'équipe de recherche d'intelligence artificielle de Microsoft, WizardLM, s'est entièrement intégrée à l'équipe « Hunyuan » de Tencent Lab, marquant une nouvelle étape dans l'effort de Tencent dans le domaine des modèles hybrides. Cette équipe apporte non seulement des avancées techniques, mais montre également ses compétences via des modèles open source.
【Résumé AiBase:】
✨ L’équipe précédemment chez Microsoft, WizardLM, a intégré entièrement l’équipe Hunyuan de Tencent, renforçant la compétitivité de Tencent dans le domaine des modèles hybrides.
🚀 Le modèle Hunyuan-TurboS0416 utilise pour la première fois le nom « Hunyuan », symbolisant l'intégration complète de l'équipe et de Tencent.
💼 Tencent prévoit d'augmenter considérablement ses investissements dans l'IA, visant une position dominante dans la compétition mondiale de l'IA.
6. Tencent annonce la sortie prochaine de Hunyuan Image 2.0 le 16 mai
L'équipe de modèles hybrides Hunyuan de Tencent a annoncé que Hunyuan Image 2.0 sera lancé le 16 mai. Cela marque une percée importante de Tencent dans le domaine de la vision par ordinateur, avec l'idée centrale de « plus intelligent, plus ouvert, plus chinois ».
【Résumé AiBase:】
🌟 Hunyuan Image 2.0 sera lancé le 16 mai, marquant une autre avancée majeure de Tencent dans le domaine de la vision par ordinateur.
🌐 Les nouveaux outils mettent l'accent sur « plus intelligent, plus ouvert, plus chinois », aidant les créateurs et les entreprises à entrer dans une nouvelle ère de production visuelle impulsée par l'IA.
🚀 Après l'upgrade du modèle hybride Hunyuan l'an dernier, Tencent montre à nouveau son innovation continue dans le domaine de l'intelligence artificielle.
7. Shanghai lance une alliance écologique d'étiquetage IA, avec Xiaohongshu et MiniMax en tant que premiers membres
Cet article présente l'alliance écologique d'étiquetage IA fondée à Shanghai. L'alliance vise à promouvoir le développement des technologies d'étiquetage IA, à améliorer la transparence et la sécurité du contenu généré, et à poser les bases d’un environnement IA fiable via l'interprétation des politiques et la coopération d'entreprises.
【Résumé AiBase:】
🌟 L’alliance, guidée par le bureau de la cybersécurité de la municipalité de Shanghai, réunit plusieurs entreprises notables avec l'objectif d'améliorer la transparence et la sécurité du contenu IA.
🔍 Le centre national d'urgence Internet et l'institut de normalisation électronique chinois interprètent les politiques, soulignant la combinaison de règles internationales et de caractéristiques chinoises.
🤝 Xiaohongshu, MiniMax et autres entreprises participent aux pratiques d'étiquetage, explorant des solutions d'étiquetage pour divers types de contenu et accumulent de l'expérience de gouvernance.
8. Lightricks publie le modèle raffiné LTX-Video-13B ! En 10 secondes, génère une vidéo AI haute définition, une double percée en vitesse et en qualité !
Le modèle open source de génération vidéo IA LTX-Video-13B raffiné, publié par la société technologique israélienne Lightricks, repose sur 13 milliards de paramètres. En combinant des techniques de rendu multi-échelle et des optimisations efficaces de quantification, il accélère la génération de vidéos à moins de 10 secondes tout en maintenant une sortie de haute qualité.
【Résumé AiBase:】
🚀 Utilise la technique de rendu multi-échelle, générant une vidéo haute définition en moins de 10 secondes, une vitesse améliorée de plus de cinq fois.
🌍 Modèle open source, compatible avec les appareils à faible mémoire graphique, réduisant les coûts de production vidéo IA.
🌟 Accélération de 30 fois, comparable aux productions cinématographiques professionnelles, redéfinissant l'écosystème de création de contenu.
Lien détaillé : https://github.com/Lightricks/LTX-Video
9. Google AlphaEvolve lancé ! Gemini auto-évolution IA résout des problèmes mathématiques, optimise les puces et centres de données, avec une vitesse d'entraînement en hausse de 32,5 %
AlphaEvolve, lancé par DeepMind de Google, est un agent de codage IA combinant le modèle linguistique Gemini et des algorithmes évolutifs. Il affiche des capacités puissantes d'auto-optimisation dans divers domaines, y compris la planification des centres de données, la conception des puces, l'entraînement de l'IA et la recherche mathématique.
【Résumé AiBase:】
🌟 Combinaison de Gemini et d'algorithmes évolutifs pour résoudre des problèmes complexes comme l'optimisation des puces et des problèmes mathématiques.
🚀 AlphaEvolve optimise la planification des centres de données, récupérant 0,7 % de la puissance informatique mondiale, économisant des coûts opérationnels.
🔍 Améliore l'efficacité de l'entraînement IA, augmentant de 32,5 % la vitesse d'entraînement du modèle Gemini, démontrant une capacité puissante d'auto-optimisation.
10. La version bêta du plug-in Yuanbao de Tencent est disponible sur Chrome
Le plug-in Yuanbao de Tencent est désormais disponible en version bêta sur la plateforme Chrome, offrant des fonctionnalités comme une barre flottante, une barre latérale constante et une barre d'outils pour le surlignement, augmentant l'efficacité de la navigation web et du traitement de l'information.
【Résumé AiBase:】
✨ La fonction barre flottante permet de traduire et résumer le contenu d'une page web d'un clic, facilitant la traversée des barrières linguistiques et réduisant le temps de lecture.
💬 La barre latérale constante peut répondre efficacement aux questions, supportant des captures d'écran pour poser des questions, augmentant considérablement l'efficacité de l'obtention d'informations.
🔍 La barre d'outils pour le surlignement permet de rechercher ou traduire instantanément du texte sélectionné, facilitant le traitement de l'information.
Lien détaillé : https://yuanbao.tencent.com/download