Bienvenue dans l'émission « Journal de l'IA » ! C'est votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les sujets d'actualité dans le domaine de l'IA, en mettant l'accent sur les développeurs, afin que vous puissiez comprendre les tendances technologiques et découvrir les applications innovantes des produits d'IA.

Produits d'IA nouveaux Cliquez ici pour en savoir plus : https://top.aibase.com/

1. Kuaishou Keling 2.1 lance une nouvelle fonction de première et dernière image

Le modèle Kuaishou Keling 2.1 a lancé une nouvelle fonction de première et dernière image, améliorant significativement la qualité et la fluidité de la génération vidéo, tout en optimisant les transitions et la réponse au texte. Ce modèle offre des améliorations notables en termes de performance dynamique, de compréhension sémantique et d'efficacité de génération, et est adapté à divers scénarios professionnels de création vidéo.

image.png

【Résumé par AiBase :】

🎥 Keling 2.1 ajoute une fonction de première et dernière image, offrant un contrôle précis sur le début et la fin de la vidéo.

💡 Prise en charge des images de première et dernière image personnalisées, résolvant ainsi le problème des transitions abruptes, idéal pour la création professionnelle de vidéos.

⚡ La vitesse de génération et le coût ont diminué, augmentant l'efficacité d'utilisation des créateurs.

2. Kunlun Wanzhi lance le modèle d'IA Mureka V7.5 et le modèle vocal MoE-TTS

Le groupe Kunlun Wanzhi a lancé le modèle Mureka V7.5 le 15 août 2025, marquant la conclusion réussie de la semaine de technologie SkyWork AI. Ce modèle se distingue particulièrement dans la création de chansons en chinois, optimisant la réalisme et la profondeur émotionnelle des voix humaines, et combinant le cadre de synthèse vocale MoE-TTS pour améliorer la nature et la contrôlabilité de la synthèse vocale.

image.png

【Résumé par AiBase :】

🎧 Mureka V7.5 montre des capacités exceptionnelles dans la création de chansons en chinois, notamment une amélioration du timbre, des techniques d'exécution, de la prononciation et de l'expression émotionnelle.

🎤 MoE-TTS permet de contrôler avec précision les caractéristiques et le style de la voix à l'aide de descriptions en langage naturel, résolvant ainsi le problème des sons générés qui s'écartent des attentes.

🌐 Kunlun Wanzhi démontre sa forte capacité dans le domaine de la création musicale et de la synthèse vocale, offrant de nouvelles perspectives pour la recherche et le développement dans ces domaines.

3. Tencent Cloud lance l'outil de développement AI CloudBase AI CLI, réduisant de 80 % la quantité de code

Tencent Cloud a lancé CloudBase AI CLI, un outil de ligne de commande IA intégré profondément à la plateforme de développement cloud, visant à offrir aux développeurs une expérience de développement plus efficace et pratique. Cet outil, via une entrée unique de ligne de commande, prend en charge plusieurs outils de programmation IA, améliorant significativement l'efficacité du développement et couvrant l'ensemble du processus, de la génération de code à la mise en production.

image.png

【Résumé par AiBase :】

🔥 CloudBase AI CLI propose une entrée unique de ligne de commande, simplifiant le processus de développement.

🌐 Supporte la compatibilité multiplateforme et la collaboration entre modèles, répondant aux besoins de différents scénarios de développement.

💡 Fournit un quota d'essai gratuit, réduisant la barrière d'accès et augmentant le rapport qualité-prix de l'IA.

Lien pour plus d'informations : https://static.cloudbase.net/cli/install/install.sh -fsS | bash

4. Nouveau produit à l'étranger MuleRun devient populaire ! Chaque utilisateur dispose d'une machine virtuelle personnelle, l'Agent IA joue automatiquement et crée des modèles

MuleRun, un produit d'IA innovant, apporte une expérience intelligente inédite aux utilisateurs grâce à son mécanisme de machine virtuelle unique et à son écosystème d'Agent piloté par la communauté, illustrant ainsi le potentiel d'application large de l'Agent IA dans plusieurs domaines.

image.png

【Résumé par AiBase :】

🎮 L'Agent IA de MuleRun peut accomplir automatiquement les tâches de jeu, améliorant considérablement l'expérience utilisateur.

💻 MuleRun fournit un environnement de machine virtuelle personnel aux utilisateurs, supportant l'exécution de nombreux logiciels et applications.

🌐 L'écosystème d'Agent piloté par la communauté permet aux utilisateurs ordinaires d'utiliser facilement des outils d'automatisation, réduisant ainsi la barrière technique.

Lien pour plus d'informations : https://discord.com/invite/kKAAEYay5F

5. Meta ouvre librement DINOv3 ! Un outil de reconnaissance visuelle d'IA sans annotation humaine, redéfinissant l'avenir de la reconnaissance d'images

Meta AI a ouvert librement le modèle DINOv3, un nouveau modèle de reconnaissance d'images universel, basé sur l'apprentissage non supervisé, capable d'atteindre des performances excellentes sans annotation humaine, ce qui est considéré comme une nouvelle étape majeure dans la technologie de vision par ordinateur. DINOv3 excelle dans l'extraction de caractéristiques à haute résolution et dans l'adaptabilité à plusieurs tâches, et est applicable à plusieurs domaines tels que le suivi environnemental, la médecine et la conduite autonome, en abaissant les barrières de développement grâce à l'ouverture.

image.png

【Résumé par AiBase :】

🧠 Apprentissage non supervisé : pas besoin d'annotations humaines, extrait automatiquement les caractéristiques à partir d'images non annotées.

🖼️ Extraction de caractéristiques à haute résolution : capte à la fois les informations globales et les détails locaux, soutient plusieurs tâches visuelles.

🚀 Applications multiples : applicables à des domaines transversaux tels que le suivi environnemental, la médecine et la conduite autonome.

Lien pour plus d'informations : https://github.com/facebookresearch/dinov3

6. Star du gala du Nouvel An chinois remporte à nouveau la victoire ! Yu Shu H1 remporte la première médaille d'or de 1500 mètres pour les robots humanoïdes

Le robot humanoïde H1 de Yu Shu Technology a remporté la première médaille d'or de 1500 mètres dans la première compétition mondiale centrée sur les robots humanoïdes, démontrant ses performances supérieures en termes de vitesse et de résistance.

image.png

【Résumé par AiBase :】

🏃‍♂️ Le robot humanoïde H1 de Yu Shu Technology a remporté la première médaille d'or de 1500 mètres dans la première compétition mondiale centrée sur les robots humanoïdes.

🏆 Cette compétition a rassemblé 280 équipes provenant de 16 pays, plus de 500 robots humanoïdes, démontrant le niveau le plus avancé de l'industrie.

🤖 H1 a été optimisé sur le logiciel pour la course en vitesse et en endurance, montrant une percée dans la vitesse et la résistance extrêmes.

7. Google Gemini connaît une mise à jour majeure ! Ajout de la fonction de mémoire et du mode de conversation privé

Google a introduit deux nouvelles fonctions pour l'assistant AI Gemini — la fonction de mémoire et le mode de conversation temporaire, marquant ainsi une importante avancée dans le service personnalisé et la protection de la vie privée des assistants AI. La fonction de mémoire apprend continuellement les informations des utilisateurs pour fournir un service plus précis ; tandis que le mode de conversation temporaire garantit que les contenus de conversation ne sont pas stockés, protégeant ainsi la vie privée des utilisateurs.

image.png

【Résumé par AiBase :】

🧠 La fonction de mémoire enregistre les préférences et les habitudes des utilisateurs pour améliorer l'expérience de service personnalisé.

🔒 Le mode de conversation temporaire protège la vie privée en ne stockant pas les conversations.

💡 Ces deux fonctions illustrent un double progrès des assistants AI en matière de personnalisation et de protection de la vie privée.

8. Université de Hong Kong collabore avec le projet open source OpenCUA pour créer un assistant intelligent personnalisé pour l'ordinateur !

L'Université de Hong Kong a collaboré avec plusieurs institutions pour ouvrir le framework OpenCUA, visant à aider les développeurs à construire des agents d'utilisation informatique personnalisés (CUA), améliorant ainsi l'efficacité de travail des utilisateurs. Ce framework fournit des données abondantes et des outils puissants, démontrant son potentiel dans le développement d'assistants intelligents.

image.png

【Résumé par AiBase :】

🧠 Le framework OpenCUA propose une infrastructure d'annotation sans couture pour capturer les démonstrations d'actions humaines sur l'ordinateur.

📊 Intègre le jeu de données AgentNet, couvrant plus de 200 applications et sites web, supporte plusieurs systèmes d'exploitation.

🚀 Supporte des workflows extensibles, convertissant les démonstrations en paires "état-action", améliorant ainsi la capacité de raisonnement longue distance.

Lien pour plus d'informations : https://opencua.xlang.ai/

9. OpenAI pourrait intégrer des publicités dans ChatGPT, le responsable affirme que « rester flexible est important »

OpenAI explore des moyens d'augmenter ses revenus, y compris l'intégration de publicités dans ChatGPT. Bien que le responsable Nick Turley ait dit que les publicités doivent être traitées avec soin pour éviter d'affecter l'expérience utilisateur, l'entreprise envisage toujours d'utiliser le modèle publicitaire dans d'autres produits. En même temps, le modèle d'abonnement présente encore un grand potentiel de croissance.

image.png

【Résumé par AiBase :】

📌 OpenAI envisage d'intégrer des publicités dans ChatGPT, mais doit les gérer avec soin pour assurer l'expérience utilisateur.

💡 Le responsable pense que le modèle d'abonnement présente encore un grand potentiel de croissance, et qu'il existe de nombreuses opportunités non exploitées.

📈 OpenAI prévoit que les revenus d'abonnement atteindront 12,7 milliards de dollars en 2024, mais il faudra jusqu'en 2029 pour obtenir un flux de trésorerie positif.

10. Google publie un modèle d'IA open source ultra petit et efficace Gemma 3 270M, pouvant fonctionner sur smartphone

DeepMind de Google a publié le modèle d'IA open source Gemma3270M, comprenant 270 millions de paramètres, petit et efficace, pouvant fonctionner hors ligne sur des appareils légers tels que les smartphones et les Raspberry Pi. Il se distingue particulièrement dans les tâches de suivi d'instructions et possède une capacité rapide de fine-tuning, adapté aux scénarios d'entreprise et créatifs.

image.png

【Résumé par AiBase :】

🧠 Gemma3270M est un modèle d'IA open source avec 270 millions de paramètres, adapté pour fonctionner sur smartphone.

⚡ Il se distingue dans les tâches de suivi d'instructions, les tests internes ont montré qu'il consomme seulement 0,75 % de la batterie, une grande efficacité énergétique.

📱 Supporte un fine-tuning rapide, adapté aux applications commerciales et créatives, satisfaisant divers besoins.

Lien pour plus d'informations : https://developers.googleblog.com/en/introducing-gemma-3-270m/