Bienvenue à la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en mettant l'accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits IA.

Nouveaux produits IA Cliquez pour en savoir plus : https://top.aibase.com/

1. Tencent HunYuan lance 5 modèles 3D open source : génération en 30 secondes, compatible avec plusieurs plateformes

Tencent HunYuan a annoncé le lancement de cinq nouveaux modèles de génération 3D open source, basés sur Hunyuan3D-2.0, offrant une vitesse de génération plus rapide et des détails plus riches. La série de modèles Turbo utilise le framework FlashVDM pour accélérer la génération, la réduisant à 30 secondes. Le moteur de création 3D IA amélioré prend en charge les entrées multivues, permettant aux utilisateurs de générer rapidement des modèles 3D de haute qualité en téléchargeant quelques images, réduisant ainsi les coûts de production. Les nouveaux modèles sont largement utilisés dans la création de contenu généré par les utilisateurs (UGC), la synthèse de contenu produit et la génération d'actifs de jeu, répondant aux normes des actifs 3D de jeu.

image.png

【Résumé AiBase :】

⚡ La série de modèles Turbo utilise le framework FlashVDM pour une accélération de plusieurs dizaines de fois, réduisant le temps de génération à 30 secondes.

🖼️ Le modèle Hunyuan3D-2-MV permet de mieux capturer les détails et de générer des actifs 3D conformes aux attentes des utilisateurs.

🛠️ Le moteur amélioré prend en charge les entrées multivues, les utilisateurs n'ont besoin que de télécharger 2 à 4 images pour générer rapidement des modèles 3D de haute qualité.

2. Anthropic publie une mise à jour majeure du mécanisme de transfert MCP : adieu les connexions longues, bienvenue au HTTP Streamable plus flexible

Anthropic a apporté une mise à jour majeure au Model Context Protocol (MCP), en introduisant le mode de transfert HTTP Streamable, qui remplace la solution traditionnelle HTTP+SSE. Cette innovation résout les limitations clés du transfert distant MCP, améliorant la flexibilité et la compatibilité. Le nouveau mécanisme permet une communication bidirectionnelle plus efficace entre le client et le serveur, prend en charge l'exécution de serveurs sans état, simplifie le processus de déploiement et améliore l'évolutivité du système.

image.png

【Résumé AiBase :】

🚀 Suppression du point de terminaison /sse dédié, tous les messages sont transmis via le point de terminaison /message unifié, simplifiant ainsi le processus de communication.

🔄 Le serveur peut dynamiquement mettre à niveau les requêtes HTTP en flux SSE, prenant en charge une communication bidirectionnelle flexible et résolvant la limitation unidirectionnelle de SSE.

🌐 La compatibilité du nouveau schéma est considérablement améliorée, il est adapté à diverses infrastructures réseau, prend en charge le mode sans état et réduit la consommation de ressources.

Lien détaillé : https://github.com/modelcontextprotocol/specification/pull/206

3. Shengshu Technology Vidu va créer la première série animée de science-fiction originale en IA à l'étranger

Shengshu Technology Co., Ltd. et Aura Productions ont conclu un partenariat stratégique pour lancer la première série animée de science-fiction originale en IA à l'étranger. Ce partenariat marque l'utilisation de la technologie IA dans la production d'animation, ouvrant un nouveau chapitre pour l'industrie de l'animation. Les deux parties produiront conjointement une série d'animation de science-fiction en 50 épisodes courts, utilisant la technologie de génération vidéo avancée de Vidu pour améliorer l'efficacité et la qualité de la production, ce qui laisse présager une création d'animation plus intelligente et plus efficace à l'avenir.

image.png

【Résumé AiBase :】

🚀 Collaboration pour le lancement d'une série d'animation de science-fiction en 50 épisodes courts, prévue pour être diffusée sur les principales plateformes de médias sociaux mondiaux.

🤖 La fonction de cohérence multi-agents de Vidu garantit une fusion transparente des personnages et des scènes, permettant une narration animée de haute qualité.

⏱️ La version 2.0 de Vidu améliore considérablement l'efficacité de la génération vidéo, permettant de générer rapidement des vidéos de haute qualité en 10 secondes.

4. Google Cloud lance le modèle vocal haute définition Chirp 3, prenant en charge 248 voix

Google Cloud a lancé le modèle vocal haute définition Chirp 3 au siège de DeepMind à Londres, afin de fournir aux développeurs un outil puissant de synthèse vocale. Ce modèle prend en charge 248 voix différentes et 31 langues, permettant aux développeurs de créer des applications telles que des assistants vocaux intelligents, des livres audio et le doublage vidéo. Pour garantir une utilisation responsable, Google limite l'accès à la fonction de clonage vocal et réitère son engagement en matière de confidentialité des données.

image.png

【Résumé AiBase :】

🌟 Google Cloud lance le modèle vocal Chirp 3, prenant en charge 248 voix et 31 langues, aidant les développeurs à créer des applications intelligentes.

🔒 Google limite l'accès à la fonction de clonage vocal pour garantir une pratique éthique de l'IA et prévenir les abus.

💼 Google lance un programme pour améliorer les compétences en IA au Royaume-Uni et fournir un soutien en matière d'infrastructure cloud aux startups, afin de promouvoir l'innovation.

Lien détaillé : https://cloud.google.com/text-to-speech/docs/chirp3-hd

5. xAI de Musk acquiert la startup de génération vidéo Hotshot, la concurrence dans le domaine de la vidéo IA s'intensifie

L'acquisition de la startup de génération vidéo IA Hotshot par xAI, la société d'Elon Musk, marque une nouvelle expansion dans le domaine des technologies IA multimodales. Hotshot, grâce à ses avantages technologiques uniques et à sa puissance de calcul, vise à améliorer les capacités de génération vidéo.

image.png

【Résumé AiBase :】

🤖 Hotshot se concentre sur la génération vidéo IA, utilisant 6 millions de clips vidéo pour l'entraînement, améliorant ainsi la capacité du modèle à comprendre le contenu vidéo.

⚙️ Après l'acquisition, Hotshot continuera à développer son générateur vidéo, en utilisant la puissance de calcul du supercalculateur Colossus de xAI.

💼 Cette acquisition marque une nouvelle étape dans le déploiement de Musk dans le domaine des technologies IA, ce qui laisse présager une nouvelle percée dans la technologie de génération vidéo IA.

6. Roblox open source Cube3D : premier modèle IA de base permettant de générer des objets 3D

Roblox a récemment lancé et open sourcé Cube3D, son premier modèle IA de base pour la génération d'objets 3D, visant à améliorer l'efficacité de la création 3D. Grâce à une méthode d'entraînement innovante, le modèle marque les objets 3D et peut générer rapidement des formes 3D complètes. À l'avenir, Cube3D deviendra un modèle multimodal, prenant en charge plusieurs types d'entrées, notamment le texte, les images et les vidéos, renforçant ainsi son intégration avec les outils de création IA existants de Roblox.

image.png

【Résumé AiBase :】

🛠️ Cube3D est le premier modèle IA de génération d'objets 3D open source de Roblox, visant à améliorer l'efficacité de création des développeurs.

🔍 Grâce à une méthode d'entraînement innovante, le modèle peut marquer les objets 3D et prédire la forme suivante, construisant rapidement des objets 3D complets.

🌐 Roblox prévoit de faire de Cube3D un modèle multimodal, qui prendra en charge à l'avenir les entrées texte, image et vidéo, améliorant ainsi les fonctionnalités des outils de création.

7. Amélioration des fonctionnalités de l'assistant IA Zoom AI Companion

Zoom a récemment annoncé une nouvelle série d'améliorations pour son assistant IA Zoom AI Companion, marquant l'évolution de cet outil visant à améliorer l'expérience interactive des utilisateurs lors des visioconférences et leur efficacité au travail. Les nouvelles fonctionnalités incluent Zoom Tasks, qui identifie et effectue automatiquement les tâches à faire, un nouvel enregistreur vocal qui transcrit les conversations hors ligne, et un assistant IA personnalisable, qui devraient améliorer considérablement la productivité et la collaboration des utilisateurs.image.png

【Résumé AiBase :】

🌟 La fonction Zoom Tasks peut identifier automatiquement les tâches à faire lors des réunions et effectuer les tâches correspondantes.

🗣️ Le nouvel enregistreur vocal peut transcrire les conversations hors ligne et fournir des notes de réunion en temps réel.

📅 La fonction d'assistant IA personnalisé sera lancée en avril, les utilisateurs pourront personnaliser les fonctions en fonction de leurs besoins.

8. Mémoire ultralongue de 128 K ! Le dernier modèle open source de Mistral, Mistral Small 3.1, fait son apparition, surpassant GPT-4o Mini en termes de paramètres

Mistral AI a publié le modèle open source Mistral Small 3.1, avec une conception de 24 milliards de paramètres, dont les performances sont comparables à celles des produits Google et OpenAI. Ce modèle présente une amélioration significative du traitement du texte et de la compréhension multimodale, prenant en charge une fenêtre contextuelle de 128 k jetons et une vitesse de traitement de 150 jetons par seconde.

image.png

【Résumé AiBase :】

🌟 Mistral Small 3.1 possède 24 milliards de paramètres, des performances comparables à celles des produits similaires de Google et OpenAI, stimulant la concurrence sur le marché de l'IA.

📈 Ce modèle prend en charge une fenêtre contextuelle de 128 k jetons, avec une vitesse de traitement allant jusqu'à 150 jetons par seconde, adapté aux longs documents et aux scénarios de réponse rapide.

🌍 Mistral adopte une stratégie open source, publiant une licence Apache 2.0, soulignant la souveraineté numérique européenne et attirant des développeurs du monde entier pour participer à l'innovation.

Lien détaillé : https://top.aibase.com/tool/mistral-small-3-1

9. Qui a dit que la vidéo devait être « en un seul plan » ? La technologie innovante de ByteDance, LCT, permet à l'IA de réaliser des films comme un réalisateur !

L'apparition de la technologie d'ajustement du contexte long (LCT) a considérablement amélioré la capacité narrative de la génération vidéo par IA, lui permettant de changer de plan librement comme un réalisateur de cinéma et de construire des scènes narratives plus cohérentes. Grâce à l'introduction d'un mécanisme d'attention complet, d'intégrations de position 3D entrelacées et d'une stratégie de bruit asynchrone, LCT résout les problèmes de cohérence visuelle et de dynamique temporelle dans la génération multi-plans.

image.png

【Résumé AiBase :】

🎥 La technologie LCT permet aux modèles de génération vidéo IA de réaliser des vidéos narratives multi-plans, améliorant ainsi leurs capacités narratives.

🔍 Grâce au mécanisme d'attention complet et aux intégrations de position 3D entrelacées, LCT garantit la cohérence visuelle et la dynamique temporelle.

🚀 LCT prend en charge l'extension de plans autorégressive, facilitant la création de longues vidéos et les modifications interactives.

Lien détaillé : https://top.aibase.com/tool/zhangshangxiawentiaoyoulct

10. 32 B de paramètres « la revanche » ! OLMo 2 32B fait son apparition, défiant GPT-3.5 Turbo

OLMo 2 32B est le dernier grand modèle linguistique publié par l'Allen Institute for Artificial Intelligence, qui, avec ses 32 milliards de paramètres et ses caractéristiques entièrement open source, défie de nombreux modèles propriétaires. Grâce à un processus d'entraînement précis, OLMo 2 32B a surpassé GPT-3.5 Turbo et GPT-4o mini dans plusieurs tests de référence, démontrant des performances exceptionnelles et une efficacité d'entraînement accrue.

image.png

【Résumé AiBase :】

🌐 OLMo 2 32B est un modèle linguistique entièrement open source, qui publie toutes les données, le code et le processus d'entraînement, favorisant la collaboration de recherche mondiale.

📈 Ce modèle possède 32 milliards de paramètres et a surpassé GPT-3.5 Turbo dans plusieurs tests de référence, démontrant la puissance des modèles open source.

⚡ OLMo 2 32B présente une efficacité d'entraînement exceptionnelle, n'utilisant qu'un tiers des ressources de calcul, démontrant le potentiel de développement IA efficace.

Lien détaillé : https://github.com/allenai/OLMo-core