Journal A : Bilibili met à niveau le modèle de génération de vidéos d'animation AniSora V3 ; ByteDance ouvre le framework de génération de vidéos 4D EX-4D ; le système d'agent AI DeepSWE ouvert source décolle avec succès

Bienvenue dans l'émission « Journal de l'IA » ! C'est votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les sujets d'actualité du domaine de l'IA, en mettant l'accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et découvrir les applications innovantes des produits d'IA.

Produits d'IA récents Cliquez pour en savoir plus :https://top.aibase.com/

1. EX-4D de ByteDance dévoilé en open source : une vidéo monovue devient un film 4D en mouvement

EX-4D est un cadre de génération de vidéos 4D développé par l'équipe PICO-MR de ByteDance, capable de générer des séquences vidéo 4D de haute qualité avec plusieurs points de vue à partir d'une seule vidéo. Cette technologie utilise un maillage clos profond (DW-Mesh) et une architecture légère adaptée, résolvant ainsi les défis liés à la génération multivue des vidéos traditionnelles, tout en offrant des performances supérieures aux méthodes ouvertes existantes.

【Résumé d'AiBase :】
💡 EX-4D utilise un maillage clos profond (DW-Mesh) pour générer efficacement une vidéo monovue en plusieurs points de vue.
🔍 En utilisant des stratégies de masque de rendu et de suivi, il résout le problème de rareté des données multivues.
🚀 Il dépasse largement les méthodes ouvertes existantes en termes d'indicateurs tels que FID, FVD et VBench, offrant des performances exceptionnelles.
Lien détaillé : https://github.com/tau-yihouxiang/EX-4D

2. Modèle de génération de vidéos animées AniSora V3 de Bilibili ouvert en open source, génération d'images vidéo de plusieurs styles en un clic

Bilibili a annoncé une mise à jour majeure du modèle de génération de vidéos animées AniSora V3, qui améliore significativement la qualité de génération, la fluidité des mouvements et la diversité des styles. Cette version repose sur les modèles CogVideoX-5B et Wan2.1-14B, combinés à un cadre d'apprentissage renforcé avec feedback humain (RLHF), permettant de générer des vidéos de plusieurs styles animés, offrant aux créateurs des outils puissants.

【Résumé d'AiBase :】
✨ AniSora V3 optimise l'efficacité des tâches d'animation grâce à un module de masque temporel.
🚀 Il prend en charge plusieurs tâches, notamment la génération de vidéos à partir d'images individuelles, l'interpolation des images clés et la synchronisation labiale.
📦 L'écosystème open source favorise la collaboration communautaire, les développeurs peuvent obtenir le code et les jeux de données via GitHub.
Lien détaillé : https://t.co/I3HPKPvsBV

3. Système AI agent DeepSWE ouvert en open source, basé sur Qwen3-32B

DeepSWE est un système AI agent open source basé sur le modèle Qwen3-32B, entraîné par apprentissage renforcé et ayant obtenu d'excellents résultats sur le test SWE-Bench-Verified. Ce système utilise le cadre rLLM et l'algorithme GRPO++ amélioré, montrant une forte capacité d'apprentissage et un potentiel d'application dans les tâches de génie logiciel.

【Résumé d'AiBase :】
🧠 DeepSWE est basé sur le modèle Qwen3-32B, entièrement entraîné par apprentissage renforcé, et toutes les informations sont publiées en open source.
🏆 Sur le test SWE-Bench-Verified, DeepSWE s'est distingué, atteignant un taux de réussite Pass@1 de 59 %, devenant ainsi l'un des meilleurs agents open source.
💡 Il utilise le cadre rLLM et l'algorithme GRPO++ amélioré, montrant sa forte capacité d'apprentissage et son potentiel d'application dans les tâches pratiques de génie logiciel.
Lien détaillé : https://huggingface.co/agentica-org/DeepSWE-Preview

4. VINCIE-3B, nouveau modèle open source de ByteDance : 300 millions de paramètres, édition d'images continue contextuelle

ByteDance a ouvert le modèle VINCIE-3B, capable d'édition d'images continue contextuelle. Ce modèle a été développé sur la base de l'architecture MM-DiT, capable d'apprendre à partir de vidéos et d'effectuer une édition d'images efficace. Ses points forts techniques incluent l'entraînement piloté par vidéo, le transformateur diffusion causale par blocs et l'entraînement en trois tâches d'agents, ce qui améliore significativement la qualité et l'efficacité de l'édition d'images.

【Résumé d'AiBase :】
🎥 Entraînement piloté par vidéo : VINCIE-3B utilise les cadres continus des vidéos pour extraire automatiquement des descriptions textuelles et des séquences d'images, construisant ainsi des données d'entraînement multimodales.
🧠 Transformateur diffusion causale par blocs : Le modèle utilise une mécanique d'attention causale par blocs, réalisant une attention causale entre les textes et les blocs d'images, tandis que l'intérieur du bloc est une attention bidirectionnelle.
🔄 Entraînement en trois tâches d'agents : L'entraînement se fait à travers trois tâches, à savoir la prédiction de la prochaine image, la prédiction de la segmentation de l'image actuelle et la prédiction de la segmentation de la prochaine image, renforçant ainsi la compréhension du modèle des scènes dynamiques et des relations entre les objets.
Lien détaillé : https://huggingface.co/ByteDance-Seed/VINCIE-3B

5. Stability AI lance Stable Audio Open Small, un outil de création audio pour smartphone

Stability AI a lancé Stable Audio Open Small, un modèle léger de génération audio texte-à-son optimisé pour les appareils mobiles, en collaboration avec Arm. Ce modèle fonctionne localement sur les appareils mobiles, prend en charge le traitement hors ligne, offre une sortie de haute qualité, efficace et à faible latence, et accélère la transition de la technologie de génération audio IA vers le calcul périphérique et les appareils mobiles.

【Résumé d'AiBase :】
📱 Conception légère : Le nombre de paramètres est réduit à 341 M, adapté à l'exécution sur les appareils mobiles.
🔊 Génération audio de haute qualité : Prise en charge de la génération de sons stéréo, sans traitement en nuage.
🌐 Ouverture communautaire : Sous licence communautaire, cela réduit la barrière technologique et encourage les applications créatives.
Lien détaillé : https://huggingface.co/stabilityai/stable-audio-open-small

6. Google lance Gemini for Education ! Un outil gratuit d'IA révolutionne l'éducation mondiale

Google a lancé un kit complet d'outils d'IA intitulé Gemini for Education, basé sur le dernier modèle Gemini2.5Pro et le modèle d'apprentissage LearnLM. Il propose un soutien gratuit, puissant et efficace aux enseignants et étudiants du monde entier. Cet outil couvre 30 fonctions et prend en charge 40 langues, visant à doter les enseignants et les élèves d'une expérience d'apprentissage personnalisée et efficace grâce à la technologie de l'IA.

【Résumé d'AiBase :】
🌍 Éducation mondiale : Supporte 40 langues, couvre 230 pays et régions.
📚 Gratuit : Gratuit pour tous les utilisateurs de Google Workspace for Education, promouvant l'égalité éducative.
🔒 Sécurité et vie privée : Respecte strictement les règles de confidentialité, garantissant la sécurité des données utilisateur.

7. Topview Avatar 2 dévoilé ! La technologie d'avatar d'IA révolutionne le commerce électronique, l'ère des mannequins s'achève ?

Topview Avatar 2 apporte une expérience révolutionnaire aux e-commerçants et créateurs de contenus grâce à ses fonctions innovantes et ses effets réalistes. Sa technologie d'avatar d'IA permet une interaction naturelle entre les produits et les avatars, améliorant considérablement l'efficacité de la production vidéo et la qualité du contenu.

【Résumé d'AiBase :】
🌍 Premier avatar d'IA au monde « portant » des produits, offrant une interaction plus réaliste.
⚙️ Génération d'une vidéo personnalisée en un clic, supportant la synchronisation labiale multilingue, augmentant la flexibilité marketing.
🚀 Révolutionner le mode traditionnel UGC, réduire les barrières de la photographie commerciale, aider les marques à se développer à l'international.
Lien détaillé : https://www.topview.ai/ai-product-avatar

8. Perplexity lance un plan Max : 200 dollars par mois pour un accès illimité à la productivité IA

Perplexity a lancé un plan premium nommé Max, à un prix de 200 dollars par mois ou 2000 dollars par an, destiné aux utilisateurs fréquents et professionnels. Ce plan offre un accès illimité aux Labs, un accès prioritaire aux nouvelles fonctions et un soutien aux modèles les plus récents, marquant une approfondeur supplémentaire de son rôle dans les outils de productivité IA.

【Résumé d'AiBase :】
🧠 Requêtes illimitées aux Labs : répondre aux besoins des utilisateurs professionnels pour des recherches approfondies et des projets complexes.
🚀 Accès prioritaire aux modèles de pointe : assurer aux utilisateurs une position technique avancée.
🔒 Support prioritaire : fournir une infrastructure dédiée et un temps de réponse plus rapide aux clients.

9. Cursor ose recruter ! Le principal responsable de Claude Code rejoint un concurrent

Cursor a embauché deux personnalités clés d'Anthropic, marquant une intensification de la concurrence sur le marché de la programmation IA. Bien qu'Anthropic doive faire face à une perte de talents, son activité reste solide, avec une croissance importante de ses revenus et de sa valeur. Anysphere améliore davantage sa compétitivité produit grâce à ces talents.

【Résumé d'AiBase :】
🧠 Cursor a réussi à attirer des personnalités clés d'Anthropic, renforçant ainsi sa force technologique.
💼 Boris Cherny et Cat Wu rejoignent Anysphere, stimulant l'innovation produit.
📈 L'activité d'Anthropic croît rapidement, ses revenus et sa valeur ont connu une hausse significative.

10. OpenAI affirme : le « jeton OpenAI » lancé par Robinhood n’a rien à voir avec nous

L'article indique que Robinhood a lancé des actions tokenisées d'OpenAI et SpaceX en Europe, mais OpenAI a clairement précisé que ces jetons ne représentaient pas ses actions et qu'il n'avait aucun partenariat avec Robinhood. Bien que Robinhood ait proposé des offres limitées pour attirer les utilisateurs, les utilisateurs américains ne pouvaient pas participer. Cet événement a suscité une vive réaction du marché, faisant bondir le cours de l'action de Robinhood.

【Résumé d'AiBase :】
💰 OpenAI souligne que les « jetons OpenAI » ne sont pas des actions et qu'ils n'ont aucun lien avec Robinhood.
⚠️ Robinhood attire les investisseurs via des actions tokenisées, mais les utilisateurs américains ne peuvent pas participer.
📈 Le cours de l'action de Robinhood a connu une hausse suite à cette annonce, atteignant un nouveau maximum historique.

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

Journal A : Bilibili met à niveau le modèle de génération de vidéos d'animation AniSora V3 ; ByteDance ouvre le framework de génération de vidéos 4D EX-4D ; le système d'agent AI DeepSWE ouvert source décolle avec succès

站长之家

Cet article provient d'AIbase Daily