Information

Latest AI News

Explore AI Frontiers, Master Industry Trends

AI Daily Brief

Your Daily AI Brief - Never Miss What's Next

Tools

Email Subscription

Get the latest AI news, understand why it matters

Information

AI Product Finder

Smart Product Discovery - Comprehensive Market Intelligence

AI Product Rankings

AI Product Power Rankings - Performance, Buzz & Trends

AI Product Submit

Submit Your AI Product - Amplify Reach & Drive Growth

AI App Leaderboard

Discover 2025's Top 100 AI Apps That Are Changing Everything

Tools

AI Tools Directory

Discover The Best AI Websites & Tools

Building and Deploying AI

Tell us your needs, and our AI will find the perfect tools for you

Information

AI Models Finder

Comprehensive AI Models Collection for All Your Development & Research Needs

LLM Leaderboard

AI LLM Power Rankings - Performance, Buzz & Trends

Model Providers

Discover Trusted AI Model Partners - Guaranteed Reliable Support

Submit Your Model

Submit Your Model Info & Services - Precision Marketing & User Targeting

Tools

Compare LLMs

Multi-Dimensional Large Model Comparison - Find Your Perfect Match

LLM Cost Calculator

Calculate AI Model Costs Accurately - Optimize Your Budget

LLM Arena

Multi-Model Real-Time Evaluation & Quick Output Comparison

Information

MCP Servers

Discover Popular AI-MCP Services - Find Your Perfect Match Instantly

MCP Client

Easy MCP Client Integration - Access Powerful AI Capabilities

MCP Case Tutorials

Master MCP Usage - From Beginner to Expert

MCP Ranking

Top MCP Service Performance Rankings - Find Your Best Choice

MCP Service Submission

Publish & Promote Your MCP Services

Tools

MCP Playground

Test MCP Services Freely - Quick Online Experience

MCP Inspector

Quick MCP Service Testing - Fast Deployment

GEO Services

Achieve Dominant Visibility in AI Search for Your Business or Brand with GEO Services

AI Agent Service

Build Your Intelligent Business Core Based on Your Business Requirements

AI Project Deployment

Open-Source AI Project Deployment Platform with Private Cloud Support

Data Cleaning Services

Analyze your business data and provide clean data for machine learning models.

AI Product Overseas Marketing

All-in-One DTC Marketing Solutions for International Expansion

Information

AI Dataset Collection

Large-scale datasets and benchmarks for training, evaluating, and testing models to measure

Tools

Intelligent Document Recognition

Comprehensive Text Extraction and Document Processing Solutions for Users

Information

AI Servers

Global AI Server Resource One-Stop Platform with Comprehensive Real-Time Data & Market Pricing Insights

GPU Rental Marketplace

Global Cloud Computing Power One-Stop Platform - Get Cost-Effective On-Demand GPU Rental Services

Tools

LLM PC Requirements Checker

One-Click PC Configuration Detection with Intelligent Assessment of AI Model Performance & Compatibility

AI Deployment Calculator

Enter Your Large Model Computing Requirements for Instant GPU, Memory & Server Configuration Recommendations

AI Cloud Computing Comparison

Compare AI Computing Pricing, Configurations & Performance Across Global Cloud Providers for Optimal Value Selection

AI Tutorial

Kunlun Wanyi lance officiellement le modèle SkyReels-A3 : des photos qui synchronisent les lèvres avec la voix

AIbase基地

Publié leActualités IA · 6 minutes de lecture · Aug 11, 2025

20.4k

Le groupe Kunlun Wanzhi a annoncé le lancement de son dernier résultat technologique, le modèle SkyReels-A3, un outil de création d'avatar numérique alimenté par le son basé sur le modèle de diffusion vidéo DiT (Diffusion Transformer). Le lancement du modèle SkyReels-A3 marque une avancée majeure dans le domaine de la création de contenus numériques. Il permet la création d'avatars numériques à modèles complets pour n'importe quelle durée, offrant aux utilisateurs une expérience nouvelle.

La fonction principale du modèle SkyReels-A3 est de donner vie à des images ou vidéos statiques en les rendant dynamiques. En téléchargeant une image de visage et une voix correspondante, vous pouvez faire parler ou chanter la personne présente sur l'image selon le contenu de la voix. De plus, le modèle permet également la création de nouveaux contenus vidéo. Les utilisateurs n'ont qu'à fournir une image de visage, une voix et un prompt textuel pour générer une vidéo où la personne interprète selon les exigences. Le modèle SkyReels-A3 peut également modifier les dialogues des vidéos existantes, en ajustant automatiquement les expressions faciales, les mouvements de bouche et les performances, tout en maintenant la cohérence visuelle.

Capture d'écran WeChat_20250811092633.png

Ce modèle a été optimisé et amélioré en termes de saisie de mots-clés textuels, de naturel des interactions, de contrôle des plans et de la durée de sortie des vidéos. Le modèle SkyReels-A3 supporte la sortie de vidéos de 60 secondes en un seul plan, et il permet une sortie de plusieurs plans sans limite de durée, répondant ainsi à divers besoins créatifs. Kunlun Wanzhi a également effectué des optimisations spécifiques pour des scénarios d'application réels tels que les diffusions en direct en ligne, améliorant ainsi la cohérence des vidéos générées et la nature et la clarté des actions interactives spécifiques.

Le lancement du modèle SkyReels-A3 offre non seulement un soutien technique puissant pour des applications commerciales telles que la publicité ou le commerce en direct, mais aussi plus de possibilités pour des créations artistiques telles que des clips musicaux, des extraits de films ou des vidéos de discours. Grâce à l'introduction d'un module de contrôle des plans basé sur la structure ControlNet, Kunlun Wanzhi a réalisé un contrôle précis au niveau de la frame. Huit paramètres courants de contrôle des plans sont prédéfinis, et les utilisateurs peuvent choisir les plans correspondants selon leurs besoins. L'intensité de chaque plan peut être réglée continuellement de 0 à 100 %, générant ainsi des effets de plans professionnels.

Le lancement du modèle SkyReels-A3 prévoit une création de contenus numériques plus efficace et plus facile. Le groupe Kunlun Wanzhi fournit ainsi des solutions techniques d'IA à faible seuil, à coût réduit et à haute fidélité pour des domaines tels que la production de films, les diffusions en direct virtuelles, le développement de jeux et la création de contenus éducatifs. Le lancement du SkyReels-A3 représente la possibilité de transformer le son en image, offrant une efficacité et une commodité sans précédent pour la création de contenus personnalisés et interactifs. Peut-être que la prochaine vidéo virale sera inspirée par votre idée.

Page d'accueil du projet SkyReels-A3 :

https://skyworkai.github.io/skyreels-a3.github.io/

Adresse du site officiel de SkyReels :

https://www.skyreels.ai/home

Adresse des modèles open source de la série SkyReels :

https://huggingface.co/Skywork

SkyReels-A3 DiT Personnagenumériquepilotéparaudio GroupeKunlunWanwei

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

OpenAI pourrait introduire des publicités dans ChatGPT, un responsable dit que la flexibilité est importante

Aug 15, 2025

Kunlun Group ouvre le code de son modèle « Skywork UniPic 2.0 »

Le troisième jour de la conférence SkyWork AI, Kunlun Group a annoncé officiellement le lancement open source de son nouveau modèle « Skywork UniPic 2.0 ». La publication de ce modèle multimodal uni marque une nouvelle avancée majeure dans le domaine de l'intelligence artificielle multimodale. Skywork UniPic 2.0 est un cadre efficace pour l'entraînement et le raisonnement en modélisation multimodale, qui allège les modules de génération et d'édition ainsi que la gestion multi-modale.

Aug 13, 2025

Journal AI : Kunlun Wanshi lance le modèle SkyReels-A3 ; le moteur de recherche Baidu débute officiellement son IA sur l'ordinateur de bureau ; le modèle d'IA Grok 4 est offert gratuitement pour toujours

Aug 11, 2025

Google dit que son chasseur de vulnérabilités d'IA Big Sleep a découvert pour la première fois 20 vulnérabilités de sécurité

Aug 5, 2025

Zhous Hongyi dit que l'IA d'Apple est un échec complet, et maintenant il fait face à un choix crucial

Zhous Hongyi critique sans ménagement la performance d'Apple dans le domaine de l'IA dans son article, affirmant que l'ancien élève brillant de la technologie, Apple, a simplement une « Apple Intelligence » qui est un échec total. Il affirme clairement que, en tant que géant technologique avec une capitalisation boursière de milliers de milliards de dollars, Apple n'a même pas réussi à créer des modèles et produits de base dans la bataille de l'IA, ce qui est comme demander à Einstein de participer à un concours de calcul pour enfants et de perdre, illustrant ainsi clairement la situation embarrassante d'Apple dans la compétition en IA.

Jul 28, 2025

L'assistant Tesla Grok va bientôt disposer de la fonction de réveil vocal Heyk, dit au revoir aux opérations manuelles !

Elon Musk confirme l'ajout de la commande vocale "Hey Grok" pour l'IA Tesla, disponible sur modèles AMD avec abonnement/Wi-Fi. Fonction en développement, bientôt déployée.....

Jul 17, 2025

ByteDance lance une nouvelle technologie d'analyse d'image innovante, XVerse : contrôle indépendant et précis de plusieurs individus

Le 26 juin 2025, ByteDance a officiellement lancé sa dernière technologie de synthèse d'image - XVerse, visant à offrir des solutions de génération d'images avec plusieurs sujets à haute précision. Cette technologie innovante permet aux utilisateurs de contrôler de manière indépendante et précise plusieurs individus, améliorant grandement les capacités de génération personnalisée et de scénarios complexes. Le cœur de XVerse réside dans sa méthode de modulation DiT unique, qui permet de réguler l'identité et les propriétés sémantiques de chaque sujet sans affecter les caractéristiques potentielles globales de l'image. En transformant les images de référence en des caractéristiques spécifiques.

Jul 1, 2025

On dit qu'OpenAI discute d'un financement de 40 milliards de dollars avec des investisseurs d'Arabie saoudite et d'Inde

Jun 12, 2025

Step1X-Edit : Une nouvelle référence en matière d'édition d'images open source, rivalisant avec des modèles propriétaires comme GPT-4o

Apr 27, 2025

Bulletin IA : Kunlun Wanwei open-source SkyReels-V2 ; iFlytek StarFire X1 mise à niveau ; test interne de Coze Space

Bienvenue dans la rubrique 【Bulletin IA】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités du secteur de l'IA, en nous concentrant sur les développeurs, pour vous aider à comprendre les tendances technologiques et les nouvelles applications de produits IA innovants. Découvrez les nouveaux produits IA : https://top.aibase.com/1、Kunlun Wanwei open-source SkyReels-V2 : un modèle de génération de films de durée illimitée L'équipe SkyReels de Kunlun Wanwei a lancé SkyReels-V2, le premier modèle au monde basé sur la diffusion forte...

Apr 21, 2025

Latest AI News

AI Daily Brief

Email Subscription

AI Product Finder

AI Product Rankings

AI Product Submit

AI App Leaderboard

AI Tools Directory

Building and Deploying AI

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Agent Service

AI Project Deployment

Data Cleaning Services

AI Product Overseas Marketing

AI Dataset Collection

Intelligent Document Recognition

AI Servers

GPU Rental Marketplace

LLM PC Requirements Checker

AI Deployment Calculator

AI Cloud Computing Comparison

Kunlun Wanyi lance officiellement le modèle SkyReels-A3 : des photos qui synchronisent les lèvres avec la voix

AIbase基地

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

OpenAI pourrait introduire des publicités dans ChatGPT, un responsable dit que la flexibilité est importante

Kunlun Group ouvre le code de son modèle « Skywork UniPic 2.0 »

Journal AI : Kunlun Wanshi lance le modèle SkyReels-A3 ; le moteur de recherche Baidu débute officiellement son IA sur l'ordinateur de bureau ; le modèle d'IA Grok 4 est offert gratuitement pour toujours

Google dit que son chasseur de vulnérabilités d'IA Big Sleep a découvert pour la première fois 20 vulnérabilités de sécurité

Zhous Hongyi dit que l'IA d'Apple est un échec complet, et maintenant il fait face à un choix crucial

L'assistant Tesla Grok va bientôt disposer de la fonction de réveil vocal Heyk, dit au revoir aux opérations manuelles !

ByteDance lance une nouvelle technologie d'analyse d'image innovante, XVerse : contrôle indépendant et précis de plusieurs individus

On dit qu'OpenAI discute d'un financement de 40 milliards de dollars avec des investisseurs d'Arabie saoudite et d'Inde

Step1X-Edit : Une nouvelle référence en matière d'édition d'images open source, rivalisant avec des modèles propriétaires comme GPT-4o

Bulletin IA : Kunlun Wanwei open-source SkyReels-V2 ; iFlytek StarFire X1 mise à niveau ; test interne de Coze Space

GEO Services