Bienvenue sur la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en mettant l'accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits d'IA.

Nouveaux produits IA : Cliquez ici pour en savoir plus :https://top.aibase.com/

1. Kunlun Wanwei publie en open source SkyReels-V1, le premier modèle de génération vidéo pour la création de courtes vidéos IA

Kunlun Wanwei a annoncé la publication en open source de SkyReels-V1, son premier modèle de génération vidéo pour la création de courtes vidéos IA, ainsi que de son algorithme de contrôle des expressions et des mouvements SkyReels-A1. L'objectif est de résoudre les problèmes de coût élevé et de difficulté d'utilisation des modèles existants. Cette innovation stimulera le développement de l'industrie des courtes vidéos IA et offrira des capacités de génération de contenu vidéo de meilleure qualité. SkyReels-V1, entraîné sur des données de haute qualité, permet un contrôle précis de l'interprétation des personnages, prend en charge de nombreuses combinaisons d'expressions et de mouvements, améliorant ainsi le réalisme et l'expressivité des vidéos.

【Résumé AiBase :】

🎥 SkyReels-V1 est le premier modèle de génération vidéo de courtes vidéos IA open source en Chine, prenant en charge 33 expressions et plus de 400 combinaisons de mouvements.

🤖 SkyReels-A1 est le premier algorithme de contrôle des expressions et des mouvements de niveau SOTA, capable de restituer des micro-expressions haute fidélité.

🌐 Kunlun Wanwei s'engage dans les technologies open source pour stimuler l'innovation et le développement de l'industrie des courtes vidéos IA, et réduire les coûts de production.

Lien détaillé :https://github.com/SkyworkAI/SkyReels-V1

2. Lancement de Grok3, le modèle révolutionnaire de xAI : surpassant GPT-4o, capacité de calcul améliorée de 10 fois

xAI a lancé lundi son dernier modèle d'IA phare, Grok3, marquant une avancée importante de la société dans le domaine de l'intelligence artificielle. Grok3 possède une capacité de calcul 10 fois supérieure à celle de son prédécesseur, Grok2. Il peut analyser des images et répondre à des questions, et a surpassé GPT-4o d'OpenAI dans plusieurs tests de référence. La nouvelle fonction DeepSearch permet aux utilisateurs d'accéder rapidement à des analyses d'informations approfondies, améliorant encore l'utilité des applications Grok. Un mode vocal sera également proposé prochainement, offrant une expérience utilisateur plus riche.

image.png

【Résumé AiBase :】

🧠 Grok3 est le dernier modèle d'IA lancé par xAI, avec une capacité de calcul 10 fois supérieure à la version précédente.

📈 Grok3 peut analyser des images et répondre à des questions, et a surpassé GPT-4o dans plusieurs tests de référence.

🔍 La nouvelle fonction DeepSearch fournit des analyses d'informations approfondies, permettant aux utilisateurs d'accéder rapidement aux informations.

3. Step publie un modèle de langage vocal de 130 milliards de paramètres, conversation en temps réel + clonage émotionnel, une percée majeure

Step Audio a récemment publié un modèle de langage vocal de 130 milliards de paramètres, marquant une avancée majeure dans le domaine de l'interaction vocale. Ce modèle combine les capacités de compréhension et de génération de la parole, démontrant une prise en charge multilingue et une reconnaissance des dialectes puissantes, permettant une expérience d'interaction vocale personnalisée. De plus, ses fonctions de contrôle émotionnel et de clonage vocal offrent aux utilisateurs des possibilités d'interaction plus riches, annonçant un avenir où l'IA vocale sera plus intelligente et naturelle.

【Résumé AiBase :】

🚀 Ce modèle est le premier système de dialogue vocal en temps réel intégrant la compréhension et le contrôle de la génération de la parole, offrant des capacités de contrôle puissantes.

🌍 Il prend en charge plusieurs langues et dialectes, notamment le chinois, l'anglais, le japonais, le cantonais et le dialecte du Sichuan, facilitant les échanges interlinguistiques.

🎶 Il dispose de fonctions de clonage vocal et de contrôle émotionnel, permettant aux utilisateurs de définir librement le ton émotionnel de la voix et de créer des assistants vocaux personnalisés.

Lien détaillé :https://github.com/stepfun-ai/Step-Audio/tree/main

4. Meilleurs résultats ! Step Star publie le modèle de génération vidéo Step-Video-T2V

Aujourd'hui, Step Star et le groupe automobile Geely ont lancé conjointement deux grands modèles multimodaux open source, en particulier le modèle de génération vidéo Step-Video-T2V, qui, avec ses 30 milliards de paramètres, a démontré des capacités exceptionnelles dans le domaine de la génération vidéo. Ce modèle non seulement excelle dans la génération de vidéos de haute qualité, mais comprend également les instructions avec précision, prend en charge différents mouvements de caméra, et les images générées sont réalistes et conformes aux lois de la physique. Les développeurs peuvent tester ce modèle sur l'application Yuewen et lui fournir des commentaires pour faire progresser la technologie.

image.png

【Résumé AiBase :】

🌟 Le modèle Step-Video-T2V possède 30 milliards de paramètres, génère des vidéos de 204 images à une résolution de 540 P, et ses performances sont les meilleures au monde.

🎨 Le modèle présente d'excellentes performances en termes de fluidité des mouvements et d'esthétique, surpassant les modèles vidéo open source existants.

📱 Les deux modèles sont disponibles sur l'application Yuewen, les développeurs peuvent les tester et fournir des suggestions pour faire progresser la technologie.

Lien détaillé :https://github.com/stepfun-ai/Step-Audio

5. La prodige de l'IA Luo Fuli a rejoint un nouveau poste

Luo Fuli, une jeune prodige de l'IA née en 1995, a récemment commencé une nouvelle aventure professionnelle, bien que les informations sur l'entreprise ne soient pas encore divulguées. Elle avait suscité un vif intérêt après avoir reçu une offre d'emploi de la part du fondateur de Xiaomi, Lei Jun, avec un salaire annuel à sept chiffres. Luo Fuli a obtenu une maîtrise en linguistique computationnelle à l'université de Pékin, puis a acquis une riche expérience de recherche chez Alibaba DAMO Academy et DeepSeek.

【Résumé AiBase :】

✨ Luo Fuli a commencé un nouveau travail, l'entreprise n'a pas encore été révélée.

💰 Lei Jun a offert à Luo Fuli un poste chez Xiaomi avec un salaire annuel à sept chiffres.

📈 Luo Fuli a qualifié le modèle DeepSeek-V2 de « roi du rapport qualité-prix ».

6. Petit modèle + grand modèle en synergie ! Mita AI Search lance la fonction de recherche superficielle « Shallow Research »

Mita Network Technology Co., Ltd. a lancé le 18 février 2025 sa nouvelle fonction « Shallow Research », qui vise à utiliser la technologie de l'IA pour collecter et analyser rapidement les informations afin d'améliorer l'efficacité de la recherche. Cette fonction utilise une architecture synergique de petits et grands modèles, capable de rechercher et d'analyser des centaines de pages Web en peu de temps, réduisant considérablement le temps de recherche. Bien qu'elle en soit encore au stade de la recherche superficielle, elle est déjà capable de fournir aux utilisateurs des résultats d'analyse préliminaires, démontrant l'énorme potentiel de l'IA dans le traitement de l'information.

image.png

【Résumé AiBase :】

🧠 Utilise une architecture synergique de petits et grands modèles pour améliorer l'efficacité de la recherche.

⏱️ Peut rechercher et analyser des centaines de pages Web en 2 à 3 minutes.

📈 Prévoit d'ajouter des capacités d'exécution de code et d'analyse numérique pour approfondir la recherche.

7. Lancement de Supertone Play, l'outil vocal IA de HYBE : clonage vocal en 10 secondes

Supertone, filiale de HYBE, a lancé Supertone Play, un outil de conversion texte-parole visant à fournir aux créateurs un contenu audio de haute qualité et expressif. Cet outil prend en charge l'anglais, le coréen et le japonais, et sera étendu à l'espagnol et au chinois prochainement. Supertone Play propose 150 personnages vocaux adaptés à divers besoins de création, et dispose d'une fonction de clonage vocal permettant aux utilisateurs de créer des personnages personnalisés basés sur leur propre voix et d'ajuster le ton émotionnel.

image.png

【Résumé AiBase :】

🎙️ Supertone Play prend en charge plusieurs langues et propose 150 personnages vocaux aux créateurs.

🔒 L'outil intègre des mesures de sécurité telles que le captcha vocal et un filigrane inaudible pour empêcher l'abus de la technologie.

🌍 En phase de test, l'outil a été largement utilisé dans plus de 80 pays, les utilisateurs téléchargeant activement le contenu généré.

Lien détaillé :https://play.supertone.ai/

8. Tencent e-signature lancera une fonction de rédaction de contrats IA

Le compte officiel WeChat de Tencent e-signature a récemment annoncé le lancement prochain d'une fonction de rédaction de contrats IA, utilisant les technologies des grands modèles HunYuan et DeepSeek, afin de fournir aux utilisateurs un service pratique de génération et de gestion de contrats. Grâce à l'IA, Xiaowang peut facilement générer un contrat de colocation et ajouter les clauses nécessaires, tandis que Xiao Li peut rapidement examiner les risques potentiels d'un contrat de fournisseur. Lao Zhang, juriste, peut également gérer efficacement les contrats et éviter les pertes d'informations. Cette fonction améliorera considérablement l'efficacité et la précision du traitement des contrats.

image.png

【Résumé AiBase :】

🤖 L'IA peut générer des contrats en un clic, simplifiant le processus de rédaction et réduisant la difficulté d'utilisation.

🔍 L'IA, en tant qu'assistant de détection des risques, peut rapidement identifier les clauses potentiellement défavorables dans un contrat.

📂 L'IA permet une gestion intelligente des contrats, aidant les utilisateurs à trouver rapidement les informations clés et à éviter la « disparition » des contrats.

9. Shenzhen Futian et Guangzhou lancent des « fonctionnaires IA » : déploiement du grand modèle DeepSeek

Les districts de Futian à Shenzhen et de Guangzhou ont successivement lancé des « fonctionnaires IA » basés sur le grand modèle DeepSeek, marquant une avancée importante dans la construction d'une administration intelligente. Le fonctionnaire numérique IA lancé par le district de Futian couvre 240 scénarios d'activité, améliorant considérablement l'efficacité des services administratifs, réduisant considérablement le temps de génération personnalisée et le temps d'examen de 90 %. La ville de Guangzhou est également en train de promouvoir la construction d'un système d'administration intelligente basé sur DeepSeek, démontrant le potentiel de la technologie de l'IA dans l'optimisation des services administratifs.

【Résumé AiBase :】

🚀 Le district de Futian a lancé un employé numérique IA couvrant 240 scénarios d'activité, améliorant l'efficacité des services administratifs.

⏱️ Le temps de génération personnalisée est passé de 5 jours à quelques minutes, et le temps d'examen a été réduit de 90 %.

🌐 La ville de Guangzhou construit un système d'administration intelligente basé sur DeepSeek, favorisant la construction d'un nouveau moteur numérique.

10. NetEase Youdao lance SpaceOne, le premier matériel d'apprentissage natif IA en Chine, intégrant DeepSeek-R1

NetEase Youdao a lancé le 18 février un matériel d'apprentissage révolutionnaire, le stylo-dictionnaire à écran complet SpaceOne, qui est le premier matériel éducatif natif IA en Chine à intégrer profondément les capacités des grands modèles. Ce produit, basé sur le principe de « démonstration de type brouillon », dépasse les limites des outils de résolution de problèmes traditionnels, offrant des explications approfondies pour tous les types de problèmes, couvrant plusieurs disciplines telles que les mathématiques, la physique et la chimie, et améliorant considérablement l'efficacité de l'apprentissage.

image.png

【Résumé AiBase :】

🖊️ SpaceOne intègre le modèle d'inférence DeepSeek-R1, qui décompose les problèmes complexes de manière visuelle étape par étape, simulant le processus de pensée d'un enseignant et couvrant 10 disciplines.

📱 Il utilise un boîtier coulissant et un écran complet anti-fatigue de 4,4 pouces, l'affichage vertical améliorant l'efficacité de 350 % et optimisant l'expérience d'interaction d'apprentissage.

🌐 Il intègre un lexique de 78 millions de mots et un module 4G mobile, prenant en charge la traduction de centaines de langues et brisant les limites des ressources éducatives régionales.

11. La start-up SSI, cofondée par un cofondateur d'OpenAI, lève plus de 10 milliards de dollars, valorisée à plus de 30 milliards de dollars