AI Quotidien : Un nouveau roi est né ! Runway lance Gen-3 Alpha ; Luma AI lance la fonction Extend ; DeepSeek open-source un autre modèle ; ElevenLabs permet le doublage automatique de vidéos

站长之家

Publié leActualités IA · 17 minutes de lecture · Jun 18, 2024

Bienvenue sur la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en mettant l'accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits IA.

Nouveaux produits IA Cliquez ici pour en savoir plus : https://top.aibase.com/

1、Le roi de la vidéo IA fait son retour ! Le nouveau modèle Gen3 de Runway épate à nouveau les internautes

Cet article présente le nouveau modèle de génération de vidéos Gen-3Alpha de Runway, qui apporte des améliorations significatives en termes de fidélité, de cohérence et de représentation des mouvements, marquant une étape importante vers la création de modèles universels du monde. Gen-3Alpha possède de nombreuses fonctionnalités et caractéristiques remarquables, faisant de lui une nouvelle star dans l'industrie créative.

【Résumé AiBase :】
⭐️ Gen-3Alpha affiche une amélioration significative de la fidélité, de la cohérence et de la représentation des mouvements, permettant de générer des personnages humains réalistes et expressifs.
⭐️ Gen-3Alpha prend en charge plusieurs outils de génération, tels que la conversion texte-vidéo, image-vidéo et texte-image.
⭐️ Possibilité de contrôle temporel précis, avec plusieurs modes de contrôle avancés, notamment le pinceau de mouvement, le contrôle avancé de la caméra et le mode réalisateur.
⭐️ Une lumière et des ombres extrêmement stables, même dans les scènes à mouvement rapide, garantissant une sortie de haute qualité.
Plus de vidéos ici : https://mp.weixin.qq.com/s/5LbM0NfkeiYFU0r4VDqpYA
Adresse du site web : https://top.aibase.com/tool/gen-3-alpha

2、Luma AI lance la fonction Extend : extension de la durée des vidéos à plus de 10 secondes

Luma AI a récemment mis à jour son modèle vidéo Dream Machine avec la nouvelle fonction Extend, permettant d'étendre la durée des vidéos à plus de 10 secondes tout en conservant le style et les objets originaux. Bien que la fonction Extend prenne plus de temps pour générer la vidéo prolongée, la cohérence du style est bien maintenue.

【Résumé AiBase :】
✨ Dream Machine est mis à jour avec la fonction Extend, permettant des vidéos de plus de 10 secondes tout en conservant le style et les objets originaux.
⏱️ L'utilisation de la fonction Extend pour allonger les vidéos prend plus de temps, mais la cohérence du style est bonne.
🔗 Plus de détails : https://www.chinaz.com/ainews/9639.shtml

3、DeepSeek publie le modèle open source DeepSeek-Coder-V2

DeepSeek a récemment publié le modèle open source DeepSeek-Coder-V2, qui surpasse GPT-4-Turbo en matière de codage et de mathématiques, affichant des performances de pointe au niveau mondial. Le modèle utilise l'architecture MoE, prenant en charge plusieurs langues et des contextes plus longs. Il est disponible gratuitement pour un usage commercial sans demande préalable.

【Résumé AiBase :】
🚀 Performances de pointe au niveau mondial, particulièrement doué pour la génération de code et les calculs mathématiques.
💡 Prend en charge 338 langages de programmation et une longueur de contexte de 128 K, répondant à davantage de besoins de développement.
🔗 Service API disponible, au même prix que DeepSeek-V2, avec d'excellentes performances lors des tests de référence.
Lien vers les détails : https://top.aibase.com/tool/deepseek-coder-v2

4、Adobe Acrobat bénéficie d'une importante mise à jour IA : prise en charge de l'analyse multi-documents et de la génération d'images

Adobe s'apprête à lancer une série de mises à jour IA majeures, améliorant les fonctionnalités de l'assistant IA d'Acrobat, les capacités de génération d'images et garantissant la protection de la vie privée des données. Cette mise à jour améliorera considérablement l'efficacité au travail, facilitant le traitement d'un grand nombre de documents et l'optimisation du contenu visuel.

QQ截图20240618092653.png

【Résumé AiBase :】
🚀 Amélioration des fonctionnalités de l'assistant IA, prise en charge de l'analyse et des recherches multi-documents, amélioration de l'expérience utilisateur.
🖼️ Ajout d'un générateur d'images IA, permettant aux utilisateurs de générer de nouvelles images ou de modifier les images existantes dans les PDF.
🔒 Engagement de protection de la vie privée des données, les documents sont téléchargés vers le cloud pour analyse, mais ne sont pas utilisés pour entraîner les modèles IA, et leur utilisation par des tiers est interdite.

5、Apple publie 20 modèles Core ML sur la plateforme Hugging Face

Apple a publié sur la plateforme Hugging Face 20 nouveaux modèles Core ML et 4 jeux de données, démontrant ses progrès importants dans le développement de l'IA. Cette mise à jour comprend non seulement de nouveaux modèles prometteurs axés sur le texte et les images, mais couvre également un large éventail d'applications, telles que la classification d'images, l'estimation de la profondeur monoculaire et la segmentation sémantique. Apple souligne l'importance de l'IA sur les appareils, en améliorant les performances des applications grâce à l'exécution de modèles optimisés sur les appareils des utilisateurs, tout en garantissant la sécurité et la confidentialité des données des utilisateurs.

【Résumé AiBase :】
🚀 Apple a publié sur la plateforme Hugging Face 20 nouveaux modèles Core ML et 4 jeux de données, stimulant le développement de l'IA.
💡 Les nouveaux modèles Core ML couvrent un large éventail d'applications, notamment la classification d'images, l'estimation de la profondeur monoculaire et la segmentation sémantique.
🔒 Apple souligne l'importance de l'IA sur les appareils, les modèles optimisés s'exécutant sur les appareils des utilisateurs, améliorant les performances des applications et garantissant la sécurité et la confidentialité des données des utilisateurs.
Lien vers les détails : https://huggingface.co/apple

6、ElevenLabs open source un outil d'effets sonores pour la génération de vidéos : ajoutez simplement une vidéo pour une génération automatique de doublage

ElevenLabs, une société spécialisée dans la génération audio, a récemment annoncé son entrée dans le domaine de la génération vidéo en open-sourçant un projet capable de doubler automatiquement les vidéos téléchargées et de générer des effets sonores appropriés. Ils ont lancé une nouvelle fonctionnalité permettant aux utilisateurs de générer divers effets sonores réalistes à partir d'une entrée textuelle, apportant une aide considérable aux industries du cinéma, des jeux vidéo et des courtes vidéos. Outre la génération d'effets sonores, il propose également des fonctionnalités puissantes telles que le clonage vocal et la conversion texte-parole.

【Résumé AiBase :】
🔊 Doublage automatique des vidéos téléchargées et génération d'effets sonores appropriés.
🎶 Génération de divers effets sonores musicaux réalistes à partir d'une entrée textuelle, pour les industries du cinéma, des jeux vidéo et des courtes vidéos.
🎤 Fonctionnalités de clonage vocal et de conversion texte-parole, pour une présentation plus vivante du contenu.
Accès à la conversion texte-audio : https://top.aibase.com/tool/elevenlabs-wenbenzhuanyinxiaoapi
Accès au doublage automatique vidéo : https://top.aibase.com/tool/elevenlabs-texts-to-sounds-effects-api

7、Tencent Weixin Video envisage de limiter la vente en ligne par les influenceurs numériques

Tencent Video a récemment annoncé une révision de son règlement sur « la publication de contenu de mauvaise qualité par les influenceurs sur les vitrines vidéo », visant à renforcer la surveillance de la qualité du contenu et à envisager d'interdire la vente en ligne par les influenceurs numériques. Cette révision a fait l'objet d'une consultation publique du 7 juin au 13 juin.

【Résumé AiBase :】
⭐ La révision du règlement vise à renforcer la surveillance de la qualité du contenu sur Video.
⭐ Interdiction de la vente en ligne par les influenceurs numériques, interdiction claire des contenus en direct non authentiques.
⭐ La plateforme prendra des mesures disciplinaires contre les contrevenants.
Détails : https://www.chinaz.com/2024/0618/1624007.shtml

8、SD3 de Stability AI fait face à des objections concernant les licences, la communauté CivitAI bloque le contenu associé

Le dernier modèle majeur de Stability AI, SD3, suscite la controverse en raison de problèmes de licence et fait face à l'opposition de la communauté IA. La communauté CivitAI bloque le contenu lié à SD3, ce qui soulève des questions concernant les accords de licence. L'entreprise a lancé une licence pour les créateurs grand public, limitant les conditions pour les développeurs et le nombre de générations d'images. SD3 présente des problèmes tels que l'impossibilité de générer certaines poses corporelles, et son avenir est incertain. Le départ du PDG et les licenciements obligent l'entreprise à expliquer l'impact de la nouvelle licence. L'ensemble de cette controverse pourrait avoir un impact sur la communauté IA et le développement des modèles open source.

【Résumé AiBase :】
💥 La question de la licence de SD3 suscite la controverse et fait face à l'opposition de la communauté IA.
🔒 L'entreprise lance une licence pour les créateurs, limitant les conditions pour les développeurs et le nombre de générations d'images.
❓ SD3 présente des problèmes tels que l'impossibilité de générer certaines poses corporelles, et son avenir est incertain.

9、Imprimante Lego Pixelbot 3000

Cet article présente l'imprimante Lego Pixelbot 3000 conçue et fabriquée par le créateur de la chaîne YouTube @Creative Mindstorms, qui utilise du code personnalisé et l'intelligence artificielle pour générer des mosaïques Lego. L'utilisateur n'a qu'à saisir le nom de l'œuvre d'art, l'IA génère l'image, puis Pixelbot 3000 assemble automatiquement la mosaïque.

【Résumé AiBase :】
🤖 Grâce à du code personnalisé et à l'intelligence artificielle, Pixelbot 3000 peut générer automatiquement des mosaïques Lego, simplifiant le processus d'impression.
🎨 Pixelbot 3000 utilise DALL-E3 d'OpenAI pour générer des images simplifiées de style dessin animé, produisant finalement des images redimensionnées à fort contraste.
🔧 Pixelbot 3000 divise l'image générée par l'IA et échantillonne la couleur du pixel central de chaque carré pour obtenir un meilleur motif de mosaïque.

10、Des chercheurs apprennent à l'IA à reconnaître les croquis au trait humain

Cet article présente la nouvelle méthode développée par une équipe de recherche de l'Université de Surrey et de l'Université de Stanford, qui permet à l'intelligence artificielle de comprendre l'importance et les résultats des croquis au trait humain. En combinant croquis et descriptions textuelles, l'intelligence artificielle fait preuve d'une capacité de compréhension proche de celle de l'homme, identifiant et étiquetant avec précision les objets dans des scènes complexes. Cette recherche ouvre de nouvelles possibilités pour l'interaction homme-machine et les processus de conception.

【Résumé AiBase :】
🧠 L'intelligence artificielle apprend à comprendre l'importance des croquis, affichant des performances proches de celles de l'homme.
🌳 L'intelligence artificielle peut identifier et étiqueter des objets tels que des cerfs-volants, des arbres et des girafes avec une précision de 85 %, surpassant d'autres modèles.
🎨 La nouvelle méthode s'applique non seulement aux croquis réalisés par des non-artistes, mais aussi aux croquis d'objets non explicitement entraînés.
Lien vers les détails : https://arxiv.org/abs/2312.12463

11、Étude : les images générées par l'IA ne représentent pas fidèlement les nuances de la culture architecturale islamique

Luma et Runway visent les robots et la conduite autonome pour élargir leur horizon de revenus futurs

Luma et Runway, spécialistes de la génération vidéo IA, étendent leurs activités aux robots et véhicules autonomes. Luma améliore la perception des robots avec des modèles 3D IA, tandis que Runway révolutionne la création de jeux vidéo. Cette diversification illustre le potentiel transversal de l'IA.....

Runway lance un nouveau modèle de montage vidéo Aleph : modifiez des scènes en une seule phrase, supprimez les reflets lumineux et déverrouillez une créativité illimitée !

Runway lance un modèle révolutionnaire de montage vidéo Aleph, capable d'effectuer cinq fonctions essentielles grâce à des instructions en langage naturel : ajout ou suppression de contenu, transformation de l'environnement, transfert de style, transfert du mouvement de la caméra et séparation de fond vert. Ce modèle intègre de manière innovante la compréhension du contexte et les technologies de génération visuelle, permettant de générer plusieurs angles à partir d'une seule vidéo, réduisant considérablement le seuil d'accès au montage professionnel. Le lancement d'Aleph accélérera la généralisation de l'IA dans les domaines du cinéma, de la publicité, etc. Les performances seront continuellement optimisées, et de nouvelles fonctions telles que la collaboration en temps réel seront développées, offrant aux créateurs des outils plus puissants.

Runway AI lance un monde de jeux majeur, un grand aventure textuelle interactive arrive

Récemment, l'entreprise pionnière en technologie d'IA, Runway, a annoncé le lancement prochain de sa nouvelle plateforme d'IA générative appelée « Game Worlds » (Mondes de jeux). Ce produit innovant marque non seulement l'extension réussie de Runway du domaine du cinéma au secteur des jeux, mais apporte également aux créateurs et joueurs une nouvelle expérience interactive. « Game Worlds » : une aventure textuelle interactive pilotée par l'IA. La plateforme « Game Worlds » de Runway repose sur l'IA générative, permettant aux utilisateurs de créer et d'expérimenter des jeux d'aventure basés sur le texte simplement en entrant des mots simples.

Le Festival d'Art du Runway AI s'ouvre magnifiquement à New York : 6000 œuvres en course pour les honneurs des dix finalistes

La célèbre entreprise de technologie vidéo AI, Runway, a organisé son festival annuel d'art AI à New York. Ce festival a attiré l'attention mondiale, avec des créateurs du monde entier soumettant environ 6000 courts-métrages, desquels dix excellents travaux ont été sélectionnés pour une projection. Le directeur général de Runway, Cristobal Barrenzuela, a déclaré lors de l'événement que la vision d'il y a trois ans est aujourd'hui devenue réalité, et que des millions de personnes dans le monde utilisent maintenant leurs outils pour créer des milliards de vidéos. Source des images : l'image a été générée par un IA ; droits d'utilisation accordés…

Bulletin IA : Le nouveau modèle Qwen3 d'Alibaba arrive bientôt ; Serveur MCP open source sur GitHub ; Runway lance Gen-4 Turbo

Bienvenue à la rubrique 【Bulletin IA】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en nous concentrant sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits IA. Découvrez les nouveaux produits IA : https://top.aibase.com/1、Qwen3 arrive bientôt : la prise en charge du nouveau modèle d'Alibaba Cloud a été officiellement fusionnée dans le référentiel de code vLLMLe modèle Qwen3 d'Alibaba Cloud sera bientôt disponible, marquant une nouvelle avancée importante dans le domaine de l'IA. Nouveau lancement

Runway lève 308 millions de dollars, sa valorisation dépasse les 3 milliards de dollars

La startup d'IA vidéo Runway a levé 308 millions de dollars lors d'un nouveau tour de financement. Ce tour de table, mené par la société de capital-investissement General Atlantic, vise à aider Runway à développer son écosystème de nouveaux médias. Selon des sources informées, cette dernière levée de fonds porte la valorisation de Runway, basée à New York, à plus de 3 milliards de dollars. Outre General Atlantic, de nombreuses institutions de renom ont participé à ce tour de financement, notamment SoftBank.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

AI Quotidien : Un nouveau roi est né ! Runway lance Gen-3 Alpha ; Luma AI lance la fonction Extend ; DeepSeek open-source un autre modèle ; ElevenLabs permet le doublage automatique de vidéos

站长之家

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

L'IA vidéo s'implante dans des domaines verticaux ! Runway ouvre les droits de mise en page des modèles, se concentrant sur les robots et la construction

Luma et Runway visent les robots et la conduite autonome pour élargir leur horizon de revenus futurs

Runway lance un nouveau modèle de montage vidéo Aleph : modifiez des scènes en une seule phrase, supprimez les reflets lumineux et déverrouillez une créativité illimitée !

Runway AI lance un monde de jeux majeur, un grand aventure textuelle interactive arrive

Le Festival d'Art du Runway AI s'ouvre magnifiquement à New York : 6000 œuvres en course pour les honneurs des dix finalistes

Transformer les photos du téléphone en œuvres d'art ! Runway Gen-4 References déverrouille de nouvelles utilisations pour le carnet photo de l'appareil photo.

Rapport Poe : Les vidéos générées par les grandes modèles de Keeling représentent environ 30 % des parts, devançant Runway

Bulletin IA : Le nouveau modèle Qwen3 d'Alibaba arrive bientôt ; Serveur MCP open source sur GitHub ; Runway lance Gen-4 Turbo

Runway lance Gen-4 Turbo : la génération vidéo IA atteint de nouveaux sommets de vitesse

Runway lève 308 millions de dollars, sa valorisation dépasse les 3 milliards de dollars

Recommandations d'actualités IA connexes

L'IA vidéo s'implante dans des domaines verticaux ! Runway ouvre les droits de mise en page des modèles, se concentrant sur les robots et la construction

Luma et Runway visent les robots et la conduite autonome pour élargir leur horizon de revenus futurs

Runway lance un nouveau modèle de montage vidéo Aleph : modifiez des scènes en une seule phrase, supprimez les reflets lumineux et déverrouillez une créativité illimitée !

Runway AI lance un monde de jeux majeur, un grand aventure textuelle interactive arrive

Le Festival d'Art du Runway AI s'ouvre magnifiquement à New York : 6000 œuvres en course pour les honneurs des dix finalistes

Transformer les photos du téléphone en œuvres d'art ! Runway Gen-4 References déverrouille de nouvelles utilisations pour le carnet photo de l'appareil photo.

Rapport Poe : Les vidéos générées par les grandes modèles de Keeling représentent environ 30 % des parts, devançant Runway

Bulletin IA : Le nouveau modèle Qwen3 d'Alibaba arrive bientôt ; Serveur MCP open source sur GitHub ; Runway lance Gen-4 Turbo

Runway lance Gen-4 Turbo : la génération vidéo IA atteint de nouveaux sommets de vitesse

Runway lève 308 millions de dollars, sa valorisation dépasse les 3 milliards de dollars

GEO Services