Bienvenue sur la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en mettant l'accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits IA.

Nouveaux produits IA Cliquez ici pour en savoir plus : https://top.aibase.com/

1、Le roi de la vidéo IA fait son retour ! Le nouveau modèle Gen3 de Runway épate à nouveau les internautes

Cet article présente le nouveau modèle de génération de vidéos Gen-3Alpha de Runway, qui apporte des améliorations significatives en termes de fidélité, de cohérence et de représentation des mouvements, marquant une étape importante vers la création de modèles universels du monde. Gen-3Alpha possède de nombreuses fonctionnalités et caractéristiques remarquables, faisant de lui une nouvelle star dans l'industrie créative.

【Résumé AiBase :】

⭐️ Gen-3Alpha affiche une amélioration significative de la fidélité, de la cohérence et de la représentation des mouvements, permettant de générer des personnages humains réalistes et expressifs.

⭐️ Gen-3Alpha prend en charge plusieurs outils de génération, tels que la conversion texte-vidéo, image-vidéo et texte-image.

⭐️ Possibilité de contrôle temporel précis, avec plusieurs modes de contrôle avancés, notamment le pinceau de mouvement, le contrôle avancé de la caméra et le mode réalisateur.

⭐️ Une lumière et des ombres extrêmement stables, même dans les scènes à mouvement rapide, garantissant une sortie de haute qualité.

Plus de vidéos ici : https://mp.weixin.qq.com/s/5LbM0NfkeiYFU0r4VDqpYA

Adresse du site web : https://top.aibase.com/tool/gen-3-alpha

2、Luma AI lance la fonction Extend : extension de la durée des vidéos à plus de 10 secondes

Luma AI a récemment mis à jour son modèle vidéo Dream Machine avec la nouvelle fonction Extend, permettant d'étendre la durée des vidéos à plus de 10 secondes tout en conservant le style et les objets originaux. Bien que la fonction Extend prenne plus de temps pour générer la vidéo prolongée, la cohérence du style est bien maintenue.

【Résumé AiBase :】

✨ Dream Machine est mis à jour avec la fonction Extend, permettant des vidéos de plus de 10 secondes tout en conservant le style et les objets originaux.

⏱️ L'utilisation de la fonction Extend pour allonger les vidéos prend plus de temps, mais la cohérence du style est bonne.

🔗 Plus de détails : https://www.chinaz.com/ainews/9639.shtml

3、DeepSeek publie le modèle open source DeepSeek-Coder-V2

DeepSeek a récemment publié le modèle open source DeepSeek-Coder-V2, qui surpasse GPT-4-Turbo en matière de codage et de mathématiques, affichant des performances de pointe au niveau mondial. Le modèle utilise l'architecture MoE, prenant en charge plusieurs langues et des contextes plus longs. Il est disponible gratuitement pour un usage commercial sans demande préalable.

image.png

【Résumé AiBase :】

🚀 Performances de pointe au niveau mondial, particulièrement doué pour la génération de code et les calculs mathématiques.

💡 Prend en charge 338 langages de programmation et une longueur de contexte de 128 K, répondant à davantage de besoins de développement.

🔗 Service API disponible, au même prix que DeepSeek-V2, avec d'excellentes performances lors des tests de référence.

Lien vers les détails : https://top.aibase.com/tool/deepseek-coder-v2

4、Adobe Acrobat bénéficie d'une importante mise à jour IA : prise en charge de l'analyse multi-documents et de la génération d'images

Adobe s'apprête à lancer une série de mises à jour IA majeures, améliorant les fonctionnalités de l'assistant IA d'Acrobat, les capacités de génération d'images et garantissant la protection de la vie privée des données. Cette mise à jour améliorera considérablement l'efficacité au travail, facilitant le traitement d'un grand nombre de documents et l'optimisation du contenu visuel.

QQ截图20240618092653.png

【Résumé AiBase :】

🚀 Amélioration des fonctionnalités de l'assistant IA, prise en charge de l'analyse et des recherches multi-documents, amélioration de l'expérience utilisateur.

🖼️ Ajout d'un générateur d'images IA, permettant aux utilisateurs de générer de nouvelles images ou de modifier les images existantes dans les PDF.

🔒 Engagement de protection de la vie privée des données, les documents sont téléchargés vers le cloud pour analyse, mais ne sont pas utilisés pour entraîner les modèles IA, et leur utilisation par des tiers est interdite.

5、Apple publie 20 modèles Core ML sur la plateforme Hugging Face

Apple a publié sur la plateforme Hugging Face 20 nouveaux modèles Core ML et 4 jeux de données, démontrant ses progrès importants dans le développement de l'IA. Cette mise à jour comprend non seulement de nouveaux modèles prometteurs axés sur le texte et les images, mais couvre également un large éventail d'applications, telles que la classification d'images, l'estimation de la profondeur monoculaire et la segmentation sémantique. Apple souligne l'importance de l'IA sur les appareils, en améliorant les performances des applications grâce à l'exécution de modèles optimisés sur les appareils des utilisateurs, tout en garantissant la sécurité et la confidentialité des données des utilisateurs.

image.png

【Résumé AiBase :】

🚀 Apple a publié sur la plateforme Hugging Face 20 nouveaux modèles Core ML et 4 jeux de données, stimulant le développement de l'IA.

💡 Les nouveaux modèles Core ML couvrent un large éventail d'applications, notamment la classification d'images, l'estimation de la profondeur monoculaire et la segmentation sémantique.

🔒 Apple souligne l'importance de l'IA sur les appareils, les modèles optimisés s'exécutant sur les appareils des utilisateurs, améliorant les performances des applications et garantissant la sécurité et la confidentialité des données des utilisateurs.

Lien vers les détails : https://huggingface.co/apple

6、ElevenLabs open source un outil d'effets sonores pour la génération de vidéos : ajoutez simplement une vidéo pour une génération automatique de doublage

ElevenLabs, une société spécialisée dans la génération audio, a récemment annoncé son entrée dans le domaine de la génération vidéo en open-sourçant un projet capable de doubler automatiquement les vidéos téléchargées et de générer des effets sonores appropriés. Ils ont lancé une nouvelle fonctionnalité permettant aux utilisateurs de générer divers effets sonores réalistes à partir d'une entrée textuelle, apportant une aide considérable aux industries du cinéma, des jeux vidéo et des courtes vidéos. Outre la génération d'effets sonores, il propose également des fonctionnalités puissantes telles que le clonage vocal et la conversion texte-parole.

【Résumé AiBase :】

🔊 Doublage automatique des vidéos téléchargées et génération d'effets sonores appropriés.

🎶 Génération de divers effets sonores musicaux réalistes à partir d'une entrée textuelle, pour les industries du cinéma, des jeux vidéo et des courtes vidéos.

🎤 Fonctionnalités de clonage vocal et de conversion texte-parole, pour une présentation plus vivante du contenu.

Accès à la conversion texte-audio : https://top.aibase.com/tool/elevenlabs-wenbenzhuanyinxiaoapi

Accès au doublage automatique vidéo : https://top.aibase.com/tool/elevenlabs-texts-to-sounds-effects-api

7、Tencent Weixin Video envisage de limiter la vente en ligne par les influenceurs numériques

Tencent Video a récemment annoncé une révision de son règlement sur « la publication de contenu de mauvaise qualité par les influenceurs sur les vitrines vidéo », visant à renforcer la surveillance de la qualité du contenu et à envisager d'interdire la vente en ligne par les influenceurs numériques. Cette révision a fait l'objet d'une consultation publique du 7 juin au 13 juin.

【Résumé AiBase :】

⭐ La révision du règlement vise à renforcer la surveillance de la qualité du contenu sur Video.

⭐ Interdiction de la vente en ligne par les influenceurs numériques, interdiction claire des contenus en direct non authentiques.

⭐ La plateforme prendra des mesures disciplinaires contre les contrevenants.

Détails : https://www.chinaz.com/2024/0618/1624007.shtml

8、SD3 de Stability AI fait face à des objections concernant les licences, la communauté CivitAI bloque le contenu associé

Le dernier modèle majeur de Stability AI, SD3, suscite la controverse en raison de problèmes de licence et fait face à l'opposition de la communauté IA. La communauté CivitAI bloque le contenu lié à SD3, ce qui soulève des questions concernant les accords de licence. L'entreprise a lancé une licence pour les créateurs grand public, limitant les conditions pour les développeurs et le nombre de générations d'images. SD3 présente des problèmes tels que l'impossibilité de générer certaines poses corporelles, et son avenir est incertain. Le départ du PDG et les licenciements obligent l'entreprise à expliquer l'impact de la nouvelle licence. L'ensemble de cette controverse pourrait avoir un impact sur la communauté IA et le développement des modèles open source.

【Résumé AiBase :】

💥 La question de la licence de SD3 suscite la controverse et fait face à l'opposition de la communauté IA.

🔒 L'entreprise lance une licence pour les créateurs, limitant les conditions pour les développeurs et le nombre de générations d'images.

❓ SD3 présente des problèmes tels que l'impossibilité de générer certaines poses corporelles, et son avenir est incertain.

9、Imprimante Lego Pixelbot 3000

Cet article présente l'imprimante Lego Pixelbot 3000 conçue et fabriquée par le créateur de la chaîne YouTube @Creative Mindstorms, qui utilise du code personnalisé et l'intelligence artificielle pour générer des mosaïques Lego. L'utilisateur n'a qu'à saisir le nom de l'œuvre d'art, l'IA génère l'image, puis Pixelbot 3000 assemble automatiquement la mosaïque.

image.png

【Résumé AiBase :】

🤖 Grâce à du code personnalisé et à l'intelligence artificielle, Pixelbot 3000 peut générer automatiquement des mosaïques Lego, simplifiant le processus d'impression.

🎨 Pixelbot 3000 utilise DALL-E3 d'OpenAI pour générer des images simplifiées de style dessin animé, produisant finalement des images redimensionnées à fort contraste.

🔧 Pixelbot 3000 divise l'image générée par l'IA et échantillonne la couleur du pixel central de chaque carré pour obtenir un meilleur motif de mosaïque.

10、Des chercheurs apprennent à l'IA à reconnaître les croquis au trait humain

Cet article présente la nouvelle méthode développée par une équipe de recherche de l'Université de Surrey et de l'Université de Stanford, qui permet à l'intelligence artificielle de comprendre l'importance et les résultats des croquis au trait humain. En combinant croquis et descriptions textuelles, l'intelligence artificielle fait preuve d'une capacité de compréhension proche de celle de l'homme, identifiant et étiquetant avec précision les objets dans des scènes complexes. Cette recherche ouvre de nouvelles possibilités pour l'interaction homme-machine et les processus de conception.

image.png

【Résumé AiBase :】

🧠 L'intelligence artificielle apprend à comprendre l'importance des croquis, affichant des performances proches de celles de l'homme.

🌳 L'intelligence artificielle peut identifier et étiqueter des objets tels que des cerfs-volants, des arbres et des girafes avec une précision de 85 %, surpassant d'autres modèles.

🎨 La nouvelle méthode s'applique non seulement aux croquis réalisés par des non-artistes, mais aussi aux croquis d'objets non explicitement entraînés.

Lien vers les détails : https://arxiv.org/abs/2312.12463

11、Étude : les images générées par l'IA ne représentent pas fidèlement les nuances de la culture architecturale islamique