Bienvenue à la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en nous concentrant sur les développeurs et en vous aidant à comprendre les tendances technologiques et les applications innovantes des produits d'IA.
Nouveaux produits IA Cliquez pour en savoir plus :https://top.aibase.com/
1. Cet été, Xiaohongshu a été conquis par le « filtre argile AI » de Remini
Pendant les vacances de la fête du Travail, une nouvelle tendance est apparue sur la plateforme Xiaohongshu : le filtre « argile IA », qui a rapidement conquis la page d'accueil de Xiaohongshu et est devenu un sujet de discussion populaire parmi les utilisateurs. La fonction de filtre argile IA de Remini a suscité une nouvelle vague d'engouement dans le monde entier, démontrant le potentiel des technologies d'IA dans le domaine du traitement d'images.
【Résumé AiBase :】
📸 Xiaohongshu conquis par le « filtre argile IA », des photos au style argile unique deviennent populaires.
🔥 Le filtre argile IA de Remini est populaire, les utilisateurs n'ont qu'à télécharger une image pour obtenir une photo de style argile.
🚀 Le succès de Remini prouve l'énorme potentiel des produits d'IA de traitement d'images pour répondre aux besoins de vie et de divertissement des utilisateurs.
Lien détaillé : https://top.aibase.com/tool/remini-app
2. HeyGen lance l'outil de montage automatique Instant Highlights 1.0
HeyGen a récemment lancé l'outil de montage vidéo automatique Instant Highlights 1.0, offrant aux utilisateurs une expérience d'édition vidéo pratique. Cet outil dispose d'une fonction de doublage multilingue, ce qui simplifie l'adaptation du contenu vidéo à plusieurs plateformes et améliore l'efficacité de la diffusion du contenu. De plus, HeyGen a également publié la technologie Avatar in Motion 1.0, qui permet la capture de mouvement et le clonage vocal de personnages virtuels, élargissant le potentiel d'application des personnages virtuels dans divers domaines. Ces deux nouvelles technologies témoignent de la puissance et de l'esprit d'innovation de HeyGen dans le domaine de l'IA.
【Résumé AiBase :】
✨ Fonction de doublage multilingue, simplification de l'adaptation du contenu vidéo à plusieurs plateformes, amélioration de l'efficacité de la diffusion du contenu.
🌟 La technologie Avatar in Motion 1.0 permet la capture de mouvement et le clonage vocal de personnages virtuels, élargissant le potentiel d'application.
💡 HeyGen démontre ses compétences et son esprit d'innovation dans le domaine de l'IA, offrant aux utilisateurs une expérience personnalisée riche.
Lien détaillé : https://top.aibase.com/tool/heygen
3. StoryDiffusion : cohérence des personnages, création de bandes dessinées multi-images et de longues vidéos
L'outil StoryDiffusion, développé par l'équipe HVision de l'université Nankai, est capable de créer des histoires magiques, de maintenir la cohérence des personnages et de générer des bandes dessinées multi-images et de longues vidéos. Grâce à la mise en œuvre de Consistent self-attention et de Motion predictor, il génère des images et des vidéos cohérentes, pouvant être utilisées dans divers scénarios tels que la génération de bandes dessinées et la conversion d'images en vidéos.
【Résumé AiBase :】
🔮 Consistent self-attention permet la génération d'images cohérentes pour les personnages.
🎥 Motion predictor permet la génération de longues vidéos.
🎨 Prise en charge de la génération de bandes dessinées, de la conversion d'images en vidéos, de vidéos courtes et longues, etc.
Lien détaillé : https://top.aibase.com/tool/storydiffusion
4. L'outil musical IA Udio est mis à jour et permet de créer des morceaux de musique de 15 minutes
Je suis très enthousiaste quant aux dernières mises à jour de Udio. Ces mises à jour offrent une expérience de création musicale plus longue et plus cohérente, offrant aux créateurs de musique plus de liberté et de possibilités créatives.
【Résumé AiBase :】
✨ Extension de la fenêtre contextuelle, prise en compte du contenu des deux minutes précédentes et suivantes, amélioration de la cohérence des œuvres musicales.
🎵 Prise en charge de la création de pistes audio d'une durée allant jusqu'à 15 minutes, répondant aux besoins de durée de création musicale.
🌳 Introduction d'un mode d'organisation innovant de l'historique des pistes audio, permettant aux utilisateurs de suivre clairement l'évolution des versions des pistes audio.
Lien détaillé : https://top.aibase.com/tool/udio
5. Adobe lance Project Neo, un outil d'icônes 3D permettant une conversion rapide du 2D au 3D
Project Neo, le dernier outil lancé par Adobe, est une technologie 3D révolutionnaire qui améliore les effets visuels et l'efficacité de production des conceptions graphiques 2D traditionnelles grâce à l'intégration d'éléments et d'effets 3D. Grâce à sa fonction de création d'illustrations rapide et efficace, les utilisateurs peuvent facilement créer des formes 3D uniques, ce qui améliore considérablement l'efficacité du travail. Project Neo possède de puissantes fonctions de stylisation et de modélisation, et ses fonctions de contrôle des couleurs améliorées permettent aux utilisateurs d'ajuster finement les couleurs intermédiaires et les ombres, ajoutant de la profondeur et du caractère géométrique aux œuvres de conception.
【Résumé AiBase :】
✨ Révolution de la technologie 3D, amélioration de l'efficacité de la conception 2D.
🎨 Création rapide d'illustrations, création facile de formes uniques.
🖌️ Puissantes fonctions de stylisation, ajustement précis des couleurs et des ombres.
Lien détaillé : https://top.aibase.com/tool/project-neo
6. Le projet d'IA d'Apple dévoilé : un Siri plus intelligent arrive bientôt
Apple s'efforce d'améliorer Siri en utilisant des modèles plus petits et plus efficaces, et prévoit de rendre Siri capable de répondre intelligemment sans mot de réveil à l'avenir. L'IA d'Apple présente de nombreuses applications potentielles dans les domaines de la santé, de l'édition d'images et des Memojis, et la stratégie d'IA de l'entreprise devient de plus en plus claire.
【Résumé AiBase :】
⭐ Apple s'efforce d'améliorer Siri en utilisant des modèles plus petits et plus efficaces.
⭐ Siri pourrait à l'avenir répondre intelligemment sans mot de réveil.
⭐ L'IA d'Apple présente de nombreuses applications potentielles dans les domaines de la santé, de l'édition d'images et des Memojis.
7. VILA : un modèle multimodal capable de comprendre la vidéo, compatible avec les ordinateurs portables
VILA est un modèle de langage visuel publié par Nvidia, doté de fonctions de compréhension vidéo et de compréhension d'images multiples. La dernière version, VILA-1.5, prend en charge le choix de plusieurs tailles de modèles et peut être déployée efficacement sur divers GPU Nvidia grâce aux backends TinyChat et TensorRT-LLM.
【Résumé AiBase :】
💡 VILA est un modèle de langage visuel pré-entraîné sur des données d'images et de textes largement entrelacées.
💡 Lancement de VILA-1.5, doté d'une fonction de compréhension vidéo et prenant en charge le choix de plusieurs tailles de modèles.
💡 VILA peut être déployé efficacement sur divers GPU Nvidia grâce aux backends TinyChat et TensorRT-LLM.
Lien détaillé : https://top.aibase.com/tool/vila
8. ChatRTX d'Nvidia introduit plusieurs nouvelles fonctionnalités
La dernière mise à jour de ChatRTX d'Nvidia introduit plusieurs nouvelles fonctionnalités, notamment la prise en charge d'un plus grand nombre de grands modèles de langage, le pré-entraînement d'images de langage contrastif et le système de reconnaissance vocale Whisper, améliorant considérablement les capacités des applications de chatbot. Cette mise à jour témoigne de l'innovation continue d'Nvidia dans les domaines de l'IA et de la technologie d'accélération RTX, offrant aux utilisateurs une expérience plus intelligente et interactive.
【Résumé AiBase :】
✨ ChatRTX prend en charge davantage de grands modèles de langage, notamment Gemma de Google et ChatGLM3 bilingue chinois-anglais, élargissant les capacités de traitement du langage.
🔍 ChatRTX prend en charge le pré-entraînement d'images de langage contrastif (CLIP) d'OpenAI, permettant aux utilisateurs d'interagir par le biais de texte avec des photos et des images sur leurs appareils locaux.
🎙 ChatRTX prend en charge le système de reconnaissance vocale Whisper, permettant aux utilisateurs d'interagir avec ChatRTX par la voix, améliorant ainsi l'expérience utilisateur.
Lien détaillé : https://blogs.nvidia.com/blog/ai-decoded-chatrtx-update/
9. Brilliant Labs lance Frame : des lunettes AR open source intégrant l'IA
Brilliant Labs a récemment lancé Frame, des lunettes AR open source qui combinent l'intelligence artificielle (IA) et la réalité augmentée (AR) pour offrir aux utilisateurs une expérience interactive sans précédent. Les lunettes Frame possèdent de puissantes capacités visuelles, collectant et analysant en temps réel les données d'images vues par l'utilisateur, et fournissant des réponses détaillées aux questions grâce à des modèles d'IA avancés, améliorant ainsi la compréhension et l'interaction de l'utilisateur avec son environnement. Prise en charge de l'interaction multimodale, fonction de traduction en temps réel, et combinaison avec l'assistant IA Noa dans le cloud pour des fonctionnalités AR plus puissantes.
【Résumé AiBase :】
👓 Les lunettes Frame combinent l'IA et la RA pour offrir une expérience interactive sans précédent.
🔍 Frame possède de puissantes capacités visuelles, analysant en temps réel les données d'images vues par l'utilisateur.
🗣️ Prise en charge de l'interaction multimodale, fonction de traduction en temps réel, et combinaison avec l'assistant IA Noa dans le cloud pour des fonctionnalités AR plus puissantes.
Lien détaillé : https://brilliant.xyz/
10. Rabbit R1 : analyse approfondie ; changement de cap soudain dans le secteur de l'IA, les utilisateurs ayant rechargé des NFT sont en larmes, le modèle de grand mouvement est également une copie conforme
Cet article révèle le parcours de transformation de Rabbit dans le contexte de l'essor de l'IA, ainsi que les difficultés rencontrées par les utilisateurs ayant rechargé des NFT. L'article indique que le grand modèle de mouvement LAM de l'entreprise, qui repose sur l'interface OpenAI, est accusé d'être une copie conforme d'Android. Parallèlement, la transformation de l'entreprise du métavers aux terminaux IA suscite des doutes et attire l'attention des utilisateurs.
【Résumé AiBase :】
🔍 Rabbit change de cap soudain dans le secteur de l'IA, les utilisateurs ayant rechargé des NFT rencontrent des difficultés.
💥 Le grand modèle de mouvement LAM de l'entreprise, qui repose sur l'interface OpenAI, est accusé d'être une copie conforme d'Android.
🔄 L'entreprise passe du métavers aux terminaux IA, ce qui suscite des doutes et attire l'attention des utilisateurs.
Lien détaillé : https://twitter.com/EmilyLShepherd/status/1786037498507853852