Bienvenue sur la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités brûlantes du domaine de l'IA, en mettant l'accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits IA.

Nouveaux produits IA Cliquez pour en savoir plus :https://top.aibase.com/

1、Capacité de génération d'images dépassant Flux1.1Pro ! Le mystérieux modèle d'IA « Panda rouge » Red_panda fait son apparition

Un mystérieux modèle de génération d'images IA nommé red_panda a affiché des performances étonnantes lors des tests de référence d'Artificial Analysis, surpassant les produits des leaders du secteur. Avec un score de 1244 points au test de conversion texte-image, il a démontré son avantage technologique et son efficacité. Le réalisme des images générées par Red_panda dépasse celui des œuvres IA traditionnelles, témoignant d'une excellente compréhension et d'une capacité d'exécution des invites textuelles. L'arrivée de Red_panda a contribué à rehausser les normes du secteur et a suscité un vif intérêt.

1.png

【Résumé AiBase :】

🚀 Le modèle IA Panda rouge a obtenu le meilleur score aux tests de référence, avec 1244 points, surpassant les produits des leaders du secteur.

💡 Les images générées par Panda rouge présentent un réalisme exceptionnel, dépassant les œuvres IA traditionnelles.

🔗 L'arrivée de Panda rouge a contribué à rehausser les normes du secteur et a suscité un vif intérêt.

Lien détaillé : https://artificialanalysis.ai/text-to-image/arena

2、xAI ajoute une fonction de compréhension d'images à Grok, capable de comprendre l'humour des mèmes

xAI, la société de Musk, a récemment ajouté une fonction de compréhension d'images à son modèle IA Grok. Les utilisateurs peuvent désormais télécharger des images et poser des questions à l'assistant IA. Musk a présenté les nouvelles capacités de Grok, notamment sa compréhension du contenu des images et des éléments humoristiques. La fonction est encore en phase de développement, et l'équipe continuera à l'améliorer. xAI, en collaboration avec le Black Forest Lab, a ajouté une fonction de compréhension multimodale, améliorant ainsi l'expérience utilisateur et l'API des développeurs.

QQ20241029-104045.png

【Résumé AiBase :】

✨ Fonction de compréhension d'images : Grok peut désormais comprendre le contenu des images et les éléments humoristiques.

🚀 Extension des fonctionnalités : depuis le lancement du modèle Grok-2, xAI n'a cessé d'étendre ses fonctionnalités, en collaboration avec le modèle FLUX.1 pour la génération d'images.

🔥 Amélioration de l'expérience utilisateur : l'ajout d'une fonction de compréhension multimodale, Musk s'engage à répondre rapidement aux besoins de traitement de documents.

3、Encore une fois, on va s'amuser ! Mise à jour de PixVerse V3 : non seulement pour créer des avatars IA, mais aussi pour donner des jambes aux tasses

La version V3 de PixVerse apporte des améliorations complètes, offrant aux créateurs une expérience plus professionnelle et plus amusante. Des effets vidéo aux fonctionnalités de style en passant par l'extension vidéo, toutes les améliorations sont significatives, offrant aux créateurs de contenu une plateforme de création vidéo plus complète et plus professionnelle.

【Résumé AiBase :】

✨ Amélioration des effets vidéo : ajout d'effets sur le thème d'Halloween, simples et intuitifs, enrichissant les ressources créatives pour les fêtes.

🎨 Amélioration des fonctionnalités de style : prise en charge de quatre styles : anime, animation 3D, argile et réaliste, applicables à différents contextes.

🔥 Fonction d'extension vidéo : les utilisateurs peuvent ajouter 5 à 8 secondes de contenu supplémentaire, contrôlant précisément l'évolution des nouveaux segments et générant des séquences d'actions cohérentes.

Lien détaillé : https://app.pixverse.ai/home

4、Google lance une fonction IA sur la version web de Gmail : « Aidez-moi à écrire », pour une rédaction et une amélioration des e-mails plus faciles

Google a lancé la fonction « Aidez-moi à écrire » sur la version web de Gmail, utilisant Gemini IA pour aider les utilisateurs à rédiger et à modifier leurs e-mails, améliorant ainsi la commodité et l'efficacité de la rédaction des e-mails. Cette fonction est réservée aux abonnés à Google One AI Premium ou aux utilisateurs disposant du plug-in Gemini Workspace, offrant une expérience de rédaction d'e-mails personnalisée. Le raccourci « Améliorer » nouvellement ajouté permet aux utilisateurs d'optimiser rapidement le contenu de leurs e-mails, améliorant ainsi la qualité des e-mails.

image.png

【Résumé AiBase :】

🌟 La fonction « Aidez-moi à écrire » est disponible sur la version web de Gmail, utilisant Gemini IA pour aider les utilisateurs à rédiger et à modifier leurs e-mails.

🔑 Réservé aux abonnés à Google One AI Premium ou aux utilisateurs disposant du plug-in Gemini Workspace.

⚡ Nouveau raccourci « Améliorer » pour permettre aux utilisateurs d'optimiser rapidement le contenu de leurs e-mails.

5、Un outsider dans le domaine de la compréhension vidéo ! Le modèle Video-XL peut traiter des vidéos d'une heure de durée !

Video-XL est un modèle de langage visuel ultralong conçu pour une compréhension vidéo efficace à l'échelle de l'heure. Il utilise la technique de « résumé latent du contexte visuel » pour compresser le contenu des longues vidéos sous une forme concise, améliorant ainsi l'efficacité tout en conservant les informations clés. Il a obtenu d'excellents résultats lors de plusieurs tests de référence de compréhension de vidéos longues, atteignant un équilibre entre efficacité et performance. Ses perspectives d'application sont vastes, notamment pour le résumé de films, la détection d'anomalies de surveillance et l'identification d'insertions publicitaires.

【Résumé AiBase :】

🚀 Video-XL est un modèle de langage visuel ultralong conçu pour traiter des vidéos très longues, utilisant la technique de résumé latent du contexte visuel pour compresser le contenu vidéo.

💡 Video-XL a obtenu des résultats de pointe lors de plusieurs tests de référence de compréhension de vidéos longues, notamment une précision supérieure de près de 10 % au test VNBench.

⚙️ Video-XL atteint un équilibre entre efficacité et performance, traitant des vidéos de 2048 images sur un seul GPU de 80 Go tout en maintenant une précision de près de 95 %.

Lien détaillé : https://github.com/VectorSpaceLab/Video-XL

6、Apple confirme la sortie d'iOS 18.2 en décembre, avec l'intégration de ChatGPT à Siri

Apple a annoncé la sortie en décembre des mises à jour iOS 18.2, iPadOS 18.2 et macOS Sequoia 15.2, introduisant des améliorations révolutionnaires en matière d'IA, notamment l'intégration de ChatGPT à Siri pour la première fois, offrant aux utilisateurs une expérience plus intelligente et plus pratique. Le système met l'accent sur la protection de la vie privée des utilisateurs, associant des technologies IA de pointe et des avantages matériels, démontrant les ambitions d'Apple dans le domaine de l'IA.

image.png

【Résumé AiBase :】

🔍 ChatGPT sera intégré à Siri pour la première fois, les utilisateurs pourront l'utiliser gratuitement sans avoir besoin de créer un compte supplémentaire.

📝 ChatGPT sera intégré aux outils d'écriture système, améliorant ainsi les capacités de création.

🔒 Apple met en œuvre des mesures de sécurité strictes pour protéger la vie privée des utilisateurs, sans conserver les enregistrements d'utilisation de ChatGPT.

7、Selon des informations, Meta développe son propre moteur de recherche IA pour réduire sa dépendance à Google

Récemment, selon des informations, Meta est en train de développer un nouveau moteur de recherche d'intelligence artificielle afin de réduire sa dépendance à Google et à Microsoft. Cette initiative fournira à ses robots conversationnels des résumés d'actualité générés par IA, approfondissant ainsi son implication dans l'accès à l'information. La concurrence entre les géants de la technologie s'intensifie, Meta, Apple, OpenAI et d'autres sociétés lançant des produits innovants pour répondre aux besoins des utilisateurs.

【Résumé AiBase :】

🌐 Meta développe un moteur de recherche IA pour réduire sa dépendance à Google.

🤖 Le nouveau moteur de recherche fournira à ses robots conversationnels des résumés d'actualité générés par IA.

📰 Meta a conclu un partenariat avec Reuters afin de permettre à ses robots conversationnels d'utiliser ses articles d'actualité pour répondre aux questions.

8、Zhiyuan lance OmniGen, un modèle de génération visuelle polyvalent intégrant de nombreuses capacités

L'Institut de recherche sur l'intelligence artificielle de Pékin (BAAI) a lancé OmniGen, un nouveau modèle de génération visuelle polyvalent, marquant une avancée majeure dans le domaine de la génération d'images. OmniGen se caractérise par son uniformité, sa simplicité et sa capacité de transfert de connaissances intertâches, capable de gérer diverses tâches de génération d'images, notamment la génération d'images à partir de texte, l'édition d'images, la génération pilotée par des thèmes et la génération conditionnelle visuelle. L'architecture simplifiée du modèle et son utilisation conviviale, sans plug-in ni étapes complexes, permettent un transfert de connaissances efficace entre les tâches, démontrant des fonctionnalités innovantes.

image.png

【Résumé AiBase :】

🌟 Le modèle OmniGen intègre de nombreuses capacités et gère diverses tâches de génération d'images.

🔑 L'architecture simplifiée du modèle et son utilisation conviviale, sans plug-in supplémentaire, permettent de réaliser des tâches complexes.

💡 OmniGen publie les poids et le code en open source, créant un ensemble de données de génération d'images unifiées à grande échelle X2I, stimulant le développement du domaine de la génération d'images universelle.

Lien détaillé : https://arxiv.org/pdf/2409.11340

9、Projet open source révolutionnaire : des avatars numériques légers pouvant fonctionner sur les téléphones portables sont disponibles

Récemment, un projet open source nommé Ultralight-Digital-Human a réussi à résoudre le problème du déploiement de la technologie des avatars numériques sur les appareils mobiles, permettant aux smartphones ordinaires d'exécuter des applications d'avatars numériques en temps réel, ouvrant de nouvelles possibilités pour la popularisation de ces technologies. Ce projet utilise des techniques innovantes d'apprentissage profond, grâce à l'optimisation des algorithmes et à la compression des modèles, réussissant à réduire la taille du système d'avatars numériques afin qu'il puisse fonctionner en douceur sur les appareils mobiles.

【Résumé AiBase :】

🔑 Des techniques innovantes d'apprentissage profond permettent aux avatars numériques de fonctionner en douceur sur les appareils mobiles.

🔑 Intégration des solutions d'extraction de caractéristiques audio Wenet et Hubert, améliorant l'effet de synchronisation labiale des avatars numériques.

🔑 Fournit une documentation complète sur le processus de formation, permettant aux développeurs de former facilement leurs propres modèles d'avatars numériques.

Lien détaillé : https://github.com/anliyuan/Ultralight-Digital-Human

10、Universal Music et une société d'IA collaborent pour créer KLayMM, un modèle de génération de musique IA « éthique »

Universal Music Group et Klay Vision ont collaboré pour développer KLayMM, un modèle de génération de musique IA éthique, visant à promouvoir la création musicale IA durable. Cette collaboration marque l'importance accordée par l'industrie musicale aux technologies IA et présente de nouvelles orientations pour la création musicale.

【Résumé AiBase :】

🎶 UMG et Klay Vision collaborent pour lancer KLayMM, dans le respect des droits d'auteur et des droits des artistes.

🤝 Le modèle collaborera avec l'industrie musicale pour garantir l'attribution précise et le développement durable du contenu IA.

🌍 Klay Vision crée un écosystème mondial pour promouvoir la création musicale IA et la monétisation des droits d'auteur.

11、Apple lance le nouvel iMac équipé de la puce M4, Apple Intelligence déverrouille davantage de possibilités pour les Mac

Apple a lancé le nouvel iMac, équipé de la puissante puce M4 et d'Apple Intelligence, conservant un design ultra-fin. Le nouvel iMac sera officiellement lancé le 8 novembre, à partir de 1299 $. La puce M4 apporte une amélioration significative des performances, avec une augmentation de 1,7 fois de la productivité quotidienne et une augmentation de 2,1 fois de la vitesse de traitement pour l'édition de photos et les jeux. Apple Intelligence offre une toute nouvelle expérience, combinant des modèles génératifs et des fonctionnalités de protection de la vie privée pour déverrouiller de nouvelles façons d'utiliser les Mac.

image.png

【Résumé AiBase :】

🚀 La puce M4 apporte une amélioration significative des performances, avec une augmentation de 1,7 fois de la productivité quotidienne et une augmentation de 2,1 fois de la vitesse de traitement pour l'édition de photos et les jeux.

💡 Apple Intelligence combine des modèles génératifs et des fonctionnalités de protection de la vie privée pour offrir aux utilisateurs de nouvelles façons d'utiliser les Mac.

🎨 Le nouvel iMac est disponible en sept couleurs vives, avec un écran Retina 4,5K de 24 pouces, une caméra Center Stage de 12 mégapixels, etc.

12、Zhou Hongyi : L'IA ne doit pas devenir un dieu suprême, mais plutôt un œuf au thé pour les humains