Bienvenue à la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en mettant l'accent sur les développeurs et en vous aidant à comprendre les tendances technologiques et les applications innovantes des produits d'IA.
Nouveaux produits IA Cliquez ici pour en savoir plus : https://top.aibase.com/
1. Apple WWDC lâche une bombe : Siri enrichie par GPT-4o, toute la gamme passe à l'IA générative
Lors de la Worldwide Developers Conference (WWDC) 2024, Apple a annoncé que toute sa gamme de produits allait entrer dans l'ère de l'IA générative, en lançant le nouveau système intelligent personnalisé Apple Intelligence. Le cœur de la mise à jour est un service intelligent combinant des modèles d'IA générative et les données utilisateur, profondément intégré à iOS18, iPadOS18 et macOS Sequoia. Siri est révolutionné, bénéficiant d'une compréhension du langage plus riche et de la capacité d'exécuter des opérations inter-applications. Le système intègre ChatGPT pour offrir des fonctionnalités de compréhension d'images et de documents, ainsi que de nouveaux outils d'écriture et Image Playground.
【AiBase en bref :】
🍎 Apple Intelligence intègre des modèles d'IA générative et les données utilisateur pour fournir des services intelligents pratiques, profondément intégrés à iOS18, iPadOS18 et macOS Sequoia.
🤖 Siri est révolutionné, avec une compréhension du langage plus riche et la capacité d'exécuter des opérations inter-applications. Les utilisateurs peuvent interagir avec Siri par texte.
📸 Le système intègre ChatGPT pour offrir des fonctionnalités de compréhension d'images et de documents, ainsi que de nouveaux outils d'écriture et Image Playground, permettant aux utilisateurs de créer des animations, des illustrations ou des images de style croquis.
Plus de détails : https://www.chinaz.com/2024/0611/1622511.shtml
2. Apple collabore avec le modèle Gemini de Google
Apple a annoncé un partenariat avec le modèle Gemini de Google, ouvrant l'accès à des modèles tiers pour offrir plus de choix aux utilisateurs. Siri intégrera ChatGPT, permettant aux utilisateurs de converser sans quitter Siri, tout en conservant le contrôle de leur vie privée. Apple met à jour son kit de développement logiciel, intégrant pour la première fois ChatGPT d'OpenAI, et lance une série de nouvelles fonctionnalités et mises à jour.
【AiBase en bref :】
🍎 Apple collabore avec le modèle Gemini de Google, ouvrant l'accès à des modèles tiers pour élargir son écosystème d'intelligence artificielle.
🤖 Siri intègre ChatGPT, permettant aux utilisateurs de converser au sein de Siri, tout en conservant le contrôle de leur vie privée.
🚀 Apple met à jour son kit de développement logiciel, intégrant pour la première fois ChatGPT d'OpenAI, et lance de nouvelles fonctionnalités pour iOS18 et VisionOS2.
3. Application Photos d'iOS18 remaniée : suppression et filtrage intelligents par IA pour affiner les recherches
Dans la dernière version d'iOS18, Apple a entièrement repensé la fonctionnalité de messagerie. Les utilisateurs peuvent non seulement ajouter des soulignements et des barrages à leurs messages, mais aussi appliquer une série d'effets de texte dynamiques pour personnaliser chaque message.
【AiBase en bref :】
⭐️ Apple et OpenAI ont conclu un accord de partenariat, et iOS18 intégrera les fonctionnalités de ChatGPT.
🤖 Les informations générées par GPT-4 sont pertinentes pour les performances boursières futures.
💬 iPadOS18 prend en charge non seulement les fonctionnalités de personnalisation d'iOS18, mais aussi les barres d'outils personnalisées dans les applications.
Modèles d'appareils compatibles avec la mise à jour iOS18 : https://www.chinaz.com/2024/0611/1622488.shtml
4. Tencent lance le nouveau modèle de génération de vidéos à partir d'images Follow-Your-Pose-v2
Cet article présente le nouveau modèle de génération de vidéos à partir d'images « Follow-Your-Pose-v2 », développé par l'équipe Hun Yuan de Tencent en collaboration avec l'Université Sun Yat-sen et l'Université de Hong Kong. Il permet la génération de mouvements vidéo pour plusieurs personnes, une forte capacité de généralisation et une gestion correcte des occultations de personnages. Ce modèle est d'une importance capitale dans le domaine de la génération de vidéos et présente des perspectives d'application vastes.
【AiBase en bref :】
🌟 Prise en charge de la génération de mouvements vidéo pour plusieurs personnes, avec un temps d'inférence réduit.
🔥 Forte capacité de généralisation, quel que soit l'âge, les vêtements, l'origine ethnique, la complexité de l'arrière-plan ou la complexité des mouvements, des vidéos de haute qualité sont générées.
💡 Gestion correcte des occultations de personnages, permettant de générer des images d'occultation avec une relation avant-arrière correcte.
Page du projet : https://top.aibase.com/tool/follow-your-pose
Adresse de l'article : https://arxiv.org/pdf/2406.03035
5. MotionFollower : reproduire les mouvements d'un personnage sans modifier l'arrière-plan de la vidéo
MotionFollower est une technologie innovante qui permet de reproduire le mouvement d'une vidéo sur un personnage d'une autre vidéo, sans modifier l'apparence du personnage. Cette technologie a de nombreuses applications, notamment dans la production cinématographique, la création publicitaire et le développement de jeux vidéo.
【AiBase en bref :】
⚙️ MotionFollower est une technologie innovante qui reproduit le mouvement d'une vidéo sur un autre personnage, sans modifier son apparence.
🌐 Applications nombreuses : cinéma, publicité, jeux vidéo, etc.
🎥 MotionFollower traite les vidéos avec de grands mouvements de caméra et permet un transfert d'informations de mouvement de haute qualité.
Lien détaillé : https://top.aibase.com/tool/motionfollower
6. Adobe révise ses conditions d'utilisation et précise qu'il n'utilisera pas les œuvres des clients pour l'entraînement de l'IA
Adobe a annoncé une révision de ses conditions d'utilisation pour préciser qu'il n'utilisera pas les œuvres de ses clients pour l'entraînement de l'IA, dans le but de regagner la confiance des utilisateurs. Ce changement fait suite aux vives protestations des utilisateurs la semaine précédente.
【AiBase en bref :】
🛡️ Adobe révise ses conditions d'utilisation pour préciser qu'il n'utilisera pas les œuvres des clients pour l'entraînement de l'IA.
💬 Le PDG d'Adobe reconnaît qu'il aurait dû clarifier plus tôt les conditions d'utilisation et promet plus de transparence.
🖼️ Les craintes des créateurs à l'égard d'Adobe persistent, et l'entreprise s'efforce de regagner leur confiance.
7. OpenAI améliore la fonction vocale de ChatGPT pour lui permettre de parler avec différentes voix
OpenAI a récemment mis à jour la fonction vocale de ChatGPT, permettant aux utilisateurs d'interagir avec le chatbot en utilisant diverses voix et styles vocaux générés par l'IA. Cette nouvelle fonctionnalité permet aux utilisateurs d'indiquer au chatbot IA d'utiliser n'importe quelle voix pour répondre en temps réel, améliorant ainsi l'interactivité et l'accessibilité.
【AiBase en bref :】
🔊 ChatGPT propose actuellement quatre voix prédéfinies, avec la possibilité d'optimiser le style vocal en temps réel.
🗣️ Les utilisateurs peuvent demander à l'IA de doubler les personnages d'une histoire, générant des voix uniques, comme le rugissement d'un lion.
🔜 OpenAI lancera de nouvelles fonctionnalités vocales dans les prochaines semaines, disponibles pour tous les utilisateurs de ChatGPT, avec un accès prioritaire pour les abonnés premium.
8. Surclassant Instant3D ! L'Université Jiao Tong de Shanghai lance le nouveau framework Bootstrap3D pour améliorer considérablement les capacités de génération 3D
L'équipe de recherche de l'Université Jiao Tong de Shanghai et de l'Université chinoise de Hong Kong a lancé un nouveau framework appelé Bootstrap3D. En combinant un grand modèle multimodal 3D perceptif finement ajusté, il peut générer automatiquement des données d'images multi-vues de haute qualité, améliorant considérablement les capacités des modèles de génération 3D. L'ensemble de données synthétique du framework est entièrement open source et disponible gratuitement pour les chercheurs et les développeurs. Les caractéristiques clés du framework incluent le pipeline de construction de données, la génération d'invites textuelles, la génération d'images, la synthèse multi-vues, le filtrage de la qualité et la réécriture des descriptions. L'équipe de recherche a également proposé une stratégie de réarrangement des timesteps d'entraînement (TTR) pour optimiser les différentes phases du processus de débruitage et résoudre les problèmes d'entraînement des modèles de diffusion multi-vues. Les résultats expérimentaux montrent que les modèles de diffusion multi-vues utilisant la stratégie TTR surpassent les autres modèles en termes d'alignement texte-image, de qualité d'image et de cohérence des vues, améliorant efficacement l'effet de génération multi-vues.
【AiBase en bref :】
🔑 Pipeline de construction de données : génération automatique de données d'images multi-vues et de descriptions textuelles détaillées, l'une des innovations clés du framework.
🔑 Génération d'invites textuelles : utilisation de grands modèles linguistiques pour générer des invites textuelles créatives et diversifiées, fournissant du matériel pour la génération d'images.
🔑 Synthèse multi-vues : extension des images monoculaires en images multi-vues, garantissant la cohérence entre les différents points de vue.
Lien détaillé : https://top.aibase.com/tool/bootstrap3d
9. Google lance le framework AGREE pour améliorer la précision du contenu généré par les grands modèles linguistiques
Les chercheurs de Google ont lancé le framework AGREE, visant à améliorer la précision du contenu et des références générées par les grands modèles linguistiques. Ce framework améliore la précision des réponses en récupérant les passages pertinents et fournit aux utilisateurs un moyen de vérifier l'authenticité des informations. Les technologies clés incluent le réglage fin en phase d'entraînement et l'adaptation au moment du test. Les résultats expérimentaux montrent qu'AGREE excelle dans l'amélioration de la précision et de la référence du contenu des réponses.
【AiBase en bref :】
🔍 Le framework AGREE vise à améliorer la précision du contenu et des références générées par les grands modèles linguistiques.
🎯 Les technologies clés incluent le réglage fin en phase d'entraînement et l'adaptation au moment du test.
💡 Les résultats expérimentaux montrent qu'AGREE excelle dans l'amélioration de la précision et de la référence du contenu des réponses.
Lien détaillé : https://arxiv.org/pdf/2311.09533
10. Fenbi lancera son propre professeur d'IA intelligent en août
Le groupe Fenbi lancera son propre professeur d'IA intelligent en août 2024. Il s'agira d'un outil d'apprentissage par l'IA proposé sur sa plateforme en ligne, initialement utilisé pour les cours de préparation aux examens nationaux ou provinciaux et aux certifications professionnelles.
【AIBase en bref :】
⭐️ Le groupe Fenbi lancera son propre professeur d'IA intelligent en août 2024.
⭐️ Le professeur d'IA intelligent sera l'un des outils d'apprentissage par l'IA proposés sur la plateforme en ligne de Fenbi.
⭐️ Il sera initialement utilisé pour les cours de préparation aux examens nationaux ou provinciaux et aux certifications professionnelles.