Bienvenue sur la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en mettant l'accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits IA.
Nouveaux produits IA Cliquez ici pour en savoir plus :https://top.aibase.com/
1、Luma présente en vidéo les caractéristiques de son modèle Dream Machine
Après avoir visionné la vidéo de présentation du modèle Dream Machine de Luma, je trouve que cet outil de génération de vidéos IA est extrêmement puissant. Il offre non seulement une sortie vidéo de haute qualité, mais comprend également rapidement les instructions de l'utilisateur pour générer du contenu vidéo conforme à un style esthétique. Ceci est très utile pour le processus d'itération créative, rendant la génération de vidéos plus efficace.
【AiBase en bref :】
🌟 Haute qualité vidéo, résolution jusqu'à 1024 pixels.
🎨 Comprend les instructions pour générer des vidéos conformes à un style esthétique.
⚡ Vitesse d'inférence rapide, idéale pour une itération créative rapide.
Lien détaillé :https://top.aibase.com/tool/dream-machine
2、Lancement du nouveau projet de vidéos synchronisées Hallo : contrôle précis des expressions et de la synchronisation labiale
Le nouveau projet de vidéos synchronisées Hallo est lancé. Il génère des vidéos de chant et de parole à partir d'une seule image et d'une entrée audio, permettant un contrôle précis des expressions et des postures du visage, et améliorant la précision de l'alignement entre l'entrée vocale et l'animation générée. Cette technologie peut être utilisée non seulement pour la génération d'animations de personnages virtuels, mais aussi pour des personnages réels, prenant en charge plusieurs contrôles de mouvement, des applications inter-acteurs et la génération d'animations de chant. Technologie avancée, animation réaliste, potentiel d'application large.
【AiBase en bref :】
⭐️ Génère des vidéos de chant et de parole à partir d'une seule image et d'une entrée audio.
⭐️ Prend en charge la génération d'animations de personnages virtuels et réels, le projet est open source.
⭐️ Plusieurs contrôles de mouvement, permettant un contrôle précis des expressions et des postures, améliorant la diversité et le réalisme de l'animation.
Adresse du projet :https://top.aibase.com/tool/hallo
3、L'Université de Pékin et Kuaishou lancent conjointement le framework de génération de vidéos VideoTetris : des résultats de génération de vidéos complexes surpassant Pika
Cet article présente la collaboration entre l'Université de Pékin et l'équipe IA de Kuaishou pour résoudre les problèmes de génération de vidéos complexes, en proposant le framework VideoTetris, qui surpasse avec succès les modèles commerciaux Pika et Gen-2. Ce framework définit des tâches de génération de vidéos combinées, prend en charge les instructions complexes et la génération de longues vidéos, tout en conservant les informations de position et les caractéristiques détaillées. L'équipe a utilisé une méthode de diffusion spatio-temporelle combinée, optimisé le prétraitement des données d'entraînement et introduit un mécanisme d'attention des images de référence, pour générer des vidéos plus dynamiques et naturelles.
【AiBase en bref :】
⭐ Le framework VideoTetris résout avec succès les problèmes de génération de vidéos complexes, surpassant les modèles commerciaux Pika et Gen-2.
⭐ Définit des tâches de génération de vidéos combinées, prend en charge les instructions complexes et la génération de longues vidéos, tout en conservant les informations de position et les caractéristiques détaillées.
⭐ Utilise une méthode de diffusion spatio-temporelle combinée, optimise le prétraitement des données d'entraînement et introduit un mécanisme d'attention des images de référence, pour générer des vidéos plus dynamiques et naturelles.
Lien détaillé :https://top.aibase.com/tool/videotetris
4、Un artiste IA japonais ressuscite sa femme grâce à Luma : les internautes en larmes
Cet article raconte comment Matsuo Koyo, un artiste IA de 65 ans, a utilisé la technologie pour ressusciter sa femme décédée il y a 11 ans, Tori-chan, émouvant d'innombrables personnes. Grâce à la technologie IA, il a réarrangé et enregistré les chansons de sa femme, créé des vidéos dynamiques et extrait et traduit ses lettres, exprimant ainsi sa nostalgie et son amour pour sa femme. Il s'agit d'une histoire d'un homme ordinaire utilisant la technologie pour réaliser un rêve, montrant la puissance et la chaleur de l'amour à l'ère de l'IA.
【AiBase en bref :】
🌟 Matsuo Koyo a ressuscité sa femme Tori-chan, décédée il y a 11 ans, grâce à l'IA Dream Machine de Luma, émouvant le public.
🎶 Grâce à la technologie IA, il a réarrangé et enregistré les chansons de sa femme, et créé des vidéos dynamiques, montrant sa profonde nostalgie pour elle.
💖 Grâce à des outils IA, il a extrait et traduit les lettres que sa femme lui avait écrites, exprimant un amour intense et une nostalgie éternelle pour elle.
Accès au produit :https://top.aibase.com/tool/luma-ai
Article détaillé :https://www.chinaz.com/ainews/9623.shtml
5、Apple pourrait retarder le lancement de son IA, les développeurs devront attendre la fin de l'été pour pouvoir effectuer des tests
Selon Bloomberg, le projet d'intelligence artificielle (IA) d'Apple sera un processus long et lent. Le projet Apple Intelligence annoncé la semaine dernière par Apple devrait être disponible pour les tests des développeurs plus tard à la fin de l'été. Cela signifie qu'il ne fera pas partie des premières versions bêta de la nouvelle mise à jour du système d'exploitation Apple, et qu'une seule version d'aperçu sera disponible à l'automne.
【AiBase en bref :】
🍏 Le projet d'intelligence artificielle (IA) d'Apple sera disponible pour les tests des développeurs plus tard à la fin de l'été.
📉 Le projet Apple ne fera pas partie des premières versions bêta de la nouvelle mise à jour du système d'exploitation.
💬 Le projet Apple Intelligence modifiera la façon dont les consommateurs interagissent avec leurs appareils et achètent des produits.
6、KREA AI lance une fonction d'amélioration vidéo : amélioration de la qualité vidéo en un clic
Cet article présente la fonction d'amélioration vidéo « Enhancer » lancée par KREA AI, qui permet d'améliorer la qualité des images et des vidéos, et prend en charge des résolutions et des fréquences d'images plus élevées. Les utilisateurs peuvent facilement télécharger l'image/vidéo cible à améliorer, KREA AI effectuera un traitement en ligne, et générera finalement une vidéo de haute qualité.
【AiBase en bref :】
⭐ La fonction Enhancer est ouverte à tous et permet d'améliorer la qualité des images et des vidéos.
⭐ Peut être utilisée avec des outils vidéo IA, après le traitement, vous pouvez directement visualiser la comparaison avant/après sur la page.
⭐ Peut générer des vidéos jusqu'à 2,5x pixels et des fréquences d'images jusqu'à 120 fps.
Accès au produit :https://top.aibase.com/tool/krea-ai
7、Collaboration entre Tsinghua et Pékin pour le lancement d'un test de référence pour la compréhension de vidéos longues : LVBench
Cet article présente le projet de test de référence pour la compréhension de vidéos longues LVBench, lancé en collaboration par Zhipu, l'Université Tsinghua et l'Université de Pékin, visant à combler les lacunes des grands modèles linguistiques multimodaux actuels dans le traitement des longues vidéos. Ce projet contient des données QA de plusieurs heures et de plusieurs catégories, couvrant différents types de contenu vidéo, dans le but de promouvoir les avancées technologiques et l'innovation dans le domaine des longues vidéos. De nombreux organismes de recherche ont déjà entrepris des travaux sur l'ensemble de données LVBench, insufflant une nouvelle vitalité au domaine de la compréhension vidéo et de l'apprentissage multimodale.
【AiBase en bref :】
🔍 Le projet LVBench est un projet de test de référence pour la compréhension de vidéos longues, contenant des données QA de plusieurs heures et de plusieurs catégories.
💡 L'ensemble de données LVBench couvre plusieurs tâches, telles que le résumé vidéo, la détection d'événements, la reconnaissance de personnages et la compréhension de scènes.
🚀 Le lancement de la référence LVBench permettra de promouvoir les avancées technologiques et l'innovation, insufflant une nouvelle dynamique au développement du domaine des longues vidéos.
Lien détaillé :https://github.com/THUDM/LVBench
8、Modèle de génération de maillage MeshAnything : conversion de n'importe quel objet 3D en maillage créé par un artiste
Récemment, les actifs 3D créés par reconstruction et génération ont atteint le niveau de qualité des actifs faits à la main, soulignant leur potentiel dans les domaines de remplacement. MeshAnything est un modèle autorégressif pour générer des maillages 3D créés par des artistes, en utilisant un transformateur de décodeur uniquement conditionné par VQ-VAE et la forme, pour générer des maillages de haute qualité. Cette méthode améliore considérablement l'efficacité du stockage, du rendu et de la simulation, tout en maintenant une précision comparable aux méthodes précédentes.
【AiBase en bref :】
⚙️ MeshAnything utilise un modèle autorégressif pour générer des maillages 3D de haute qualité créés par des artistes.
🔍 Les maillages de MeshAnything améliorent l'efficacité du stockage, du rendu et de la simulation, tout en maintenant la précision.
🌐 MeshAnything a de vastes applications dans divers domaines, répondant aux besoins créatifs de différents utilisateurs.
Lien détaillé :https://top.aibase.com/tool/meshanythingMeshAnything
9、Des neuroscientifiques de Harvard et Google DeepMind créent un cerveau artificiel dans un rat virtuel
Cet article présente une recherche révolutionnaire menée par des chercheurs de l'Université de Harvard et l'équipe Google DeepMind, utilisant la technologie de l'intelligence artificielle pour créer un « cerveau » artificiel pour un rat virtuel. Ils ont réussi à créer un modèle de rat 3D biomécaniquement réaliste, et ont utilisé l'algorithme d'apprentissage par renforcement profond de DeepMind pour entraîner un réseau neuronal artificiel cérébral, réalisant des effets de simulation dépassant la réalité. Cette innovation devrait apporter des progrès révolutionnaires aux domaines des neurosciences et de l'intelligence artificielle.
【AiBase en bref :】
🧠 Le rat virtuel possède un « cerveau » artificiel, capable de contrôler avec précision ses mouvements dans un environnement complexe.
🔬 Le réseau neuronal artificiel cérébral entraîné par l'algorithme DeepMind peut générer diverses trajectoires et forces de mouvement complexes.
🤖 De vastes perspectives d'application futures, susceptibles de créer un nouveau domaine de « neurosciences virtuelles », apportant de nouvelles stratégies pour le traitement des maladies du système nerveux.
10、McDonald's annonce la fin de sa collaboration avec IBM pour les commandes au volant IA
McDonald's annonce la fin de sa collaboration avec IBM pour les commandes au volant IA, et retirera la technologie testée dans plus de 100 restaurants avant le 26 juillet 2024. Bien que les raisons de la fin de la collaboration entre McDonald's et IBM ne soient pas claires pour le moment, la société a déclaré qu'elle testait si un chatbot de prise de commande vocale pouvait accélérer le service, et qu'elle était confiante dans les résultats des tests. Le secteur de la restauration aspire généralement à introduire la technologie IA pour améliorer l'efficacité.
【AiBase en bref :】
🍔 McDonald's mettra fin à sa collaboration avec IBM pour les commandes au volant IA, et retirera la technologie testée dans plus de 100 restaurants.
🤖 McDonald's teste un chatbot de prise de commande vocale pour accélérer le service.
🔮 Le secteur de la restauration aspire généralement à introduire la technologie IA pour améliorer l'efficacité.
11、Étude : il est difficile de distinguer les humains des conversations avec ChatGPT après cinq minutes