Bienvenue à la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités brûlantes du domaine de l'IA, en nous concentrant sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits d'IA.

Nouveaux produits IA Cliquez ici pour en savoir plus : https://top.aibase.com/

1. Le Bureau de radiodiffusion et de télévision national publie une « alerte de gestion » pour lutter contre le phénomène de « remaniement magique » de l'IA, des classiques du cinéma victimes de détournements

Le Bureau de radiodiffusion et de télévision national a publié une alerte de gestion concernant le phénomène des vidéos « remaniées » par l'IA, soulignant les mesures de gouvernance visant à protéger la culture classique. De nombreux films classiques ont récemment fait l'objet de parodies et de modifications, suscitant l'inquiétude du public quant à la préservation de la culture traditionnelle. Les autorités exigent que les bureaux provinciaux incitent les plateformes de vidéos courtes à supprimer ce contenu et à mettre en œuvre un contrôle des contenus générés par l'IA afin de prévenir les erreurs et les violations du droit d'auteur.

【AiBase résume :】

🚫 Le Bureau de radiodiffusion et de télévision national a publié une alerte pour lutter contre le phénomène des vidéos « remaniées » par l'IA et protéger la culture classique.

🎥 De nombreux films classiques ont été parodiés et modifiés, affectant la perception et les valeurs culturelles traditionnelles du public.

🔍 Les plateformes doivent contrôler strictement les contenus générés par l'IA pour éviter les erreurs et les violations du droit d'auteur.

2. Lancement de la version internationale d'Haier AI avec une fonction de clonage vocal IA ultra-performante

Haier AI a récemment lancé son module de clonage audio international. Les utilisateurs n'ont besoin que de 10 à 60 secondes d'échantillon audio pour reproduire parfaitement leur voix. Cette avancée technologique a suscité un vif intérêt dans le domaine du clonage vocal chinois, de nombreux utilisateurs étant surpris par l'excellent effet de clonage audio. Le système est non seulement simple à utiliser, mais il prend également en charge plusieurs langues et émotions, répondant ainsi aux besoins des utilisateurs.

【AiBase résume :】

🌟 Avec seulement 10 à 60 secondes d'audio, Haier AI peut reproduire parfaitement la voix de l'utilisateur, surmontant les obstacles du clonage vocal chinois.

🎤 Le système prend en charge 12 langues et permet aux utilisateurs de choisir différentes émotions pour enrichir l'expression vocale.

💻 La fonction audio d'Haier AI est actuellement gratuite, les utilisateurs peuvent facilement créer plusieurs modèles vocaux.

Lien détaillé : https://www.hailuo.ai/audio

3. Mise à jour de Runway Act One : intégrez de manière transparente votre performance et votre voix aux personnages vidéo

La dernière mise à jour de Runway Act One a révolutionné la création vidéo en permettant aux utilisateurs d'appliquer directement leur performance et leur voix à d'autres personnages vidéo, pour une synchronisation parfaite. Cette avancée technologique a non seulement abaissé le seuil de création, mais elle a également offert une flexibilité sans précédent à la création cinématographique, permettant aux créateurs de réaliser des essais et des transferts de performance à tout moment et en tout lieu.

【AiBase résume :】

🎭 Transfert de performance multidimensionnel : les mouvements, la voix et les expressions peuvent être intégrés de manière transparente à n'importe quel personnage.

📱 Essais pratiques : les acteurs peuvent filmer à tout moment avec leur téléphone portable et transférer facilement leur performance au personnage cible.

🖥️ Combinaison IA : en utilisant des outils comme Midjourney, les créateurs peuvent étendre les courtes vidéos en performances complètes.

Lien détaillé : https://top.aibase.com/tool/runway

4. OpenAI s'apprête à lancer le nouveau générateur vidéo Sora, prenant en charge plusieurs modes de génération

OpenAI a récemment annoncé lors de la conférence C21Media à Londres le lancement prochain d'une version mise à jour du générateur vidéo Sora. Cette version prendra en charge plusieurs modes de génération, notamment le texte, l'image et la vidéo, améliorant considérablement l'expérience de création vidéo des utilisateurs. La nouvelle version présente des améliorations significatives en termes d'efficacité et de vitesse. Sa sortie officielle est prévue pour la campagne promotionnelle d'hiver de décembre, et d'autres nouvelles fonctionnalités, telles que GPT-4.5, pourraient également être lancées.

【AiBase résume :】

🌟 La version mise à jour du générateur vidéo Sora prendra en charge la génération de vidéos à partir de texte, d'images et de vidéos, améliorant ainsi la flexibilité de la création.

🚀 Le nouveau générateur est considérablement plus rapide et plus efficace, améliorant l'expérience utilisateur.

📅 Sa sortie est prévue pour la campagne promotionnelle d'hiver de décembre, et d'autres nouvelles fonctionnalités, telles que GPT-4.5, pourraient également être lancées.

5. VISION XL, l'outil de réparation vidéo ultra-haute définition, transforme les vidéos floues en vidéos nettes en un clic

Avec les progrès technologiques, VISION XL, un outil de réparation vidéo et de sur-résolution, se distingue par ses performances exceptionnelles et sa facilité d'utilisation. Il peut non seulement réparer les parties manquantes des vidéos et supprimer le flou, mais aussi améliorer considérablement la netteté des vidéos, jusqu'à quatre fois la sur-résolution. Son architecture de traitement basée sur un modèle de diffusion latent réduit la dépendance aux modules de pré-entraînement supplémentaires, ce qui améliore considérablement l'efficacité du traitement des vidéos haute résolution.

image.png

【AiBase résume :】

✨ VISION XL peut réparer les parties manquantes des vidéos, supprimer le flou et améliorer la netteté, jusqu'à quatre fois la sur-résolution.

⚙️ Il utilise une architecture de traitement basée sur un modèle de diffusion latent, réduisant ainsi la dépendance aux modules de pré-entraînement supplémentaires et améliorant l'efficacité du traitement.

🚀 Il ne nécessite que 13 Go de mémoire vidéo pour traiter des vidéos de 25 images par seconde, le temps de traitement ne dépassant pas 2,5 minutes, ce qui convient aux applications rapides.

Lien détaillé : https://vision-xl.github.io/

6. Lancement d'Aurora, un générateur d'images, sur la plateforme de réseau social X de Musk

Le réseau social X d'Elon Musk a récemment lancé un nouveau générateur d'images, Aurora, conçu pour créer des images réalistes de qualité photographique. Bien que certains utilisateurs n'aient pas pu accéder à cette fonctionnalité peu de temps après son lancement, Aurora permet néanmoins aux utilisateurs de générer des images de personnages publics et protégés par le droit d'auteur, y compris Mickey Mouse, sans aucune restriction. L'outil excelle dans la génération d'images de natures mortes et de paysages, mais présente également quelques inconvénients, tels que la fusion non naturelle des objets dans l'image et l'absence de doigts sur les portraits.

image.png

【AiBase résume :】

🌟 Le nouveau générateur d'images Aurora est lancé, les utilisateurs peuvent générer divers types d'images.

🚫 Certains utilisateurs n'ont pas pu accéder à cette fonctionnalité dans les heures suivant son lancement.

💰 La plateforme sociale X ouvre la fonctionnalité Grok à tous les utilisateurs.

7. Le nouveau modèle Gemini-Exp-1206 de Google écrase ses concurrents et dépasse ChatGPT pour devenir le nouveau roi de l'IA

Le dernier modèle Gemini-Exp-1206 de Google a suscité un vif intérêt dans le domaine de l'IA générative. Avec un score de 1379, il a dépassé ChatGPT-4.0 (1366 points) au classement LMArena, démontrant ses capacités exceptionnelles. Bien que Gemini-Exp-1206 ait excellé dans plusieurs évaluations, il est toujours en retard sur ChatGPT-4.0 en termes de nombre de votes, ce qui souligne la fiabilité de ce dernier.

image.png

【AiBase résume :】

🌟 Gemini-Exp-1206 a obtenu 1379 points au classement LMArena, dépassant les 1366 points de ChatGPT-4.0.

🗳️ ChatGPT-4.0 a reçu 21 929 votes, nettement plus que les 5052 votes de Gemini-Exp-1206, ce qui souligne sa fiabilité.

🔍 Le modèle expérimental Gemini offre aux développeurs des opportunités d'expérience IA sans précédent, mais il est encore en phase de test et ne convient pas à une utilisation en production.

Lien détaillé : https://ai.google.dev/gemini-api/docs/models/experimental-models?hl=zh-cn

8. NegToMe redéfinit la génération d'images : réduction des risques liés aux droits d'auteur, amélioration de la diversité et des effets visuels

NegToMe est une technologie de génération d'images révolutionnaire qui utilise une méthode de guidage antagoniste pilotée par l'image pour surmonter les limites des invites négatives traditionnelles, améliorant considérablement la diversité et la qualité des images générées. En réduisant la similarité entre le contenu généré et les œuvres protégées par le droit d'auteur, elle résout les problèmes de protection des droits d'auteur et excelle également dans les applications interdomaines, offrant aux créateurs une plus grande liberté créative.

image.png

【AiBase résume :】

🎨 NegToMe, grâce à une méthode de guidage antagoniste pilotée par l'image, améliore considérablement la diversité des images générées, notamment en ce qui concerne le traitement des races et des genres.

🔒 Cette technologie réduit la similarité entre le contenu généré et les œuvres protégées par le droit d'auteur. Les tests montrent une réduction de la similarité de 34,57 %, résolvant efficacement les problèmes de protection des droits d'auteur.

⚙️ NegToMe est facile à intégrer, les développeurs n'ont besoin que de quelques lignes de code pour l'utiliser, le temps d'inférence n'étant pratiquement pas affecté, et il est compatible avec plusieurs modèles de diffusion.

Lien détaillé : https://github.com/1jsingh/negtome

9. X ouvre Grok AI à tous les utilisateurs : les utilisateurs ordinaires peuvent également générer des images gratuitement

xAI a récemment annoncé que son chatbot Grok était désormais accessible aux utilisateurs du monde entier, offrant une expérience IA à faible coût. Les utilisateurs de la version gratuite sont soumis à certaines restrictions, telles que le nombre d'images créées et de messages envoyés par jour. Cette initiative a non seulement incité davantage d'utilisateurs à découvrir la technologie de l'IA, mais elle reflète également la stratégie commerciale de xAI en matière de promotion de ses produits.

image.png

【AiBase résume :】

🖼️ Grok permet aux utilisateurs de créer ou d'analyser au maximum 3 images par jour.

💬 Les utilisateurs ne peuvent envoyer que 10 messages toutes les deux heures pour contrôler la fréquence d'utilisation.

📈 xAI attire les utilisateurs en ouvrant Grok gratuitement, et pourrait proposer davantage de fonctionnalités payantes à l'avenir.

10. Google Photos lance le récapitulatif photo annuel 2024 : génération intelligente par IA, pour immortaliser vos moments forts

Avec le développement des technologies numériques, Google Photos a lancé la fonction de récapitulatif photo annuel 2024, utilisant la technologie de l'IA pour offrir aux utilisateurs une expérience personnalisée. Grâce à Gemini AI, les utilisateurs peuvent obtenir des annotations photo générées intelligemment, revivre des moments importants et consulter les données de prise de vue. Bien que cette fonctionnalité offre aux utilisateurs la possibilité de partager de bons souvenirs, elle peut également rappeler des souvenirs désagréables.

【AiBase résume :】

🤖 La technologie IA génère des annotations photo personnalisées, soulignant les moments importants de l'année.

📊 Fournit des statistiques détaillées sur les données de prise de vue, facilitant le partage des indicateurs personnels.

😢 Peut rappeler des souvenirs désagréables, l'IA ne comprend pas encore parfaitement les besoins émotionnels des utilisateurs.

11. OpenAI décide de collaborer avec un entrepreneur militaire, les employés internes s'opposent !

La collaboration entre OpenAI et Anduril a suscité une forte réaction de la part des employés, dont beaucoup s'inquiètent de l'utilisation de la technologie à des fins militaires et demandent plus de transparence. Bien que la direction souligne que la collaboration se limite aux systèmes de défense, les employés doutent de cette limite.

【AiBase résume :】

🌐 La collaboration entre OpenAI et Anduril suscite l'inquiétude des employés quant à l'utilisation militaire de l'IA.

🛡️ La direction souligne que la collaboration se limite aux systèmes de défense, mais les employés doutent des limites de l'application de la technologie.